|
发表于 2004-3-20 20:03:47
|
显示全部楼层
最初由 james_su 发表
没这么简单。UTF-8/UCS-4 还是非常不错的。这点空间浪费对现在的存储器来说根本不算什么。
空间浪费只是其中一个方面,我说的U8方式除了没有UTF-8这么高的可靠性之外,可以代替UTF-8,也可以使用U8/UCS-4甚至U8/UCS-8(假如有的话)。
另一个方面是编码空间问题,UTF-8的空间为
1111110x 111110xx 11110xxx 1110xxxx 110xxxxx 10xxxxxx=2097152
加上0xxxxxxx=128
我应该没算错吧!UCS-4的空间为2power32=4294967296。我如果没理解错的话,UTF-8根本就表示不了USC-4! 而U8没有字节数的限制,5个字节完全覆盖USC-4。 |
|