LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
12
返回列表 发新帖
楼主: telekroc

一个迷惑的简单问题:请问为什么多数人使用utf8编码?

[复制链接]
发表于 2007-12-29 22:22:03 | 显示全部楼层
用UNICODE是为了天下大同,一个码表网罗所有语言。否则GBK编码的文本拿到其他编码的系统上(比如BIG-5)别人看到的只是一堆乱码。
UTF-8只是UNICODE的一种编码方式,用UTF-8不用再费劲的去搞什么wchar_t这种新类型以及随之带来的N多改变了的字符串处理函数,原来所有字符串有关的操作都要重改。
回复 支持 反对

使用道具 举报

发表于 2007-12-29 22:22:45 | 显示全部楼层
UTF-8这种编码方式在0-127范围与ASCII码定义完全一致,str族的函数所认的控制字符都没有问题。
回复 支持 反对

使用道具 举报

发表于 2007-12-30 00:53:26 | 显示全部楼层
其实觉得Windows如果默认使用UTF-X编码的话,估计就没有这么多乱码的麻烦了
回复 支持 反对

使用道具 举报

发表于 2007-12-30 01:04:23 | 显示全部楼层
用GBK是个隐患,早晚会后悔的。个人偿过。
回复 支持 反对

使用道具 举报

发表于 2007-12-30 09:44:11 | 显示全部楼层
如果说GBK是M$的一个商业策略搞出来的,故意不与UTF兼容的,你会怎么想?

你会问:不是国标码吗?

你想想,我们的国标编码几乎都是统一的 gb+数字,怎么这个GBK不一样?

唉,历史遗留问题,你还是去google吧...
回复 支持 反对

使用道具 举报

发表于 2007-12-30 09:59:33 | 显示全部楼层
你试试"喆"能打出来吗?
不过GBK的字一般也还够用,如果不用UTF8的话最好用GB18030,GB18030的比GBK大些,一般的生僻字都有了(到CJK-EXTA)

另外在LaTeX中用UTF8也是因为自己的系统换成UTF8了,用GBK编辑就不方便了,自然就换成UTF8了。

换成UTF8我很大程度上是音乐标签的乱码问题。现在所有的mp3,flac都用UTF8的标签了。不再为乱码而头大了;)
Post by SDE;1801180
TeX 用 GBK 不也挺好么。。。
回复 支持 反对

使用道具 举报

发表于 2007-12-30 11:17:18 | 显示全部楼层
为了国际化 utf8还是很有必要的 当然一般人也就接触 en 和zh的 所以gbk gb2312 utf8 影响不大 但是想要在同一个地方显示 中文 日文 阿拉伯文 估计就有问题了
再说用了utf8 软件开发的维护成本也低了 国际化也更方便了
要说快慢我觉得基本上是无稽之谈 就算文本的容量大一倍就慢很多吗?
回复 支持 反对

使用道具 举报

发表于 2007-12-30 13:00:05 | 显示全部楼层
Post by joyfun;1801354
为了国际化 utf8还是很有必要的 当然一般人也就接触 en 和zh的 所以gbk gb2312 utf8 影响不大 但是想要在同一个地方显示 中文 日文 阿拉伯文 估计就有问题了
再说用了utf8 软件开发的维护成本也低了 国际化也更方便了
要说快慢我觉得基本上是无稽之谈 就算文本的容量大一倍就慢很多吗?


就算慢一些也值得;)
我现在连ftp都用utf8
回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-12-30 16:29:30 | 显示全部楼层
谢谢!打算用UTF8了。那么我读/windows下面的文件会出现乱码问题么?
比如,我在UTF8下对windows系统写文件,那么进入windows后会不会有乱码?
是不是要通过ftab进行设置就行了?
谢谢!
回复 支持 反对

使用道具 举报

发表于 2007-12-30 16:37:03 | 显示全部楼层
Post by telekroc;1801433
谢谢!打算用UTF8了。那么我读/windows下面的文件会出现乱码问题么?
比如,我在UTF8下对windows系统写文件,那么进入windows后会不会有乱码?
是不是要通过ftab进行设置就行了?
谢谢!
这个问题根本不用担心,这么多人用UTF-8编码,有时候也会读写Windows分区的,基本上是不会有什么问题的,我也只有一次是用konqueror去查看优盘上的内容时,把有些文件名弄成乱码了(我基本上都不用konqueror的,那次是给别人看,umount后出了问题).
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表