LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
12
返回列表 发新帖
楼主: m_sunhe

LC_CTYPE=zh_CN后,某些应用程序无法识别中文文件名?(解决)

[复制链接]
发表于 2007-5-14 22:19:38 | 显示全部楼层
Post by zhllg
此话何解??
据说是这样的:

1,GB2312是很老的东西了,早就发现不够用了。
2,94年(还是之前)国家推出了建议性标准gb18000(还是13000我忘了),这个标准其实就是utf-8标准(除了名字,完全一样),同时也建议微软公司采纳。--(据说是1993年,GB13000,应该是ISO10646)
3,微软借口说gb18000还不成熟,为了取得中国市场的垄断地位,自己搞了一套汉字标准,于是它就随着win95和office之类的流行起来了,国家看生米已经煮成了熟饭,只好把这套标准定为国标GBK标准。--(其实只是指导性标准,并非强制性,GB18030是强制性标准)
4,微软到了99年(前后吧),又说GBK已经落伍了,现在流行utf-8标准,准备全盘转换成utf-8,这些把有关部门惹怒了。NND,当年我们推utf-8你说不成熟,自己搞了一套,现在赚得盆满钵满了又自己说要推utf-8了,你丫微软分明就没把政府放在眼里。
5,于是政府怒了,强制推行gb18030标准(这个标准前面兼容GBK,其他码位兼容utf-8),算是过渡标准吧。要求微软强制执行,否则产品不得在大陆买。于是基本搞死了微软的WindowsMe,差点搞死了Office2000(据说发行前几个月,微软除了改字符编码就没干其他什么事情)--(确实, WinMe是我认为的最差的Windows版本,而office2k也是前不着村,后不着店,前后兼容性都差)
6,由于以上历史原因,现在就是GB2312,GBK,GB18030,UTF-8并存了。
7,如果不是万恶的微软和笨蛋无能的政府,我们早就用上UTF-8了
回复 支持 反对

使用道具 举报

发表于 2007-5-15 12:23:56 | 显示全部楼层
^_^   

同感!
这么多规范,真麻烦!
回复 支持 反对

使用道具 举报

发表于 2007-5-16 21:30:07 | 显示全部楼层
没觉得UTF-8哪点好了。绝大多数汉字在UTF-8编码下是三个字节(或更多字节);而GB18030下绝大多数情况下是双字节(很不常用的是四字节);UTF-16下英文作了牺牲,和汉字一样是双字节,缺点是留给汉字的编码空间少了一点;但如果用UTF-32显然是费了一点。

所以比较好的方案就是windows现在用的:国际间交换的用UTF-16(微软用的little endian方式,UNICODE应用程序),中国国内用GB18030。

UTF-8是对C程序员方便,不用对原有的单字节字符程序进行大的改造。对于UNIX/Linux这样的老系统显然做大手术不现实,浪费空间来换取可用性就成了一种折中的方案。

如果所有的中文网页全部都从GB18303/GBK/GB2312转成UTF-8,需要增加50%的存储空间占用。不但浪费硬盘空间,同时还占用了原来150%的带宽。

Post by nainaide
据说是这样的:

7,如果不是万恶的微软和笨蛋无能的政府,我们早就用上UTF-8了
回复 支持 反对

使用道具 举报

发表于 2007-5-17 00:19:12 | 显示全部楼层
楼上的难道不知道 gzip吗 网站可以用 mod-gzip来提速 大部分网站都支持

使用LC_CTYPE=zh_CN.utf8时,fcitx的配置文件中的中文是乱的。但应用程序工作都正常

使用
  1. env LC_CTYPE=zh_CN.GBK fcitx
复制代码

fcitx 就没乱码了
回复 支持 反对

使用道具 举报

发表于 2007-5-17 02:12:40 | 显示全部楼层
Post by 没本
没觉得UTF-8哪点好了。绝大多数汉字在UTF-8编码下是三个字节(或更多字节);而GB18030下绝大多数情况下是双字节(很不常用的是四字节);UTF-16下英文作了牺牲,和汉字一样是双字节,缺点是留给汉字的编码空间少了一点;但如果用UTF-32显然是费了一点。

所以比较好的方案就是windows现在用的:国际间交换的用UTF-16(微软用的little endian方式,UNICODE应用程序),中国国内用GB18030。

UTF-8是对C程序员方便,不用对原有的单字节字符程序进行大的改造。对于UNIX/Linux这样的老系统显然做大手术不现实,浪费空间来换取可用性就成了一种折中的方案。

如果所有的中文网页全部都从GB18303/GBK/GB2312转成UTF-8,需要增加50%的存储空间占用。不但浪费硬盘空间,同时还占用了原来150%的带宽。

不懂,不过UTF 8 不错的说,不能把自己限定在只和国人交流,如果和外国人交流的话,还要弄个什么转换,自己给自己找麻烦。呵呵。
个人意见。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表