|
发表于 2005-9-23 14:16:29
|
显示全部楼层
是的,这是以字为单位转换的缺点。如果你有兴趣可以帮忙实现一个智能化的以词句为单位的简繁转换模块,我很乐意把这个模块集成到SCIM中。
Post by earlzhang
小弟猜测在启动SC-TC或者TC-SC之后,这个转换过程应该是以字为单位的吧?
从繁体转换到简体,以字为单位没有问题,因为这是顺应简化字产生过程
但是在简体转换到繁体的时候,以字为单位就会出现问题了。
由于当时简化的时候,有部分简化是将几个不同的字合为一个,而它们的繁体字写法是各不相同的。
比如简体字里面的“后来”和“皇后”,到了繁体就是“後?怼焙汀盎屎蟆薄!巴贩ⅰ焙汀胺⒄埂钡搅朔碧寰褪恰邦^髮“和”發展“,而使用现在基于字为单位的简繁转换,就全部变成“後?怼昂汀被梳帷埃鳖^發“和”發展“了。
不知道作者在今后是否能就简繁过滤器进行一些改进,增加以词为单位的转换,这样对于上述的问题就能比较好的解决了。而且利用以词为单位的转换,还能应付一些大陆和香港以及台湾不同的说法,比如“软件”和“軟體“ |
|