登录 免费注册 首页 | 行业黑名单 | 帮助
维库电子市场网
技术交流 | 电路欣赏 | 工控天地 | 数字广电 | 通信技术 | 电源技术 | 测控之家 | EMC技术 | ARM技术 | EDA技术 | PCB技术 | 嵌入式系统
驱动编程 | 集成电路 | 器件替换 | 模拟技术 | 新手园地 | 单 片 机 | DSP技术 | MCU技术 | IC 设计 | IC 产业 | CAN-bus/DeviceNe

求救:有否汉字内码与unicode的转换资料??

作者:fjh 栏目:通信技术
求救:有否汉字内码与unicode的转换资料??
或者是汉字区位码与unicode的转换资料也行,麻烦传给我一份 andy-99@tom.com 谢谢!小弟是想要用vb编一个汉字跟中文短信的转换小程序。

2楼: >>参与讨论
xiehongwei
放狗
 
3楼: >>参与讨论
1210
查表
 
4楼: >>参与讨论
12864
用VB?直接用函数就行了,windows编程下不用查表了
每个字符串函数后面加上w就是unicode编码的了。

?hex(ascw("啊"))  'unicode内码
554A

?hex(asc("啊"))   '一般内码
B0A1


5楼: >>参与讨论
guosr
如何制作GB与UNICODE装换表
    首先编一个程序,生成一个“GB.txt”文件,文件内容是(用16进制表示):2020 2021……202F 2120 2121……FFFF  当然其中不应包含空格,这里只是为了方便描述。知道GB2312的人肯定明白了,这个GB.txt实际上就是一张95x95的GB2312汉字表。
    然后启动微软写字板,打开GB.txt文件,另存为—UNICODE文本文件,取名为UCS.txt。
    再编写一个程序,将UCS.txt的前面两个字符删除后保存(我记得好像是FFFE,是UNICODE文本文件的文件头标志)。这样就得到你想要的转换表了。
    使用方法很简单,如果你想查找某个汉字的UNICODE编码,你首先计算该汉字的区位码(理解GB2312的人都知道,内码两个字节分别减去A0H……),得到该汉字的偏移量,然后到UCS.txt中利用这个偏移量就查找到了其UNICODE编码。
    很多人应该理解这个方法了吧,不理解的即使我说得在详细也没用。

背景简介:
    GB2312是中国制定的常用汉字的字符集编码规范,同时也是新加坡的国家标准,收录汉字6K多,还有常用符号、各语种字母等;后来还制定了其他的字符集,除了GB2312的字符之外,还收录了非常用字、繁体字等。
    UNICODE编码是ISO制定的,试图收集当前人类使用的所有书写符号,也就是想制定适用于全球的字符编码标准,主要包含中文汉字、韩国文字符号、日文符号、希腊、拉丁、俄语、英语、阿拉伯语等符号。采用16bit编码,目前已经编码3万个符号,其中80%以上是汉字。其中的汉字编码基本上以中国的国标为基础。
   这两者之间不存在线性映射关系,因此无法使用一个简单的公式相互查找。通过GB查找UNICODE比较容易,而反过来通过UNICODE查找GB,就很困难了,GB只有不到1万个符号,因此一个任意的UNICODE字符还不一定能有对应的GB字符,即使有,查表工作量也相当大。
    

参与讨论
昵称:
讨论内容:
 
 
相关帖子
关于直流电力线传递信号方面的问题!
手机内部的芯片是什么样的单片机?用什么软件开发的?
请各位高手给推荐几款语音压缩编码的芯片
请教陷幅二极管型号!!急啊!
bootrom 问题请教
免费注册为维库电子开发网会员,参与电子工程师社区讨论,点此进入


Copyright © 1998-2006 www.dzsc.com 浙ICP证030469号