首页 | 编程语言 | 网站建设 | 游戏天堂 | 冲浪宝典 | 网络安全 | 操作系统 | 软件时空 | 硬件指南 | 病毒相关 | IT 认证
软讯网络 > 编程语言 > C/C++ > UTF-8的编码方式
【标  题】:UTF-8的编码方式
【关键字】:UTF-8
【来  源】:http://blog.csdn.net/tianqibucuo/archive/2006/06/13/795151.aspx

UTF-8的编码方式

UTF编码

 

UTF-8就是以8位为单元对UCS进行编码。从UCS-2到UTF-8的编码方式如下:

UCS-2编码(16进制) UTF-8 字节流(二进制)
0000 - 007F 0xxxxxxx
0080 - 07FF 110xxxxx 10xxxxxx
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx

例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以肯定要用3字节模板了:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 110001 001001, 用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。

UTF-16以16位为单元对UCS进行编码。对于小于0x10000的UCS码,UTF-16编码就等于UCS码对应的16位无符号整数。对于不小于0x10000的UCS码,定义了一个算法。不过由于实际使用的UCS2,或者UCS4的BMP必然小于0x10000,所以就目前而言,可以认为UTF-16和UCS-2基本相同。

对1000000个数进行排序找出10个最大的数---后记1:【上一篇】
向量,点,空间,变换(映射):【下一篇】
【相关文章】
  • 在ASP中自动检测文件的编码格式,支持UTF-8、GB2312、UTF-7、Unicode、Unicode Swap等格式的检测
  • PHP对GB编码动态转UTF-8编码的几种方法评测
  • 下面函数是将汉字转换为utf-8编码,已经过测试无误!
  • UTF-8 - > GB2312编码 提取HTML代码中文字的C#函数
  • Java 的乱码解决方法 统一编码 我这里使用UTF-8编码
  • UTF-8与UNICODE的关系及代码转换
  • 最近估计是和utf-8干上了,今天又搞定一个ajax的编码问题
  • 关于workshop(原nitrox m7)的utf-8中文乱码问题解决
  • 推荐一个UTF-8或者Unicode编辑的免费软件
  • UTF-8, a transformation format of ISO 10646
  • 【随机文章】
  • PhotoImpact 6.0如何让网页上图片背景变为透明(1)
  • HTML標籤解析程序
  • 开博
  • 在PHP中利用XML技术构造远程服务(上)
  • 全国计算机等级考试三级数据库管理考试大纲
  • checkbox分级操作(不同名)
  • RevilloC MailServer 1.x "USER" Command Handling R
  • 桌面中心(四) 数据显示   
  • sun disk suite 磁盘镜像和镜像恢复详细文档
  • 多线程流媒体文件下载三剑客
  • 【相关评论】
    没有相关评论
    【发表评论】
    姓名:
    邮件:
    随机码*
    评论*
          
    |  首 页  |  版权声明  |  联系我们   |  网站地图  |
    CopyRight © 2004-2007 软讯网络 All Rigths Reserved.