字符编码详解
版本: 1.0
作者: crifan
邮箱: green-waste (at)163.com
PDF下载:
1. 字符编码详解 v1.0.pdf (937.93 KB)
内容简介
介绍了编码相关背景知识;
介绍了ASCII,EASCII,ISO/IEC 8859,Unicode,ISO 10646的解释;
添加了UTF-8和Unicode的区别和联系
关键字
字符编码,ASCII,ISO 8859,ISO 10646,UCS,Unicode,UTF-8
版本
版本 | 日期 | 内容更新 |
1.0 | 2011-11-02 | 添加了编码相关背景知识介绍 添加了ASCII和EASCII编码介绍 添加了ISO/IEC 8859相关的编码和各种单字节编码的关系 添加了Unicode和ISO 10646的解释 添加了UTF-8和Unicode的区别和联系 |
1 正文之前 5
1.1 目的 5
1.2 本文内容 5
1.3 声明 5
2 字符编码相关的背景知识 6
2.1 拉丁字母 6
2.2 什么是字符编码 6
3 字符编码标准 8
3.1 只支持基本的拉丁字符的字符编码:ASCII 8
3.1.1 ASCII的由来 8
3.1.2 ASCII编码规则 8
3.1.3 ISO 646 9
3.1.4 ASCII码表/编码字符表 9
3.2 支持多种衍生拉丁字母的字符编码:EASCII和ISO 8859 10
3.2.1 EASCII 11
3.2.2 ISO 8859 11
3.2.2.1 ISO/IEC 8859出现的背景 11
3.2.2.2 ISO/IEC 8859的编码规则 11
3.2.2.3 ISO/IEC 8859的特点 13
3.2.2.4 ISO/IEC 6429 14
3.2.2.5 ISO 8859和ISO-8859的区别和联系 14
3.2.2.5.1 原先的ISO 8859-1和我们常说的ISO 8859-1 15
3.3 各种单字节编码标准的关系 17
3.4 支持世界上几乎所有字符的字符编码:Unicode 17
3.4.1 Unicode和ISO 10646的关系 18
3.4.1.1 ISO 10646=UCS 18
3.4.1.2 Unicode 和ISO 10646的联系 18
3.4.1.3 Unicode和ISO 10646的区别 19
3.4.2 Unicode编码规则 20
3.4.3 Unicode字符编码所对应的存储和交换标准:UTF-8, UTF-16, UTF-32 21
3.4.3.1 UTF-8 21
3.4.3.2 Unicode与UTF-8之间的转换 22
3.4.3.2.1 关于UTF-8的BOM:“EF BB BF” 23
3.5 字符存储(交换)标准 24
3.6 字形和你所看到的字符的关系 25
4 引用 26
图表 1 ASCII编码表 10
图表 2 ISO/IEC 8859编码标准中的15种字符集 12
图表 3 ISO/IEC 8859的15个字符集的部分比较 13
图表 4 ISO/IEC 8859-1字符集表 16
图表 5 各种单字节编码标准之间的关系 17
图表 6 ISO/IEC 10646与Unicode的版本对应关系 19
图表 7 Unicode中的各种平面划分 20
图表 8 Unicode与UTF-8之间的编码映射关系 22
图表 9 Notepad中的各种编码 22
图表 10 字符(存储)交换标准 24
图表 11 汉字“宋”的不同字体 25
缩写
缩写 | 全称 | 含义 |
ASCII | American Standard Code for Information Interchange | 美国信息交换标准代码 |
BMP | Basic Multilingual Plane | 基本多文种平面 |
EBCDIC | Extended Binary Coded Decimal Interchange Code | 扩展二进制编码十进制交换码 |
IANA | Internet Assigned Numbers Authority | 互联网号码分配局 |
ISO/IEC | International Organization for Standardization / International Electrotechnical Commission | 国际标准化组织和国际电工委员会 |
UCS | Universal Character Set | 通用字符集 |
UTF | Unicode Transformation Format | Unicode转换格式 |
转载请注明:在路上 » 字符编码详解 v1.0