在计算机发展的初期,由于各个计算机系统都是相对独立诞生的,因此曾出现过多达数百种编码系统,但每种编码系统都不能包含全部的字符,并且系统相互之间并不兼容,给信息交换带来了麻烦和安全隐患。于是,很多国家都制定了计算机信息交换用的字符编码集,如美国的扩展ASCII码、中国的GB2312-80、日本的JIS等,作为相应国家信息处理的基础,起着统一编码的重要作用。
但随着Web的广泛应用,尤其是近年来支持多语言(如中、英、日)的应用已成为大势所趋。这些国家标准字符集编码也出现了范围重叠、相互间的信息交换比较困难的情况,造成软件各个本地化版本的维护成本较高,基于不同环境的程序编写越来越复杂。
Unicode有效解决了这些问题,它几乎包括所有的(超过十万个)语言字符。基于Unicode编码标准的信息和程序能够在不同平台和环境下高效地进行交换和运行,极大简化了应用的开发过程。为此,Windows早在90年代就已经将Unicode作为自身的编码标准,XML和Python、PERL、Mac OS和Linux等编程语言也都提供了对Unicode编码的支持。
目前,国内关于Unicode的书籍非常少,为了满足读者的迫切需求,清华大学出版社引进了这本由致力于Unicode编码系统研究、推广和应用的国际权威组织——The Unicode Consortium(Unicode协会)组织编写的经典图书。为了保持原书的系统性和规范性,尽可能为读者提供标准的第一手资料,我们对该书的中文版译本做了一些调整,主要体现在以下几个方面:
● 第1~6章是完整的中文译本。前5章主要是关于Unicode标准的基本概念、原理、一致性、字符属性和实现方法等内容,第6章主要是世界范围内使用的书写系统和标点的相关介绍。
● 第7~16章采用英文影印的方式,最大化地保留了原书的内容,但为了方便读者查找相关内容,我们加了中文导读信息。这部分主要是关于各种语言文字及符号的基本介绍,如拉丁字符、中东字符、南亚字符、东亚字符、新增的现代字符、各种符号、特殊区域和格式字符等基本信息。
● 第17章是完整的Unicode编码表,这部分内容按照不同字符块的分区,以表格的形式体现出来,以便于读者查阅。
● 第18章是汉字偏旁-笔画索引,因这部分内容是我们日常使用最广泛的信息,故完全采用中文译本。
● 附录A~F、术语表、参考文献、Unicode名称索引以及Unicode标准附件全部采用英文影印方式,以便于读者查阅最原始的资料、文献和技术标准。