计算机三级考试PC技术知识要点辅导(3)_第2页

考试站(www.examzz.com)   【考试站:中国教育考试第一门户】   2011年11月10日

  (三)通用编码字符集(UCS)与Unicode

  1.通用编码字符集(UCS)

  ISO/IEC10646,即“通用编码字符集”(Universal Coded Character Set,即UCS),及等同采用该国际标准的中国国家标准GB13000的设计目标,就是实现所有字符在同一字符集中等长编码、同等使用的真正多文种信息处理。UCS规定了全世界现代书面语言文字所使用的所有字符的标准编码。

  2.Unicode

  通用编码字符集是一个由各种大小字符集组成的编码体系。能容纳足够多的各种字符集,四字节的编码(UCS-4)可以安排13亿个字符。

  但是,四字节的字符编码太浪费存储空间了,它也给处理和传输带来了很大不便。因此,在UCS编码空间中把00组的00平面称为基本多文种平面(Basic Multilingual Plane,BMP),并规定,当组编码、平面编码均为00H时可以省略,因此安排在基本多文种平面上的字符只需要使用两个字节来表示,这就形成了一个双字节编码的字符集,它是UCS的子集,记做UCS-2,又称做Unicode(统一码,或联合码)。

  3.中日韩统一汉字编码字符集(CJK编码)

  UCS(Unicode)中的表意文字部分采用的是中日韩统一汉字编码(称为CJK编码)。所谓汉字的统一编码是指,不论国家和地区,不论汉字的字义有无区别,只要字形相同,该汉字就只有一个代码。

  4.GB18030-2000编码

  GB18030-2000编码标准在原来的GB2312-1980编码标准和GBK编码标准的基础上进行了扩充,增加了四字节部分的编码。它可以完全映射国际标准ISO10646(UCS)的基本平面和所有辅助平面,共有160多万个码位。

  (四)文本

  1.简单文本(纯文本)

  最简单的文本除了可显示/打印的ASCII字符(汉字)及“回车”、“换行”、“制表”等用于格式控制的有限几个ASCII字符之外,几乎不包含任何其他信息。这种文本常常称为纯文本或ASII文本,文件的后缀名是.txt。

  2.丰富格式文本

  为了使文本能以整齐、醒目、美观、大方的形式展现给用户阅读,人们需要对纯文本进行必要的加工,这个过程称为文本的格式化,或者称为排版。经过上述处理后的文本一般称为“丰富格式文本”(Rich Text Format)。由于属性标志和控制命令并不统一,因此不同的文本处理软件得到的丰富格式文本互不兼容。为了便于不同的丰富格式文本能在不同的软件和系统中互相交换使用,特地提出了一种中间格式,称为RTF格式,所有在PC机上流行的文字处理软件,都可以输入和输出RTF文件,从而达到了文件交换的目的。

  超文本(Hypertext)采用一种网状结构(非线性结构)来组织信息。采用这种网状结构,各信息块很容易按照其内容的关系加以组织。它由若干文本块(或其他信息)组成,这些文本块可以是计算机的一个文件或文件的一部分,它们称为“节点”。每个节点都有若干指向其他节点或从其他节点指向该节点的指针,这些指针称为“链”。每个链连接着两个节点,它是有向的,从一个节点(称之为源节点)指向另一个节点(称之为目的节点。链的数量与节点的内容有关,有些节点与其他节点有许多关联,因此它就有许多链;有些节点没有启程链,只能作为目的节点。

相关文章