关于计算机字体字库2021-10-14

  字库是我们使用电脑显示汉字的图像源。计算机调用字库显示汉字。不是直接调用同一张图片,而是调用这个汉字的内码。程序使用这个内部代码在对应的图像源(字体库)中找到对应的图像信息,并绘制在屏幕上或打印在纸上。因此,只要是文本文件,当以二进制方式打开时,显示的是这些字的内码,而不是图形。

1634191941602256.jpg

  人们一般常用的都是PC机。操作环境一般使用的都是Windows操作系统。它的字库都存放在Windowsfonts目录下。打开这个目录就可以看到各式各样的字库。其中显示为汉字的(如“宋体”),就是中文字库。安装字库的时候,只要用鼠标点击浏览器的文件→安装新字体,就显示出一个文件操作界面。选中相关字库文件所在的目录,系统就会自动扫描字库文件,选中之后再点击“安装”,字库就会拷贝到Windowsfonts目录下了,这就算安装好了。如果你对文件所在位置比较熟悉,也可以直接将其拷贝到该目录下,之后,当你再启动应用软件(如Word、WPS等等)的时候,在选择字库的时就可以选用你安装的字库了。想删除字库,同样也是进入到该目录下,选中想要删除的字库,点击文件→删除就可以了,更为便捷的,使用鼠标右键,直接删除。

  字库的内部结构。用常见的字库程序(如:Font Creator)可以打开字库。字库打开之后可以发现,字库内的每一个字的图像都是由曲线环绕而成。曲线上有很多的小点点。当鼠标拖动这些控制点的时候,曲线会发生变化,字的图像也就改变了。如果就这样存盘,在使用这个字库的这个字的时候,就会和原来的不一样而和你修改后的样子相同。这就是字库的编辑,很简单,每一个人都会做的。

  这时你会发现,打开一个西方文字的字库,最多也不会超过256个字符图像。一般大致二十六个拉丁字母(因文字不同而小有区别)的大小写、数字、常用标点符号等等,一个人搞个一天两天,完全可以解决问题。而汉字的就大不相同了。最小的汉字字库也要6763个汉字。要想搞定一版汉字字库,显然不是一两个人一两年的事(一般需要3~5人/年)。它需要大量的人力和时间。所以说,汉字库不是太复杂,而是太繁琐,非专业人士难以涉足。

  现在全世界有文字的语言至少有几百种,它代表着全人类的文化。从前,当您发行一种文件(譬如报纸)或者软件,都需要使用当地语言的操作系统重新输入语言代码。由于代码不同,如果一种语言的文化想跟上世界发展水平,或者发展水平高的向水平低的普及的话,就很困难。所以人们发明了UNICODE,将全人类的文字统编到同一个编码系统当中。虽然各种语言文化系统使用不同的代码系统,但是使用UNICODE就可以使用同一个操作系统去识别不同的语言文字。

  LINUX、UNIX、WindowsNT、MAC等都使用UNICODE。由于不少文化历史地存在着互影响的,所以其语言也有着血缘关系,譬如中国大陆使用简体中文,台湾使用繁体中文。大陆和台湾有着血缘关系。简体中文中有一大部分是繁体中文中也使用的。怎样既区别又兼容这种现象呢?人们发明了以代码页命名的区别系统。譬如同属于中国文化圈的中国大陆、台湾、日本、韩国,日常使用的文字当中都有汉字,所以以936、950、932、949等四个代码页相互区别。

  汉字的使用当然还是以中国为核心,所以汉字文化圈叫做CJK系统(C指中国,J指日本,K指韩国)。中国大陆使用的简体中文叫做GBK(即:GB_13000)。其代码页和输入法在WindowsGBK.txt全部提供了,可以参考。台湾繁体字编码系统叫做BIG5(大5码)。GBK包含GB_2312和BIG5,共有20902个汉字。新出版的GB_18064,共有六万多个字符,字符代码又扩大了。