揭秘首批中文电脑字体诞生过程,将汉字「搬」进数码设备有多难?

新的电子设备开机时,屏幕映出的首个交互页面,往往是系统语言选择。

你可以上下滑动,选择中文、英文、日文等多达上百种的文字。但如果将时间拨回 40 多年前,这一选项可能只有寥寥几种,而且没有中文。

我国文字的历史源远流长,但其数字化的历程却并不久远。我们现在之所以能在电子设备上阅读中文,离不开最初花费巨大力气,将中文「搬」至电脑上的那一群人。

最近,斯坦福大学获得了 2500 余件现代中国信息技术收藏品,包括几十台珍稀的中文打字机、文字处理器和电脑等物品,堪称世界上最大的中国现代 IT 历史合集。

▲首批中文数字字体模型. 图片来自:斯坦福大学

该校一位研究中国历史的教授托马斯·穆拉尼(Thomas Mullaney),在这些珍贵的藏品里发现了许多有趣的故事。其中就包括全球首批中文数字字体,是如何被制作出来的。

托马斯将这段艰辛但充满艺术的历程,在《麻省理工科技评论》上讲述了出来。我们也得以机会看见这个具有时代意义的历史片段。

▲托马斯·穆拉尼

一台机器带来的契机

故事要从一个订单开始说起。

20 世纪 80 年代初,美国图形艺术研究基金会 (Graphics Arts Research Foundation) 找到了路易斯·罗森布鲁姆(Louis Rosenblum),想请他的团队,为其正在开发的机器 Sinotype III 创建出中文字体。

当时路易斯已年近 6 旬,毕业于麻省理工学院的他,是一名资深的印刷、排版专家。路易斯在 1965 年创立了 Photography Systems 公司,专门解决数字工程、摄影、应用数学等相关问题。

▲路易斯·罗森布鲁姆

虽然路易斯及其团队此前和图形艺术研究基金会有过多次合作,但这次为 Sinotype III 创建中文字体的项目,却是最棘手的。

因为当时中国还没开始生产个人电脑,其他国家或地区生产的电脑无法处理中文。所以在给 Sinotype III 这台实验性机器开发中文字体前,路易斯的团队需要先对苹果二代电脑(Apple II)编程,使其能够以中文运行。

万事开头难。由于苹果二代的 DOS 3.3 操作系统,无法输入和输出汉字文本,所以必须得从头编程,包括编写一个中文文字处理器。为此,其团队花费了几个月的功夫。

他们想出的解决方案,是先通过 BASIC 编程语言,编写一个「Gridmater」程序,然后将该程序放入苹果二代电脑的软盘上运行。如此一来,便能创建并保存汉字的数字位图了。

接着,将设计好的汉字位图及其相应的代码,植入到系统数据库,便可让 Sinotype III 机器处理并显示中文了。

▲Sinotype III 显示器的照片,显示了 Gridmaster 程序和汉字「电」. 图片来自:斯坦福大学

这里插入一个背景知识。早期的数字字体,均采用位图图像(也称点阵图像)来显示。

这是一种常见的储存图像的方式,我们今天相机拍摄的照片、截图,储存方式均属于位图。一张 JPEG、BMP、GIF 等格式的图片,是由很多像素点组成,这些点经过排列和染色,便构成了图样。

比如我们可以在电脑上将一张图片放大,放大至一定程度,便可看到正方形的像素点了。早期的字体便是在一定大小的网格内,通过排列和染色形成的。

▲ 将左图的眼睛部位放大,便可看到像素点了

中文数字字体,可比英文难做多了

中文数字字体之所以难做,首要原因就是汉字的数量实在太多了,其次是因为汉字的字形十分复杂多样。

在计算机问世之初,工程师和设计师约定采用大小为 5X7 的位图网格,来创建低分辨率的英文数字字体。如此一来,每个字符的大小约 5 个字节,计算机的内存不会有太多负担。

在美国信息交换标准代码(ASCII)中储存的所有 128 个低分辨率字符,包括英文字母表中的每个字母、数字 0 到 9,以及常见的标点符号,共计需要 640 字节的内存。而当时苹果二代的内存为 64KB,可以轻松承载英文字体库。

▲ASCII 字符表

而中文由于字形复杂,在 5X7 大小的网格中会糊作一团,难以辨认。因此至少需要一个 16X16 或者更大的网格。

这样换算下来,每个中文字符的大小至少有 32 字节。如果将 70000 个低分辨率的汉字打包,内存至少需要 2MB。再退一步,即便字库内只放进 8000 个常用的汉字,也需要约 256KB 的内存。

这无疑是一个大难题。因为在上世纪 80 年代初,大多数 PC 的总内存容量不超过 64KB,根本装不下庞大的中文位图字库。

▲Sinotype III 显示器的照片,显示了中文字体. 图片来自:斯坦福大学

内存告急并不是最令人头疼的,因为这可以随着 PC 软硬件的进步得以解决。如何在 16X16 的低分辨率网格中,创造出既容易辨认又美观的中文字体,是更棘手的难题。

为此,路易斯团队的设计师们花了数年时间,尝试创造出满足低内存要求,且清晰易认,甚至有书法美感的中文位图。其中,凌焕铭(Huan-Ming Ling)和艾伦迪乔瓦尼(Ellen Di Giovanni)的贡献最为突出。

他们先是借助纸、笔、修正液来手绘出汉字的位图,然后借助上文提到的 Gridmater 程序将其数字化,植入到 Sinotype III 的系统中。

▲Sinotype III 显示的中文字体. 图片来自:Courtesy of Bruce Rosenblum

制作背后的匠人精神

托马斯教授在档案资料里,发现了路易斯团队设计汉字位图的全过程。在一个装满格子图的册子中,记录了设计师们是如何通过手绘散点符号来创造汉字位图的。

我们都知道,汉字的笔画并非「横平竖直」的,入口笔画、出口笔画、笔画渐变都有着丰富的细节。这也是设计师们面临的核心问题,即如何在 16X16 的方格中,尽可能将这种书法美展现出来。

在这本格子册中,可以发现每个汉字都经过设计师精心绘制。绿色的「X」是最初的标记,交由汉字编辑审核后,如果哪里不够规范,路易斯及其团队便会用修正液盖住原本的标记,再用红色的「X」标记上去。

▲「背」字的位图草稿. 图片来自:斯坦福大学

经历反复修改,经过最终确认的位图,才会输入至系统中。

如果要满足消费者的需求,字库里至少要包含 3000 个常用的汉字。这个工程量对于团队来说是很大的。人们可能会猜测,他们是否会寻找一些讨巧的方法。

例如,对于相同偏旁部首的汉字,可以直接将偏旁部首复制过去。就像下图中「评」、「读」都是言字旁,按理说设计师只需要设计右侧不一样的部分就可以。

▲中文位图草稿. 图片来自:斯坦福大学

但是托马斯教授发现档案里类似的工作机制很少。路易斯坚持要求设计师逐字调整、设计,以确保每个字的偏旁部首看起来是协调的。即便有些改动十分细微,令人难以察觉。

托马斯教授按照档案资料重新复现了 Sinotype III 的中文字体。可以发现同样为「女」字旁的「娟」和「娩」,两个字的「女」字旁的设计样式并不一样。

▲可以看出「女」字旁的不同吗? 图片来自:斯坦福大学

「女」字旁在「娟」字中的宽度为 6 个像素(网格),而在「娩」字中只有 5 个像素。另外「娩」字的「女」字旁撇点和撇的笔画,要比「娟」多一个像素,视觉上更加修长。

这样一丝不苟的设计并非个例。托马斯教授在字体库里发现了大量类似的工作,当他将位图的草稿与最终成品放在一起对比时,还能看到许多细微、有趣的变化。

比如在「罗」字中,左下角的笔画最初是以 45°向下伸展的。但最终版本,笔画的尽头被「拉平」,更符合书法的艺术感。

▲「罗」字的两个版本,左为最终版. 图片来自:斯坦福大学

可以看出,添加或缩减一个像素,便会对整体的平衡感、美感造成影响。这也体现出设计师们在创作首批字体的艰辛,以及背后的匠人精神。

实际上,16X16 的网格,对于创作中文字体并不是很友好。最主要的问题是对称性。

我们知道,大量的汉字是具有对称性的,而根据数学的规则,只有奇数大小的空间区域,才能创建出完全对称的形体。

因此,路易斯及其团队决定只利用 16X16 网格中的 15X15 区域,来实现汉字的对称。这进一步缩小了设计师的空间,对设计工作提出了更高的要求。

▲ 山、中、田的对称与非对称. 图片来自:斯坦福大学

得益于团队孜孜不倦的努力和一丝不苟的态度,Sinotype III 的中文字体库项目顺利完成。尽管它并未商业发布,但它的确是世界上最早能处理、显示、输入输出中文的 PC 之一。

当然,路易斯及其团队制作字体的方法,在当今的技术语境下看起来似乎太过古板和幼稚。现在广泛使用的 TrueType 字体技术,能够以矢量方式存储字体,占用空间小、渲染快、显示效果清晰锐利。

▲如今多数字体均是 TrueType 格式. 图片来自:themex

但正是他们使用「笨方法」,逐字画稿、反复修改,才让汉字得以进入数字世界。而「当代毕昇」王选院士主持研制的高分辨率字形信息压缩技术,更是彻底地解决了汉字编码储存的困境。

在这些前辈们的努力下,中文才没有被互联网大潮落下,汉语拉丁化的理论被扫进历史垃圾堆。我们今天能够使用中文在互联网上冲浪,应感谢他们曾为此付出的青春。

掌握汉字风格!激活字体最大魅力

(此处已添加圈子卡片,请到今日头条客户端查看)

字体的设计是对文字外形的一种设计,字体就跟图形一样,可以通过改变细节来改变本身的风格,同时也能够给人们带来美观的视觉感受。

在字体设计中,也应该注重研究字体设计的情感表现,准确地把握受众的心理感受,使其能够准确的传递信息,发挥字体设计的最大魅力。

男性化风格

此类字体具有力量、稳重、刚强、硬朗、大方等特点,所以在设计男性化风格字体的时候要注意笔画简洁干练、硬朗、多选较粗的笔画来设计。字体整体应该给人一种大方理性的视觉效果,字体编组要统一、规整。

设计这类字体的时候应当注意,不要一味的过度使用粗黑的笔画,这样反而会让字体看起来呆板且不够生动,应该在笔画的细节上和组字间距等方面来调节字体。

女性化气质

女性是优雅、细腻、柔美、感性的代名词。女性化气质,更是让人联想到婀娜多姿的身段,柔顺飘逸的长发、回眸笑的甜美、高贵典雅的风姿。所以具有女性化气质的字体设计在笔画上不能粗黑坚硬,较为纤细为佳。

另外可以多使用曲线设计来增添笔画上的节奏感,表现出女性的可爱、活泼。也可以少量运用一些装饰来点缀字体,但不宜复杂。设计这样的字体更加需要在细节上进行斟酌,笔画不能太细,不能太柔,这些处理不当都会影响到字体的视觉感受。

可爱潮流风格

可爱潮流的字体拥有活泼、天真的特性,这样的字体应该多使用曲线、弧线,笔画的粗细可以随意变化,胖胖圆圆笔画的字体能够给人一种亲和力,多用于儿童、少女为主题的设计中,而较细的字体能够给人一种活力、跳动的视觉感受。

可爱潮流风格的文字不能死板,没有变化,否则很难突出它的特性。要合理的把握好力度,否则字体会让人觉得太花哨而缺乏信赖感。

沧桑风格

这样的字体注重的是字体中的肌理,会运用一些怀旧、破损手工磨损的一些处理方式来增添字体的效果。在笔画上一般使用粗壮有力的较多,这样的字体应用很广泛,在平面设计中可以很好地提升整个设计的效果。

随意休闲风

随意休闲的字体适用于多种场合,是深受人们喜爱的一种字体。随意休闲的字体打破了常规,可以根据界面的风格来设计字体的样式,可采用手写的方式,更好掌握字体的笔画。

科技数码型

科技数码的字体能够给人一种时尚的感受,随着科技的高速发展,数码科技像素感的形象早已深入人心。在关于科技数码主题的海报广告中,会见到这样风格的字体。此类字体笔画十分硬朗、锋锐,整体充满力量感。

简洁时尚型

简洁的字体设计具有强烈的现代感,是现代常见的字体设计风格。设计时多将复杂的笔画归纳,用简单的几何线条来勾勒轮廓,能够做到字体之间的整体性与统一性。

隽秀高雅风

隽秀高雅风格的文字在字体设计中较难把握,要求对文字字形和内涵有较高的理解和认知能力。设计师要综合宋体、黑体等字体的精华,以便更好的设计出隽秀高雅的文字。

汉字基本结构规律

汉字的结构如同建筑一样,同样有均衡、对称、和谐、节奏的变化,也像平面构成中的点、线、面的组合,存在着力的呼应和对比。汉字只有按照一定的规律和视觉心理构成完美的整体时,才能产生优美和谐及富有艺术感染力的字体。

上紧下宽

人的眼睛有时候会产生视错觉,实际上视觉中心比绝对中心要高出一些,在字体设计中,这种视错觉随处可见。因此要把中心定在视觉中心上,使字的上半部分紧凑一些,下半部分宽畅一些,这样才符合审美心理的需要。

横细竖粗

在汉字中横画多于竖画,在视觉上同宽度的横线比竖线看起来粗些。因此在书写上就形成横细竖粗。最明显的是宋体,横画与竖画差距很大;黑体笔画横竖笔画一致,实际上横画要比竖画稍微细一点。实际汉字设计中也要注意横细竖粗的构字规律。

主次分明

汉字的基本笔画是从书法的永字八法中延伸出的,包括横、竖、点、摘、捺、挑、勾等,是创造优美字体的基础。在汉字中,起支撑作用的叫主笔画,不起支撑作用的副笔画。一般来说,横竖笔就像建筑中的梁柱。点、摘、捺、挑、勾是建筑中的门、窗等。前者占主要地位,后者占次要地位。

在字体设计中,一般要先写出主笔画,再写副笔画,这样有利于字体结构的安排。另外,主笔画的变化比较少,而副笔画变化灵活,可以以此调节空间使字体结构紧凑。

穿插呼应

汉字中除了和部分是不能分割的单形字体以外,其他结构都是由各种基本笔画组成的部首,再以部首结合成的组合结构。可以分为七种:

上下结构:牟、季、李、男

上中下结构:曼、章、莫、鼻

左右结构:辣、棵、颇、使

左中右结构:树、游、衔、湖

上下左右结构:华、覆、唱、活

里外(全包围或半包围)结构:困、同、区、司

穿插结构:多、少、会、有

汉字要写得美观得当,不能只注意笔形的优美,结构间架也同样重要,要仔细研究汉字结构的比例和分割,进行恰当组合。在组合的时候,各部分的部首也不是等分的,而是要根据部首的大小、长短进行调整。

均衡稳定

在设计字体时,一般要先打好格子,定好字距和行距,然后在格子内绘写,以使字体看起来大小一致、整齐稳定。但是当我们把每个字都写满了格,却发现文字还是大大小小、高高低低,这是因为字的实际整齐统一并不等于视觉上的整齐统一,所以就要求利用视错觉现象来解决大小、黑白、重心三方面问题。

①大小。指的是字形面积的大小,不同的外形可以产生很大差别。在调整大小时,要注意保持汉字的某些基本特征,不能强求放入方形。

②黑白。汉字笔画多了显黑,笔画少显亮。一般来说,字的线条越多越显黑,线的距离越近越显黑,线的交叉越多越显黑。针对这些情况,可以做如下调整:少笔粗,多笔细;疏粗密细;笔画交叉处要细;主笔粗,副笔细,外档粗,里档细;所有笔画减细。

③重心。字体和人一样,也有重心问题。如果处理不当,会产生左斜右倒、忽高忽低的现象。汉字每个部首都有一个中心,处理不妥,就会上下歪斜、左右不平。在字体设计中应把中心摆得左右平衡、上下竖直,才能使整行整幅的字整齐统一、均匀稳定。

相关问答

oppo怎么设置数码字体?

要设置数码字体,首先打开oppo手机的设置应用程序,并找到“显示与亮度”选项。在该选项中,您将看到“字体大小和样式”选项。点击它,然后选择“数字字体”选...

【数学中数码是什么】作业帮

[最佳回答]1.表示数目的文字或号码.2.数目;数量.实在对不起,不知对不对,

数字字体怎么打?

1、首先把键盘打出来。2、然后点击123。3、直接点击数字即可打出来。1、首先把键盘打出来。2、然后点击123。3、直接点击数字即可打出来。手机安装微商输入法...

用4号半角白体阿拉伯数码标识怎么解释?

4号:是字体,半角:是汉字的输入形式,有全角和半之分,在输入法里可以设置白体:一种字体。数码:就是数字4号:是字体,半角:是汉字的输入形式,有全角和半之分,...

数码相片上的日期是什么颜色的字体-懂得

一般都是橘红色或者红色的红色黑体或者黄色黑体黄色的也有

魅族手机怎么修改字体颜色-ZOL问答

数码相机主板显卡平板电脑更多举报手机魅族6人讨论9686次围观关注问题写回答讨论回答(6)yuan199302287331魅族手机字体颜色是无法设置的。Flyme...

中文文档数码表示格式都有哪些?

文件的格式有:1、TXT格式:txt是微软在操作系统上附带的一种文本格式,是最常见的一种文件格式,早在DOS时代应用就很多,主要存文本信息,即为文字信息,现在...

数码相机拍摄的文字能够转化为word吗?-yiR9RlO2Pjj的回答...

OCR完毕,点击其中的发送至Word即可。该软件要求图片文件为TIFF格式,所以用数码相机拍摄文字图片的时候,要存储为TIFF格式。若是JPG格式的图片...

华为手机屏幕字体发黑亮为什么-ZOL问答

5条回答:【推荐答案】设置---安装与调试---开发人员选项---显示cpu使用情况关掉就ok了

如何把书上的文字变成电子版?

把书上的文字变成电子版的方法步骤如下1、在电脑中安装doPDF和AJViewer2、用数码相机把需要的文字拍下来(相机和照像水平就不多谈了。照片效果越好,可以大...