中文打字机:一个世纪的汉字突围史

《中文打字机:一个世纪的汉字突围史》墨磊宁 著 广西师范大学出版社

汉字在过去几百年里,都不能融入以“雷明顿”为代表的全球打字系统,而游离于所有语言系统之外。深究其原因,其实是与人种生理发音的不同有关。世界上主要语言发音都是黏着语或屈折语,说话一串一串的,词性由音的变化规定。而唯有汉语(也包括中国个别少数民族地区语言)是孤立语,单音节发音。这让中文成为一个音对位一个字符的体系。其实世界上许多原始文字的雏形都是象形的,但由于发音的变化,只能发展成拼音文字的形式。别小看这一点不同,却把“方块中文”与其他所有文字区别开来,从而开始了汉字文化圈与其他语言文化圈的分道扬镳,也就有了围绕打字机功能设计上说不尽的故事。

由于上述原因,

汉字成为了唯一的(除水书、女书等中国少数民族文字外)、还活着的古老文字并使用至今。 长时间来,这使我和使用这一古老文字的人群,在为此自豪的同时,又有负重之感,似乎我们拉了世界文明的后腿,也制约了本民族现代化的进程。今天人类已步入了AI、硅基、太空时代,而我们仍然使用着古老的“图纹符号”在交流,一写字,就在画“小图”。

我们真的生活在穿越中,这又常给我带来一种喜悦感。

确实,汉字方块书写特别,左右了中国文化的独特内涵。由于方块字的整齐,中国人看重对称的美感,就有了对仗、律诗的品位,以及中文写作的独有魅力。汉字音、意、形的丰富关系,使中文写作与阅读,成为一种多维的体验。

由于中文众多的字符,使每一个开始接受教育的人,都要用几年时间摹写几千个字形,这使中国形成了特有的拷贝文化。古体诗中讲究的“用典”,与现代版权法是冲突的,就像图形文字与字母文字在打字机原理上反映出的冲突一样。中国人写了几千年的方块字,一定影响着这个民族的性格、文化性格和看待事物的方法,甚至今天的中国是这个样子的原因。

庞大的中华民族千年维系在一起,不能不说与模块化的、顽固的方块字有关。读这种文字,不仅是获取信息的“读”,更多的是“悟”,这反映在它大量“四字成语”的方式上。四个字,几乎就是一段故事、一幅画、一个道理或一个概念。它不代表事物的细节,只代表这一类事物。从而这种文字具有概括性与包容性,适用于世界上最大的人群和它的多样文化,都能用它表示并注入各自的文化内容,又在大一统之下和谐交流。

《中文打字机:一个世纪的汉字突围史》一书讲述了历史上对方块字多次的破除运动,都没有较过方块字的执拗。 文字学家、发明家的努力,始终纠缠于完整字义的方块中文与无意义的字母之间的不能和解。林语堂等人曾试图把汉字字素(偏旁部首)作为字母,拼在方块中,能像西文字那样重复使用。但是,汉字几千年形成的图形的复杂与审美的讲究,几乎成了品位最精要的艺术。机械打字将字素在一个方形区域内的散乱摆放,在视觉上是不可接受的。中文笔画之间的穿插,就像树枝在枝干间的生长,已似自然天成的结果,而非机械排列所能及。

林语堂和林太乙展示明快打字机 本书插图

中国人发明了活字印刷术,在中国却没有成规模使用。因为中国人不可能为了方便把单字打散,牺牲方块字的内涵与美,方块字几乎成了我们的命根子。汉字不可拆解,是由于构成汉字的每一个字素都有含义,不同于外文字母在组词中的作用。

我对此另外的体会,是1987年的《天书》创作。不少人都不明白这些“字”如此像汉字却没有内容。其实是因为,这些“伪汉字”的字素是携带内容的:我把类似“木”的符号与“水”的符号拼在一起,你一定会说这个字是表示自然的;把“工”与“刀”部拼在一起,你一定认为这个字是说人造物的。这让你自己首先相信,明明有这个字。这就像看到一张熟面孔,却叫不出他的名字。我利用了汉字的本性,让这些字更像它们自己。这是方块汉字与字素之间特有的“秘密”。

读到此书结语,我高兴地看到,墨磊宁教授将有下一本关于数字时代汉字输入的写作。独特的中文,在全球技术一体化的语境下,又将是一种怎样的特殊角色与作用? 汉字在全球文明进程中,似乎总是承担着对机体健康生长有益的作用;对整体文明推进起着调节或弥补缺失部分的作用。

在机械时代,中文的复杂无疑成为一种“阻碍”,数字时代却成为一种可用因素,为“算法”识别、“算力”提速,提供了更多有用的识别信息。这体现在如今拼音、联想、词块、五笔等丰富多样的输入手段中,使中文输入快捷于拼音文字的输入速度。

可以说,在数字时代的今天,按键写作才开始交到了汉语圈所有需要写字的个人手里。打字机出现200多年后,汉语圈才摆脱了个人手写的历史。

人们很容易从手写中判断是谁的字迹;母亲可以从三个女儿的三封打字信件的节奏与轻重中分辨出,哪一封信是哪个女儿写的;到了电脑时代,就只剩下根据写者字体选择的不同,来判断写者的偏好。我相信,将来连按键的动作都不需要,连字体选择的机会都没有了。

(作者为著名艺术家,中央美术学院原副院长、教授、博士生导师)

揭秘首批中文电脑字体诞生过程,将汉字「搬」进数码设备有多难?

新的电子设备开机时,屏幕映出的首个交互页面,往往是系统语言选择。

你可以上下滑动,选择中文、英文、日文等多达上百种的文字。但如果将时间拨回 40 多年前,这一选项可能只有寥寥几种,而且没有中文。

我国文字的历史源远流长,但其数字化的历程却并不久远。我们现在之所以能在电子设备上阅读中文,离不开最初花费巨大力气,将中文「搬」至电脑上的那一群人。

最近,斯坦福大学获得了 2500 余件现代中国信息技术收藏品,包括几十台珍稀的中文打字机、文字处理器和电脑等物品,堪称世界上最大的中国现代 IT 历史合集。

▲首批中文数字字体模型. 图片来自:斯坦福大学

该校一位研究中国历史的教授托马斯·穆拉尼(Thomas Mullaney),在这些珍贵的藏品里发现了许多有趣的故事。其中就包括全球首批中文数字字体,是如何被制作出来的。

托马斯将这段艰辛但充满艺术的历程,在《麻省理工科技评论》上讲述了出来。我们也得以机会看见这个具有时代意义的历史片段。

▲托马斯·穆拉尼

一台机器带来的契机

故事要从一个订单开始说起。

20 世纪 80 年代初,美国图形艺术研究基金会 (Graphics Arts Research Foundation) 找到了路易斯·罗森布鲁姆(Louis Rosenblum),想请他的团队,为其正在开发的机器 Sinotype III 创建出中文字体。

当时路易斯已年近 6 旬,毕业于麻省理工学院的他,是一名资深的印刷、排版专家。路易斯在 1965 年创立了 Photography Systems 公司,专门解决数字工程、摄影、应用数学等相关问题。

▲路易斯·罗森布鲁姆

虽然路易斯及其团队此前和图形艺术研究基金会有过多次合作,但这次为 Sinotype III 创建中文字体的项目,却是最棘手的。

因为当时中国还没开始生产个人电脑,其他国家或地区生产的电脑无法处理中文。所以在给 Sinotype III 这台实验性机器开发中文字体前,路易斯的团队需要先对苹果二代电脑(Apple II)编程,使其能够以中文运行。

万事开头难。由于苹果二代的 DOS 3.3 操作系统,无法输入和输出汉字文本,所以必须得从头编程,包括编写一个中文文字处理器。为此,其团队花费了几个月的功夫。

他们想出的解决方案,是先通过 BASIC 编程语言,编写一个「Gridmater」程序,然后将该程序放入苹果二代电脑的软盘上运行。如此一来,便能创建并保存汉字的数字位图了。

接着,将设计好的汉字位图及其相应的代码,植入到系统数据库,便可让 Sinotype III 机器处理并显示中文了。

▲Sinotype III 显示器的照片,显示了 Gridmaster 程序和汉字「电」. 图片来自:斯坦福大学

这里插入一个背景知识。早期的数字字体,均采用位图图像(也称点阵图像)来显示。

这是一种常见的储存图像的方式,我们今天相机拍摄的照片、截图,储存方式均属于位图。一张 JPEG、BMP、GIF 等格式的图片,是由很多像素点组成,这些点经过排列和染色,便构成了图样。

比如我们可以在电脑上将一张图片放大,放大至一定程度,便可看到正方形的像素点了。早期的字体便是在一定大小的网格内,通过排列和染色形成的。

▲ 将左图的眼睛部位放大,便可看到像素点了

中文数字字体,可比英文难做多了

中文数字字体之所以难做,首要原因就是汉字的数量实在太多了,其次是因为汉字的字形十分复杂多样。

在计算机问世之初,工程师和设计师约定采用大小为 5X7 的位图网格,来创建低分辨率的英文数字字体。如此一来,每个字符的大小约 5 个字节,计算机的内存不会有太多负担。

在美国信息交换标准代码(ASCII)中储存的所有 128 个低分辨率字符,包括英文字母表中的每个字母、数字 0 到 9,以及常见的标点符号,共计需要 640 字节的内存。而当时苹果二代的内存为 64KB,可以轻松承载英文字体库。

▲ASCII 字符表

而中文由于字形复杂,在 5X7 大小的网格中会糊作一团,难以辨认。因此至少需要一个 16X16 或者更大的网格。

这样换算下来,每个中文字符的大小至少有 32 字节。如果将 70000 个低分辨率的汉字打包,内存至少需要 2MB。再退一步,即便字库内只放进 8000 个常用的汉字,也需要约 256KB 的内存。

这无疑是一个大难题。因为在上世纪 80 年代初,大多数 PC 的总内存容量不超过 64KB,根本装不下庞大的中文位图字库。

▲Sinotype III 显示器的照片,显示了中文字体. 图片来自:斯坦福大学

内存告急并不是最令人头疼的,因为这可以随着 PC 软硬件的进步得以解决。如何在 16X16 的低分辨率网格中,创造出既容易辨认又美观的中文字体,是更棘手的难题。

为此,路易斯团队的设计师们花了数年时间,尝试创造出满足低内存要求,且清晰易认,甚至有书法美感的中文位图。其中,凌焕铭(Huan-Ming Ling)和艾伦迪乔瓦尼(Ellen Di Giovanni)的贡献最为突出。

他们先是借助纸、笔、修正液来手绘出汉字的位图,然后借助上文提到的 Gridmater 程序将其数字化,植入到 Sinotype III 的系统中。

▲Sinotype III 显示的中文字体. 图片来自:Courtesy of Bruce Rosenblum

制作背后的匠人精神

托马斯教授在档案资料里,发现了路易斯团队设计汉字位图的全过程。在一个装满格子图的册子中,记录了设计师们是如何通过手绘散点符号来创造汉字位图的。

我们都知道,汉字的笔画并非「横平竖直」的,入口笔画、出口笔画、笔画渐变都有着丰富的细节。这也是设计师们面临的核心问题,即如何在 16X16 的方格中,尽可能将这种书法美展现出来。

在这本格子册中,可以发现每个汉字都经过设计师精心绘制。绿色的「X」是最初的标记,交由汉字编辑审核后,如果哪里不够规范,路易斯及其团队便会用修正液盖住原本的标记,再用红色的「X」标记上去。

▲「背」字的位图草稿. 图片来自:斯坦福大学

经历反复修改,经过最终确认的位图,才会输入至系统中。

如果要满足消费者的需求,字库里至少要包含 3000 个常用的汉字。这个工程量对于团队来说是很大的。人们可能会猜测,他们是否会寻找一些讨巧的方法。

例如,对于相同偏旁部首的汉字,可以直接将偏旁部首复制过去。就像下图中「评」、「读」都是言字旁,按理说设计师只需要设计右侧不一样的部分就可以。

▲中文位图草稿. 图片来自:斯坦福大学

但是托马斯教授发现档案里类似的工作机制很少。路易斯坚持要求设计师逐字调整、设计,以确保每个字的偏旁部首看起来是协调的。即便有些改动十分细微,令人难以察觉。

托马斯教授按照档案资料重新复现了 Sinotype III 的中文字体。可以发现同样为「女」字旁的「娟」和「娩」,两个字的「女」字旁的设计样式并不一样。

▲可以看出「女」字旁的不同吗? 图片来自:斯坦福大学

「女」字旁在「娟」字中的宽度为 6 个像素(网格),而在「娩」字中只有 5 个像素。另外「娩」字的「女」字旁撇点和撇的笔画,要比「娟」多一个像素,视觉上更加修长。

这样一丝不苟的设计并非个例。托马斯教授在字体库里发现了大量类似的工作,当他将位图的草稿与最终成品放在一起对比时,还能看到许多细微、有趣的变化。

比如在「罗」字中,左下角的笔画最初是以 45°向下伸展的。但最终版本,笔画的尽头被「拉平」,更符合书法的艺术感。

▲「罗」字的两个版本,左为最终版. 图片来自:斯坦福大学

可以看出,添加或缩减一个像素,便会对整体的平衡感、美感造成影响。这也体现出设计师们在创作首批字体的艰辛,以及背后的匠人精神。

实际上,16X16 的网格,对于创作中文字体并不是很友好。最主要的问题是对称性。

我们知道,大量的汉字是具有对称性的,而根据数学的规则,只有奇数大小的空间区域,才能创建出完全对称的形体。

因此,路易斯及其团队决定只利用 16X16 网格中的 15X15 区域,来实现汉字的对称。这进一步缩小了设计师的空间,对设计工作提出了更高的要求。

▲ 山、中、田的对称与非对称. 图片来自:斯坦福大学

得益于团队孜孜不倦的努力和一丝不苟的态度,Sinotype III 的中文字体库项目顺利完成。尽管它并未商业发布,但它的确是世界上最早能处理、显示、输入输出中文的 PC 之一。

当然,路易斯及其团队制作字体的方法,在当今的技术语境下看起来似乎太过古板和幼稚。现在广泛使用的 TrueType 字体技术,能够以矢量方式存储字体,占用空间小、渲染快、显示效果清晰锐利。

▲如今多数字体均是 TrueType 格式. 图片来自:themex

但正是他们使用「笨方法」,逐字画稿、反复修改,才让汉字得以进入数字世界。而「当代毕昇」王选院士主持研制的高分辨率字形信息压缩技术,更是彻底地解决了汉字编码储存的困境。

在这些前辈们的努力下,中文才没有被互联网大潮落下,汉语拉丁化的理论被扫进历史垃圾堆。我们今天能够使用中文在互联网上冲浪,应感谢他们曾为此付出的青春。

相关问答

关于PS/IR制作打字机效果闪动文字的教程-ZOL问答

用PS的组件IMAGEREADY制作有打字机效果的闪动文字.具体操作我不大了解.请高手详细说明一下.最好有详细的视频教程.效果就比如这张图:http://bbs.***.net/att...

PPT怎么将文字出现的效果做成打字机动画带声音?

开ppt2013文档。如下图所示。2、选择内容,点击“动画”。如下图所示。3、点击其中的“出现”功能。如下图所示。4、点击“动画窗格”功能。如下图所示。...如...

老式打字机字体怎么调大?_土巴兔装修问答

老式打字机每一个按键对应的那根小棒子上,实际有2个图案的,字母键是大小写,数字键是数字和符号。在使用的过程中,老式打字机有一个类似于现在的caps...

pdf打字机工具如何把字变大?

这主要是针对部分PDF文件在制作的时候采用的不是标准A4版面,而输出的时候却以A4版面输出,导致文字内容显示过小、版面不均匀的情况。1.请将本人网盘的这款PDF...

如何用EDIUS做出打字机效果的视频字幕?

首先我们要准备一个打字机打字的声音素材,然后导入到素材库中并拖拽到声音轨道上。接下来就是我们的重点啦,如何让蚊子一个字一个字地出来。首先我们在素材库...

用我的电脑和打字机怎么打出毛笔字-ZOL问答

不知道为何我上不了求字体网站了你只要把图片在求字体哪里求就可以了平板电脑加个键盘!或者买个旧的笔记本.炫龙A41L青春版游戏本GT940M独显手提笔记本...

打字机的使用方法是怎样的?

中文打字机最初的形式为一个约一张A2大小的盘上,排满了铅字。铅字的排列次序跟报馆的习惯一样,按部首画数排列。打字员首先要在铅字盘上用一个小钳把铅字钳起...

怎么把打印机的字体调大一些!1?

修改字体的大小即可。首先说明:字体和打印机无关。字体是在电脑里设置的,除了windows自带的,还可以自己下载添加字库在windows的font文件夹里。编辑文档等...

打字机的工作原理是什么呢?

打字机是用来代替人工书写、誉抄等的一种机器,是用于书写的一种机械化的、电孑化、电机的设备。按文字形式可分为两种:一、中文打字机:通常为整体文字打印机...

AE如何做打字机效果?

在AE里制作打字机效果有几种方式,这里只讲解AE内置的打字机效果和TypewriterPro打字机动画脚本这两种方式的制作方法。AE内置打字机新建文本图层,打上需要制...