普通视图

发现新文章,点击刷新页面。
今天 — 2025年5月13日首页

汉字的不可拼音化

2025年5月13日 05:18

今天看到了这样一个有趣的网站,理查德·西尔斯(Richard Sears),一个美国人,他花了 20 多年的时间整理了数万个甲骨文、金文和篆字的字形变体(包括 31000 多个甲骨文拓片、24000 多个金文铭文和 49000 多个篆书字形),并制作成了一个叫做字源的网站。打开网站之后,只需要输入一个汉字,点击一个按钮就能看到这个汉字在甲骨文,金文,篆体中的样子。

于是我想到了之前写过的一则笔记——「为什么汉字起源于象形而非拼音」。

汉字作为世界上最古老的仍在使用的文字系统之一,从其诞生之初就采用了以象形和表意为基础的系统,而非纯粹的拼音系统。这一特性的形成有着深刻的历史和语言学根源。

汉字在其起源时就是以图形和符号为基础,而非直接记录语音的拼音文本,其历史可追溯至远古时期。汉字最初可能源于原始图画,传说中虽有黄帝史官仓颉根据自然物体形状创造的故事,但现代学者普遍认为汉字系统是由古代先民在长期社会实践中集体智慧逐步形成的,而非一人一时所创。考古发现表明,最早的汉字雏形可能追溯至约 4800 年前的大汶口文化晚期陶器刻画符号等史前刻符,并在商朝(约公元前 1300 年开始)的甲骨文时期发展成为成熟的文字系统。这些早期文字主要通过直观的图像和符号来记录事物与概念,体现了典型的象形与表意特性。

汉字的构成方法,后人总结为「六书」原则:象形、指事、会意、形声、转注、假借。这些方法展现了汉字构造的多元性:

  • 象形、指事、会意主要围绕字形和意义构建字符;
  • 形声字(约占现代汉字的 80% 以上)则结合了表意的「形旁」和表音的「声旁」,创造出兼具形义的新字。

尽管包含了表音成分,但这种构造方式记录的是语素(有意义的音节)而非纯粹的语音流,与完全基于发音的拼音文字系统有着本质区别。例如,「臭」字在古代由表示鼻子的「自」和「犬」组合而成(会意),因为古人观察到狗的嗅觉灵敏,以此表达「气味」乃至后来的「难闻气味」之意。

汉语(尤其是其核心语素)具有显著的单音节特性,即一个字通常对应一个有意义的音节,这导致了语言中存在大量的同音字(或同音语素)。以现代标准汉语(普通话)为例,尽管有声母、韵母和声调的变化,但实际有效的带声调音节总数大约也只有 1200 到 1300 种左右。然而,汉字的数量却极为庞大,例如清代的《康熙字典》就收录了约四万七千个汉字,而现代大型汉语字典收录的汉字数量更多。

这种音节数量远少于文字数量的现象,必然导致大量同音字的存在。例如,发音为 "shì"(去声)的字,就有「是、事、市、世、视、适、士、势、试、释」等等,如果算上所有读作 "shi" 的音(包括四个声调),对应的汉字数量更为可观。若仅仅使用拼音(即使包含声调)来书写,将在很多情况下无法有效区分意义。

语言学家赵元任先生创作的《施氏食狮史》便是一个极端的例子:

石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。施氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。

全文九十余字皆读作 "shi" 的不同声调,仅凭拼音朗读几乎无法理解,但书写出来的汉字却文意清晰,生动地展示了汉字在区分同音语素上的优势。

虽然汉字的形体经历了漫长的演变,从甲骨文、金文到大篆、小篆,再到隶书、楷书等,字形发生了显著变化,但其作为语素文字(记录意义与声音相结合的语素)的核心特性始终保持了高度的连续性。这种连续性使得现代人通过专门学习,依然能够追溯部分现代汉字与数千年前殷商时期甲骨文的明确联系,一些高度象形的简单文字(如「日」、「月」、「山」、「水」等)的演变轨迹甚至能被普通人辨认出来,这体现了中华文明某种程度上未曾中断的特点,是许多其他古老文明的后继者难以企及的。

综上所述,汉字采用以形表意(或形音结合)的语素文字系统而非纯粹的拼音系统,是深深植根于汉语自身特点(尤其是同音语素繁多)的必然结果。这种系统能够:

  • 有效地区分同音词,保证书面信息的精确性;
  • 在一定程度上能够跨越不同地域、不同时代的语音差异(例如,不同方言区的人们虽口音不同,但能看懂相同的汉字书面语);
  • 承载丰富的文化信息和历史连续性。

这也解释了为何在历史上乃至现代,将汉语完全改造为拼音文字系统的各种尝试,虽然在注音、教学、信息处理等领域取得了重要应用,但最终都未能取代汉字本身——汉字系统的独特性质与文化承载决定了它难以被纯粹的拼音系统所完全替代。

清末民初,面对西方文化的冲击,在救亡图存的时代背景下,以鲁迅、瞿秋白等为代表的一批知识分子曾竭力主张汉字拼音化(罗马字母化),并认为汉字是文化落后的象征,是阻碍中国现代化的绊脚石。鲁迅甚至断言:「汉字不灭,中国必亡」。

虽说站在当今的视角去看待他们的观点,能够理解为矫枉必须过正。但这些主张中所反映出的「左派」的狂热,到底有多少不是被煽动的呢?「一声炮响」到底送来了些什么杂碎,自不必多言。

好在汉字不仅是一种书写工具,还是中华文明传承的载体。最终扛过了不堪回首的混乱年代,历久而弥新。


本文初稿在 Tana 上完成,这是一款通过将 AI 驱动的结构化数据库与流畅的大纲列表相结合的笔记软件,重新定义了现代知识管理,使用户能够无缝地组织相互关联的想法,同时保持自由形式思考的灵活性。

❌
❌