通用字字形结构型式的统计
(兼谈汉字构形的优化)
1.0 引言
汉字的解构,因观点不同而有差异:有的只凭字形,有的兼顾字义,有的纯作拓扑分析。笔者个人认为汉字的字形是”本”,声、义是附丽于”形”的。为探讨汉字的结构型式(简称构式),字形是主要的凭依。
汉字字形应如何拆分,见仁见智,迄今尚无定论。笔者认为拆分的方式,因拆分目标不同而异:
a. 求汉字的字形结构型式(构式):交重可不拆分,基本笔划原则上不予拆出。
b. 求汉字的基本字元(基元):交重须拆分,基本笔划也要拆出。
c. 编码输入用,视样本字量而定,大都由编码者主观认定拆分方式,难有一致。
本文乃讨论上述a项,以简、繁通用字7304个为样本,寻检每个汉字的构式,并把它分类、统计;以期发现汉字的结构问题,并对少数繁复字,提出个人的优化构想。
本文用简体,字例则简、繁不拘。
2.0 汉字构式的表示法
2.1 构式的图形表示
汉字是由数个字元依一定笔序组成的,例如:籲,依序分为⺮口口口冂卄丆貝 9 个字元,从组成的构式来看,它是---囗/(⿳⿱),共有6个方格。虽然原则上1个字元可占 1方格;但龠中3个“口”必须合成1方格[],字元“冂卄”也要合成1方格[𠕁],以便构式的编制;由此可设定如下编定构式的准则:
1. 与其它字元组字时,横向排列的同形字元,视同1方格,不另拆分。例如:
僉:亼
(口口)(人人),3 方格,构式 ⿳。
鹳:⺾(口口)隹鸟,4 方格,构式 ⿳囗。
臨:臣𠂉口(口口),4 方格,构式 囗⿳。
諤:言(口口)亏,3 方格,构式 囗⿱。
器:(口口)犬(口口),3 方格,构式 ⿳。
卒:亠(人人)十,3 方格,构式 ⿳。
翠:(习习)亠(人人)十,构式 囗/⿳。
琵:(王王)(匕匕),2方格,构式 ⿱。
噀:口(巳巳)龷八,构式 囗⿳。
禁:(木木)二小,3 方格,构式⿳。
2. 包围形结构 (厂,广,勹,廴,辶,冂,匚,囗) 与其它字元组字时,视同1方格,不另拆分:
尚:⺌冋,构式 ⿱。
胸:月(勹㐅凵),构式 ⿰
稟:亠回禾,构式 ⿳。
滴:氵亠丷,构式 囗⿳。
奁:大区,构式⿱。
獵:犭巛囚,构式 囗⿳。
蓖:⺾囟(匕匕),构式 ⿳。
墉:土(广) 构式 ⿰
鰱:鱼(車辶),构式 ⿰
桐:木(冂𠮛) 构式 ⿰
2.2 构式的坐标表示(x,y)
与图形对应的另一种构式表示法,是使用坐标x,y。例如 西,构式囗,在,x,y坐标上,横向、纵向都只有1个单元,故以x1y1表之。又如 搞:扌亠口冋,构式 囗⿳,横向x占有2个单元,纵向y占有3个单元,故以x2y3表之。其它例子 ---
僉:吅从,⿳,(x1y3)
鹳:⺾吅隹鸟,⿳囗,(x2y3)
諤:言吅亏,囗⿱,(x2y2)
臨:臣𠂉口吅,囗⿳,(x2y3)
獵:犭巛囚,囗⿳,(x2y3)
澍:氵士口䒑寸,囗⿳囗,(x3y3)
构式的坐标xy,可指示汉字字型结构的”繁复度”。由汉字的构形统计得知,汉字作二维排列时,最好以横向(x) 3单元、纵向(y) 4单元为限 (x3y4),否则字形结构便显得过于繁复,必须设法优化。
3.0 独体及左右型构式统计
汉字的字形结构型式(构式)可分为 独体型(囗)、左右型(⿰…)、上下型(⿱…)、包围型(勹冂…) 4类,兹以简繁通用字7304个为样本,逐字编定构式,归类并统计之如次。
独体及左右型构式统计表
字形结构 |
类 |
坐标xy |
构 式 |
字 例 |
字数 |
独体型 |
0 |
0x1y1 |
囗 |
一,史,鱼,丕,竹 |
345 |
左右型 |
A1 |
Ax2y1 |
⿰ |
軌,叨,牝,涸,皈 |
1695 |
同上 |
A2 |
Ax2y2 |
囗⿱,⿱囗,⿱⿱ |
硫滦,勚鼬,龆骼 |
1949 |
同上 |
A3 |
Ax2y3 |
囗⿳,⿳囗,⿱⿳,⿳⿱,⿳⿳ |
樨,鄧,韂,彀,兢 |
605 |
同上 |
A4 |
Ax2y4 |
囗(⿱/⿱),(⿱/⿱)囗,(⿱/⿱)(⿱/⿱) |
螳穰,瓤影,囍 |
85 |
同上 |
A5 |
Ax2y5-6 |
囗(⿳/⿱),囗(⿱/⿳),⿳(⿱/⿳),囗(⿳/⿳) |
耰,囔馕攮,齉,儳 |
6 |
同上 |
A6 |
Ax3y1 |
⿲ |
粥,抑,咐,蜘 |
186 |
同上 |
A7 |
Ax3y2 |
囗囗⿱,囗⿱囗,⿱⿰,(囗/⿰)囗,囗(囗/⿰) |
嘚,掰,靴,剜,婉 |
206 |
同上 |
A8 |
Ax3y3 |
囗⿳囗,囗⿳⿱,囗(⿱/⿰),囗(⿱⿱)/囗 |
渤,臌,嚼,攒 |
39 |
同上 |
A9 |
Ax3y4 |
囗(⿰/⿳),囗(囗/⿳)⿱,(⿱/⿱)(⿰/囗) |
骥,灏,懿 |
3 |
同上 |
Aa |
Ax4y2 |
⿱(⿲/囗) |
躞 |
1 |
同上 |
Ab |
Ax4y3 |
囗(⿱/⿲), 囗(囗/⿲/囗), 囗(⿲/⿱) |
瀛,嚥,襻 |
3 |
以上合计 独体型[0] 345 字,左右型[A] 4778 字 |
上表内的A5、Aa、Ab类下的字例,均已超过构式的限度,[x3y4],即横向排列3单元,竖向排列4单元,有待改进,共有10 字,现逐字讨论如次:
1. 耰:右旁[憂]由 丆,月,冖,心,夂
5字元组成,已超限,可比照 擾->扰 的方式简化,[耒尤]。
2. 囔,馕,攮,齉:右旁[囊]由,冖,吅,𠀎,𧘇 5 字元组成,已超限,囊可简作[]*,会意,表袋子。
从囊的字,其结构均可因之简作 ⿰ (囔,馕,攮),齉的构式简作⿳囗。
3. 儳:右旁由 ⺈,口,比,⺈,口,( 丶) 6字元组成,已超限,可比照 搀 简化,[亻搀r]。
4. 襻,躞,瀛,嚥:嚥已简作咽,襻的声符似可省作[大/手];躞、瀛的聲符如何簡化,尚待研討。
4.0 上下型构式统计
字形结构 |
类 |
坐标xy |
构 式 |
字 例 |
字数 |
上下型 |
B1 |
Bx1y2 |
⿱ |
累,显,兹,愿 |
765 |
同上 |
B2 |
Bx1y3 |
⿳ |
穸,奈,屑,蓖 |
386 |
同上 |
B3 |
Bx1y4 |
⿳/囗,囗/⿳,⿱/⿱ |
橐,棻,辜 |
118 |
同上 |
B4 |
Bx1y5-6 |
⿳/⿱,⿱/⿳,囗/⿱/⿱,囗/⿱/⿳ |
臺,窣,葶,薹 |
15 |
同上 |
B5 |
Bx2y2 |
囗/⿰,⿰/囗 |
茫,髡 |
266 |
同上 |
B6 |
Bx2y3 |
(囗⿱)/囗, ⿰/(囗⿱), 囗/(囗⿱), ⿰/⿱ |
慇,鬆,霑,髫 |
166 |
同上 |
B7 |
Bx2y4 |
⿳/⿰, ⿰/⿳, (⿱⿱)/⿱, 囗/(囗⿳) |
嘉,鬃,颦,覆 |
39 |
同上 |
B8 |
Bx2y5-6 |
(⿳⿱)/⿱, (囗⿳)/⿱, (⿱/⿳)囗/囗 |
鼙,隳,壑 |
3 |
同上 |
B9 |
Bx3y2 |
囗/⿲, ⿲/囗 |
彘,嶽;燮,愆 |
7 |
同上 |
Ba |
Bx3y3 |
⿲/囗, 囗/⿲, 囗/⿲/囗, 囗/(囗⿳囗) |
懋,嶽,藥,蘅 |
11 |
同上 |
Bb |
Bx3y4-5 |
囗/⿲/⿱, ⿲/囗/(⿱囗), ⿲/囗/⿳ |
夔,鬱,爨 |
4 |
以上合计 上下型 [B] 1780 字 |
上表字例超过构式限度,[x3y4],即横向排列3单元,竖向排列4单元的,有:鼙,隳,壑(B8)及鬱,爨(Bb) 5字,有待改进,笔者个人设想如下:
1. 鼙:鼓是会意字,偏旁[支]表击打,可省略;鼓可简作[壴],从而所有从[鼓]的字均可改为左右排列型。例如,鼙
>[壴卑]、冬 >[壴冬],构式省作 ⿳⿱,x2y3。
2. 隳:隋省作[陏],隳 > [陏人⺗],构式简作 (囗⿱)/⿱,x2y4。
3. 壑:㕡或从土,谓穿土 (段注);谷也,虚也 (正韵)。本字可省从[谷又土],(⿳囗)/囗,x2y4。
4. 鬱:木丛生者;从林,𩰪省声(说文)。鬱虽有简化字 ”郁”取代,但不很好;仍宜从简省部件着手,
鬱 > [林冖凶匕彡],构式 ⿱/(⿱囗),x2y4,笔划自29减为19,而且可归入木部。
5. 爨:𦥑象持甑,冖为灶口,廾推林内火(说文)。这是个详细描述烧火炊饭的会意字,首先双手(臼)取锅(同)放在灶(冖)上,再以手(廾=大)推柴(林)入灶生火。建议字头比照兴省作 ,取消[林],省略后的字元为:[⺍冖大火],构式为 ⿱/⿱,x1y4,笔划自 29减为 12。
6. 上表中 B4项 共有4字(臺,窣,葶,薹),纵向(y)亦超过4单元,但横向(x)只有1单元,不算太复杂,应可接受。
5.0 包围型构式统计
字形结构 |
类 |
坐标xy |
构式 |
字 例 |
字数 |
二面包围 |
C1 |
Dx1y1 |
勹囗,勹⿱ |
勾,匐 |
9 |
同上 |
C2 |
Hx1y1-3 |
广囗, 广⿱, 广⿳ |
庫,庖;店,庵;廖,廙 |
61 |
同上 |
C3 |
Hx2y2-3 |
广⿱囗, 广囗⿱, 厂⿰/囗, 广⿳囗 |
廠,庼,赝,廓 |
19 |
同上 |
C4 |
Jx1y1-3 |
疒囗, 疒⿱, 疒⿳ |
疢,痞,癔 |
79 |
同上 |
C5 |
Jx2y1-3 |
疒⿰, 疒囗⿱, 疒⿰/囗, 疒囗⿳ |
瘫,瘊,瘛,瘾 |
22 |
同上 |
C6 |
Jx3y2 |
疒囗⿱囗, 疒囗⿱囗 |
癍,癥 |
2 |
同上 |
C7 |
Lx1y1-4 |
囗辶, ⿱辶, ⿳辶, ⿱/⿱辶 |
迴,遂,邋,邃 |
95 |
同上 |
C8 |
Lx2y1-2 |
⿰辶, 囗⿱辶, ⿱⿱辶, 囗/⿰辶 |
逊,遊,避,遴 |
16 |
三面包围 |
C9 |
Mx1y1-3 |
冂囗, 冂⿱, 冂⿳ |
间,閤,阖 |
52 |
同上 |
Ca |
Mx2y1-2 |
冂⿰, 冂囗⿱, 冂⿱⿱ |
阚,阏,闢 |
6 |
同上 |
Cb |
Qx1y1-3 |
匚囗, 匚⿱, 匚⿳ |
区,匮,匿 |
13 |
同上 |
Cc |
Qx2y1 |
匚⿰ |
匭,匯 |
2 |
四面包围 |
Cd |
Wx1y1-3 |
⿴囗, ⿴⿱, ⿴⿳ |
国圃,固圄,圉圜 |
25 |
以上合计 包围型 [C] 401 字 |
上表字例C7类下,有个”邃”字,结构比较复杂,值得讨论一下。邃,深远也,从穴,遂声(说文);
而 ”遂”,从辵,㒸声(说文)。若 ”邃” 的声符直接使用[㒸],则本字可由字元 [宀八䒑𧰨] 组成,
构式为 ⿱/⿱,x1y4;而且省约后的构形,能显示该字的正确部首为[穴],更正了现有字形“邃”的
归部(辵)。
汉字既是二维的结构,顺理成章的可以坐标(xy)来表示它的构式。使用二元(x,y)多次(1-6)方程式,不仅可显示字形结构的种种型式及其复杂度;而且可用它来排序归类,本文即是把样本数据放在 Excel 内,而后依xy次别而自动排序分类的。
前文提到字形结构的复杂度,最好以x3y4为度,即横向3单元、竖向4单元为限。另一个参考标准是坐标x,y所占的空间,即 x乘y = 12。例如,薹 [x1y6] 所占空间仅为 1x6=6 < 12,[薹]的纵向单元(6)虽已超限,但仍可接受,不必改进。
6.0 繁复字的优化
兹把前文第3-5节拟定优化的繁复结构的字例,就笔划、构式、及字元组成,作优化前后的比较如下表,观察此表可知无论在那一方面,优化后的汉字都要比原字形精省许多。
字例 |
优 化 前 |
优 化 后 |
||||
笔划 |
构式 |
字元组成 |
笔划 |
构式 |
字元组成 |
|
齉 |
36 |
⿳(⿱/⿳) |
自田丌 冖(口口)𠀎𧘇 |
19 |
⿳囗 |
自田丌 |
耰 |
21 |
囗(⿳/⿱) |
耒丆月冖 心夂 |
10 |
⿰ |
耒尤 |
囔 |
25 |
囗(⿱/⿳) |
口 冖 (口口)𠀎𧘇 |
8 |
⿰ |
口 |
攮 |
25 |
囗(⿱/⿳) |
扌 冖 (口口)𠀎𧘇 |
8 |
⿰ |
扌 |
馕 |
25 |
囗(⿱/⿳) |
饣 冖 (口口)𠀎𧘇 |
8 |
⿰ |
饣 |
儳 |
19 |
囗{⿳/⿳} |
亻⺈口(匕匕)⺈口 |
11 |
囗(⿱/⿱) |
亻⺈口⺀ |
襻 |
24 |
囗(⿲/⿱) |
衤木(㐅㐅)木 大手 |
12 |
囗⿱ |
衤大手 |
鼙 |
21 |
(⿳⿱)/⿱ |
士口䒑十又甶十 |
17 |
⿳⿱ |
士口䒑甶十 |
隳 |
17 |
(囗⿳)/⿱ |
阝𠂇工月人⺗ |
14 |
(囗⿱)/⿱ |
阝𠂇月人⺗ |
壑 |
17 |
(⿱/⿳)囗/囗 |
⺊冖一八人口又土 |
12 |
⿳囗/囗 |
八人口又土 |
鬱 |
29 |
⿲/囗/(⿱囗) |
木缶木冖(𠂭凵)匕彡 |
19 |
⿱/⿱囗 |
林冖(㐅凵)匕彡 |
爨 |
30 |
⿲/囗/⿳ |
臼同冖林大火 |
12 |
⿱/⿱ |
⺍冖大火 |
邃 |
17 |
(⿱/⿱) 辶 |
宀八䒑𧰨辶 |
14 |
⿱/⿱ |
宀八䒑𧰨 |
其实汉字字形结构的简省工作,从古就有,古人造字时,常只取声旁的部分为声符,称为省声字。例如---毫,高省声;呕,欧省声; 炊,吹省声; 饴,怡省声; 破,波省声; 砝,法省声; 赌,都省声; 黯,暗省声; 雷,畾省声; 畿,幾省声; 络,洛省声; 宋,松省声等。估计通用字约有 220个是省声字。
如果不省声,汉字的结构必定臃肿不堪,例如 雷 将成为 [雨/畾]。
常见的情形是:成字后的汉字又作为声符,与其它意符组成新字。因此须从迭床架屋的字形结构中,
认取一个主声符。例如:篷,逢声;逢,夆声;夆 是篷的主声符。 同理,胸、滪、腑 的主声符为
凶、予、付。前文所举的字例:邃,它的声符[遂],可省作[㒸],便是依据这个道理, 这也是简化
汉字字形结构的方式之一。
以上所说的是形声字的情况。象形字 从古到今就是从图形到符号的进化。迄今仍保留图形痕迹的象
形字,尚有龜、黽、鼠…字,前2字己有简化字 龟、黾代替,鼠的部件 是否可以较易分解的 [𠂡 ]
来取代呢?
文字是约定俗成的,难免受到传统的束缚。倘若完全求新,如 拼音、意音文字的创建,因与传统格格不入,迄今难以有成。但若一味泥古,则汉字便陷入沈滞状态,失去向前发展的机会。在这样情况下,笔者个人认为:只有在传统的基础上更新,相对的说,也许较为可行。尤其在7000个通用字中,少数繁复字的字形优化,如本文所建议者,当不致影响文字应用的稳定性。
7.0 结语
汉字的字形结构型式统计如下表:
字型类别 |
字数 |
所占% |
独体 |
345 |
4.7 |
左右型 |
4778 |
65.5 |
上下型 |
1780 |
24.3 |
包围型 |
401 |
5.5 |
合计 |
7304 |
100.0 |
以上統計資料詳見附件:http://chinese.exponode.com/3_10.htm
识字是一种 ”认同辨异”的学习过程,汉字系统化(具有共通性)有利于认同记忆,而构形多样化(具有差别性)有利于识别觉察。汉字的字形结构不能太简也不可太繁,必须在系统化与多样化之间,寻取矛盾的辨证统一。对于目前通行的简、繁体也应有类似的看法。那些构形相似而容易混同的字(如 讠, 氵)固需改进;那些结构十分复杂的字,如本文第
4.0 节所举的字例,更应予以优化。
[全文完]