通用字字形结构型式的统计 

(兼谈汉字构形的优化)

 

1.0 引言

 

汉字的解构,因观点不同而有差异:有的只凭字形,有的兼顾字义,有的纯作拓扑分析。笔者个人认为汉字的字形是,声、义是附丽于的。为探讨汉字的结构型式(简称构式),字形是主要的凭依。

 

汉字字形应如何拆分,见仁见智,迄今尚无定论。笔者认为拆分的方式,因拆分目标不同而异:

 a. 求汉字的字形结构型式(构式):交重可不拆分,基本笔划原则上不予拆出。

 b. 求汉字的基本字元(基元):交重须拆分,基本笔划也要拆出。

c. 编码输入用,视样本字量而定,大都由编码者主观认定拆分方式,难有一致。

 

本文乃讨论上述a项,以简、繁通用字7304个为样本,寻检每个汉字的构式,并把它分类、统计;以期发现汉字的结构问题,并对少数繁复字,提出个人的优化构想。

本文用简体,字例则简繁不拘

 

2.0 汉字构式的表示法

 

2.1 构式的图形表示

汉字是由数个字元依一定笔序组成的,例如:籲,依序分为⺮口口口冂卄丆 9 个字元,从组成的构式来看,它是---/(⿳⿱),共有6个方格。虽然原则上1个字元可占 1方格;但龠中3口”必须合成1方格[],字元“冂卄”也要合成1方格[𠕁],以便构式的编制;由此可设定如下编定构式的准则:

 

1. 与其它字元组字时,横向排列的同形字元,视同1方格,不另拆分。例如:

僉: (口口)(人人),3 方格,构式    

鹳:⺾(口口)隹鸟,4 方格,构式 囗。

臨:臣𠂉(口口)4 方格,构式    

諤:言(口口)亏,3 方格,构式

器:(口口)(口口)3 方格,构式     

卒:亠(人人)十,3 方格,构式

翠:()(人人)十,构式 /     

琵:(王王)(匕匕)2方格,构式

噀:口(巳巳)八,构式           

禁:(木木)二小,3 方格,构式

 

2. 包围形结构 (,广,,,,,,) 与其它字元组字时,视同1方格,不另拆分

尚:⺌冋构式              

胸:()构式

稟:亠回禾,构式            

滴:氵亠丷构式

奁:大区,构式⿱              

獵:巛囚构式

蓖:⺾囟(匕匕)构式        

墉:(广) 构式

鰱:(車辶)构式               

桐:(𠮛) 构式

 

2.2 构式的坐标表示(x,y)

与图形对应的另一种构式表示法,是使用坐标x,y。例如 西,构式囗,在,x,y坐标上,横向、纵向都只有1个单元,故以x1y1表之。又如 搞:扌亠口冋,构式 囗⿳,横向x占有2个单元,纵向y占有3个单元,故以x2y3表之。其它例子 ---

僉:从,(x1y3)             

鹳:⺾吅隹鸟,囗,(x2y3)

諤:言吅亏,囗(x2y2)           

臨:臣𠂉口吅,囗(x2y3)

獵:巛囚,囗(x2y3)        

澍:氵士口䒑寸,囗囗,(x3y3)

 

构式的坐标xy,可指示汉字字型结构的繁复度。由汉字的构形统计得知,汉字作二维排列时,最好以横向(x) 3单元、纵向(y) 4单元为限 (x3y4),否则字形结构便显得过于繁复,必须设法优化。

 

 

3.0  独体及左右型构式统计

 

汉字的字形结构型式(构式)可分为 独体型()、左右型(⿰…)、上下型(⿱…)、包围型(勹冂…) 4类,兹以简繁通用字7304个为样本,逐字编定构式,归类并统计之如次。

 

独体及左右型构式统计表

 

字形结构

坐标xy

      

       

字数

独体型

0

0x1y1

,史,鱼,丕,竹

345

左右型

A1

Ax2y1

,叨,牝,涸,皈

1695

同上

A2

Ax2y2

,,⿱⿱

硫滦,勚,龆骼

1949

同上

A3

Ax2y3

,,⿱⿳,⿳⿱,⿳⿳

,鄧,韂,彀,兢

 605

同上

A4

Ax2y4

(/),(/),(/)(/)

螳穰,瓤影,囍

  85

同上

A5

Ax2y5-6

(/),(/),(/),(/)

,囔馕攮,齉,儳

   6

同上

A6

Ax3y1

,抑,咐,蜘

186

同上

A7

Ax3y2

囗囗,,⿱⿰,(/),(囗/)

,掰,靴,剜,婉

206

同上

A8

Ax3y3

,⿳⿱,(/),(⿱⿱)/囗

,臌,嚼,攒

 39

同上

A9

Ax3y4

(/),(囗/),(/)(/囗)

,灏,懿

  3

同上

Aa

Ax4y2

(/囗)

  1

同上

Ab

Ax4y3

(/), (囗//囗), 囗(/)

,嚥,襻

  3

                                  以上合计 独体型[0] 345 字,左右型[A] 4778

 

上表内的A5AaAb类下的字例,均已超过构式的限度,[x3y4],即横向排列3单元,竖向排列4单元,有待改进,共有10 字,现逐字讨论如次:

 

 1. 耰:右旁[] ,,,, 5字元组成,已超限,可比照 -> 的方式简化,[耒尤]

 2. ,,,齉:右旁[],,,𠀎,𧘇 5 字元组成,已超限,囊可简作[]*会意,表袋子

   从囊的字,其结构均可因之简作 (,,),齉的构式简作⿳囗。

 3. 儳:右旁由 ,,,,,( ) 6字元组成,已超限,可比照 简化,[亻搀r]

 4. ,,,嚥:嚥已简作咽襻的声符似可省作[/]、瀛的聲符如何簡化,尚待研討。

 

 

4.0  上下型构式统计

 

字形结构

坐标xy

     

     

字数

上下型

B1

Bx1y2

,显,兹,愿

765

同上

B2

Bx1y3

,奈,屑,蓖

 386

同上

B3

Bx1y4

/,/,/

,棻,辜

 118

同上

B4

Bx1y5-6

/,/,//,//

,窣,葶,薹

15

同上

B5

Bx2y2

/,/囗

,髡

 266

同上

B6

Bx2y3

(囗)/囗, /(囗), /(囗), /

,鬆,霑,髫

 166

同上

B7

Bx2y4

/, /, (⿱⿱)/, /(囗)

,鬃,颦,覆

 39

同上

B8

Bx2y5-6

(⿳⿱)/, ()/, (/)/囗

,隳,壑

3

同上

B9

Bx3y2

/, /囗

,嶽;燮,愆

7

同上

Ba

Bx3y3

/囗, 囗/, //囗, 囗/(囗)

,嶽,藥,蘅

 11

同上

Bb

Bx3y4-5

//, /囗/(), /囗/

,,

 4

                                                以上合计 上下型 [B] 1780

 

上表字例超过构式限度,[x3y4],即横向排列3单元,竖向排列4单元的,有:,,(B8),(Bb) 5字,有待改进,笔者个人设想如下

 

1. 鼙:鼓是会意字,偏旁[]表击打,可省略;鼓可简作[],从而所有从[]的字均可改为左右排列型。例如,鼙 >[壴卑]、冬 >[壴冬],构式省作 ⿳⿱x2y3

2. 隳:隋省作[],隳 > [陏人],构式简作 (囗⿱)/⿱,x2y4

3. 壑:或从土,谓穿土 (段注)谷也,虚也 (正韵)。本字可省从[谷又土]()/囗,x2y4

4. 鬱:木丛生者;从林,𩰪省声(说文)。鬱虽有简化字取代,但不很好;仍宜从简省部件着手

   > [林冖凶匕彡],构式 /(⿱囗)x2y4,笔划自29减为19,而且可归入木部

5. 爨:𦥑象持甑,冖为灶口,廾推林内火(说文)。这是个详细描述烧火炊饭的会意字,首先双手()取锅()放在灶()上,再以手(=)推柴()入灶生火。建议字头比照兴省作 取消[],省略后的字元为:[冖大火],构式为 /⿱,x1y4,笔划自 29减为 12

6. 上表中 B4项 共有4(,,,)纵向(y)亦超过4单元,但横向(x)只有1单元,不算太复杂应可接受

 

 

5.0  包围型构式统计

 

字形结构

坐标xy

构式

        

字数

二面包围

C1

Dx1y1

勹囗,勹

,匐

 9

同上

C2

Hx1y1-3

广囗, 广, 广

,庖;店,庵;廖,廙

 61

同上

C3

Hx2y2-3

广, 广囗, /囗, 广

,庼,赝,廓

 19

同上

C4

Jx1y1-3

疒囗, 疒,

,痞,癔

 79

同上

C5

Jx2y1-3

, 疒囗, /囗, 疒囗

,瘊,瘛,瘾

 22

同上

C6

Jx3y2

疒囗, 疒囗

,癥

  2

同上

C7

Lx1y1-4

囗辶, , , /

,遂,邋,

95

同上

C8

Lx2y1-2

, , ⿱⿱, /

,遊,避,遴

16

三面包围

C9

Mx1y1-3

冂囗, 冂,

,閤,阖

52

同上

Ca

Mx2y1-2

, 冂囗, ⿱⿱

,阏,闢

 6

同上

Cb

Qx1y1-3

匚囗, 匚,

,匮,匿

13

同上

Cc

Qx2y1

,匯

 2

四面包围

Cd

Wx1y1-3

, ⿴⿱, ⿴⿳

国圃,固圄,圉圜

25

                                                以上合计 包围型 [C] 401    

 

上表字例C7类下,有个”邃”字,结构比较复杂,值得讨论一下。邃,深远也,从穴,遂声(说文)

,从辵,㒸声(说文)。若的声符直接使用[],则本字可由字元 [宀八䒑𧰨] 组成,

构式为 /⿱,x1y4;而且省约后的构形,能显示该字的正确部首为[],更正了现有字形“邃”的

归部()

 

汉字既是二维的结构,顺理成章的可以坐标(xy)来表示它的构式。使用二元(x,y)多次(1-6)方程式,不仅可显示字形结构的种种型式及其复杂度;而且可用它来排序归类,本文即是把样本数据放在 Excel 内,而后依xy次别而自动排序分类的。

 

前文提到字形结构的复杂度,最好以x3y4为度,即横向3单元、竖向4单元为限。另一个参考标准是坐标x,y所占的空间,即 xy = 12。例如,薹 [x1y6] 所占空间仅为 1x6=6 < 12[]的纵向单元(6)虽已超限,但仍可接受,不必改进。

 

6.0 繁复字的优化

 

兹把前文第3-5节拟定优化的繁复结构的字例,就笔划、构式、及字元组成,作优化前后的比较如下表,观察此表可知无论在那一方面,优化后的汉字都要比原字形精省许多。

 

字例

                  

                  

笔划

构式

字元组成

笔划

构式

字元组成

36

(/)

自田丌(口口)𠀎𧘇

19

自田丌

21

(/)

耒丆月冖 心夂

10

耒尤

25

(/)

(口口)𠀎𧘇

8

25

(/)

(口口)𠀎𧘇

8

25

(/)

(口口)𠀎𧘇

8

19

{/}

⺈口(匕匕)⺈口

11

(/)

⺈口

24

(/)

衤木(㐅㐅)木 大手

12

衤大手

21

(⿳⿱)/

士口䒑十又

17

⿳⿱

士口䒑

17

(囗)/

𠂇工月人

14

(囗)/

𠂇月人

17

(/)/囗

⺊冖一八人口又土

12

/

八人口又土

29

/囗/()

木缶木冖(𠂭)匕彡

19

/

林冖()匕彡

30

/囗/

臼同冖林大火

12

/

⺍冖大火

17

(/)

八䒑𧰨

14

/

八䒑𧰨

 

其实汉字字形结构的简省工作,从古就有,古人造字时,常只取声旁的部分为声符,称为省声字。例如---毫,高省声;呕,欧省声; 炊,吹省声; 饴,怡省声; 破,波省声; 砝,法省声; 赌,都省声; 黯,暗省声; 雷,畾省声; 畿,省声; 络,洛省声; 宋,松省声等。估计通用字约有 220个是省声字。

如果不省声,汉字的结构必定臃肿不堪,例如 将成为 [/]

常见的情形是:成字后的汉字又作为声符,与其它意符组成新字。因此须从迭床架屋的字形结构中,

取一个主声符。例如:篷,逢声;逢,夆声;夆 是篷的主声符。 同理,胸、滪、腑 的主声符为

凶、予、付。前文所举的字例:邃,它的声符[],可省作[],便是依据这个道理, 这也是简化

汉字字形结构的方式之一。

 

以上所说的是形声字的情况。象形字 从古到今就是从图形到符号的进化。迄今仍保留图形痕迹的象

形字,尚有龜、黽、鼠…字,前2字己有简化字 龟、黾代替,鼠的部件 是否可以较易分解的 [𠂡 ]

来取代呢?

 

文字是约定俗成的,难免受到传统的束缚。倘若完全求新,如 拼音、意音文字的创建,因与传统格格不入,迄今难以有成。但若一味泥古,则汉字便陷入沈滞状态,失去向前发展的机会。在这样情况下,笔者个人认为:只有在传统的基础上更新,相对的说,也许较为可行。尤其在7000个通用字中,少数繁复字的字形优化,如本文所建议者,当不致影响文字应用的稳定性。

 

7.0 结语

 

汉字的字形结构型式统计如下

字型类别

字数

所占%

独体

 345

4.7

左右型

4778

65.5

上下型

1780

24.3

包围型

 401

  5.5

  合计

7304

100.0

 

以上統計資料詳見附件:http://chinese.exponode.com/3_10.htm

 

识字是一种 认同辨异”的学习过程,汉字系统化(具有共通性)有利于认同记忆,而构形多样化(具有差别性)有利于识别觉察。汉字的字形结构不能太简也不可太繁,必须在系统化与多样化之间,寻取矛盾的辨证统一。对于目前通行的简、繁体也应有类似的看法。那些构形相似而容易混同的字( , )固需改进;那些结构十分复杂的字,如本文第 4.0 节所举的字例,更应予以优化。

[全文完]