试论部件拆分的相对性 ---汉字拆分的相对论

 

引言

汉字的拆分,由于如下因素,有其相对性,因而拆分后各家所得的部件表便有相当的差异:1).字集的大小,2).拆分的目的,3).拆分的理念及方式。

字集的大小不仅影响拆分后的部件数量,也影响拆分的方式。例如,“豆是个部首,有完整的字义,含“豆的字,除豆的部首属字外,还包括 登、豈()、豊、戲()、壹 等字属,对于5万字以上的字集言,估计当在100字以上,直接以豆为部件,可算是合理的设计。但就七千多个的通用字言,豆拆分为二,则是较佳的设计,因为成字部件太多,不便于编码输入。

汉字拆分的目的一般是作为形码输入,另一个目的是笔者所强调的是将汉字解构,以求基本结构(基元)。再以豆为例,把豆分为[/][] 2部件;还是把它分为一、口、䒑 3部件,作为编码输入,都是可行的方式。但为求基元,豆一分为三是必须的,因为分后的余件都是组字频率高的基元。

 

就拆分的理念言,主要与拆分的目的相关,如果只为编码输入,一些难以拆分的字,当然可以不拆分,也可以去头摘尾,甚至以万用符号代替,都可达到目的。但若为教学着想,为了在拆分过程中学习汉字的笔序,认识汉字的基本结构,就不能这样做。以”()字为例,这是较难写的繁体字,一般以整字编码输入,不必分解。但在书写时它还得依笔序分为3个单元:中间的骨干[黽心] (),左方部件E,右方部件彐,这些也是黽字的基元。

 

另一种拆分理念不同的是部件或基元应否含义。汉字由独体的“文组成合体的“字,拆分是它的逆反过程,照理说求得含义的基元,应是拆分的理想目标。但隶变之后的汉字,在合体字中说明字理(形声或会意)比较容易;而拆分后的部件大都是独体,很难自现有字形中去说明字理(象形或指事),必须借助于古字体来作解释。如果坚持每一部件都要含义,势必增加拆分的难度,而无法拆分到末级。

另一方面,寻求含义的基元,发现同义异形的部件,不仅有利于简化编码的设计,(例如把彑/彐编为同码),更可认知字形的古今演变,对于探讨汉字的基本结构,是一项富于启发性、前瞻性的工作。因为汉字拆分的最高目标不在于编码输入,而在求取基本结构,在于从汉字解构过程中,去发现优化汉字的途径例如,如何统合“同义异形的基元,简化汉字垒床架屋式的复杂结构等。

 

1.0 拆分在理论上的相对性

  以下各节摘述一些专家关于拆分的理论,并补充笔者个人的一些看法。因部件构形不易在屏幕上显示,下文以英文字母表示部件的相对位置:=u=d=e=r,框=k,心=x,角= j,省=s…。例如 [d] 表鼠字的底部,[u] 表惠字的头部()[e]表歎字的左旁,[j]表黎字右上角(勹丿)

1. 部件的客观独立性vs.主观规定性

费锦昌先生在总结多家部件理论的基础上,针对拆分问题作了分析研究,得出了部件的定义。他认为部件是“现代汉字字形中具有独立组字能力的构字单位,它大于或等于笔画、小于或等于整字”。而笔画在满足一定条件下参与构字时,就是所谓的单笔部件。与单笔部件相对应的多笔部件即是一般意义上的部件。另外,他还提出了复合部件的概念,那是由多笔部件进一步组合而成的,可用于识字教学。例如鼻、龍()、鼓、麻…,既是部首,又可算是复合部件。

部件本身虽具有组字能力的客观独立性,却带有相当程度的主观的人为规定性,这几乎是公认的事实。费氏认为解决好部件的科学定义后,就可找到拆分原则和方法,确定部件的范围和数量。但由于众多的实践证明,笔者认为即使解决好部件的科学定义,也不易获得统一的拆分原则和方法,在本质上部件的客观独立性只是相对的,这是笔者与费氏看法不同之处。

吴铮在<从识字教学看部件拆分原则>,认为若以识字教学为目的,不应笼统

将某一原则视为首要的衡量标准,原则间存在着相互制约的关系,必须具体的

确定各原则的适用范围。

晓东先生则认为:“相对独立性是部件的基本特征,具体表现在通用性、不可分割性和部件间有分割沟这些特点上”。依笔者的解释:所谓通用性,即具有组字的能力,可与他字匹配。所谓不可分割性,即认为它是基础部件,不宜再行拆分。而所谓部件间分割沟,指的可能是在汉字构形上显示的自然界限。然而这三个所谓部件特征”,都是人为规定的部件性质”也可能因设计者而异,并不是绝对的。换言之,下了部件的定义之后,仍难有一致的拆分方式及成果。以下的讨论就可证明此点。

 

2. 交重结构应否拆分

专家们大多认为交重结构不应拆分, 例如潘德孚先生认为:“交叉结构、包

围结构都是汉字的基本结构,基本结构若加以拆分,会有多种拆法,不符合汉字的结构规律”。GF 3001规范5.1也是如此规定。笔者以为对这问题不妨作反向思考:如果不拆分,会导致什么结果?以GF规范所列部件为例,笔者认为可拆分的部件就有如下46个:旡、禸、冘、夬、毋、内、丹、妻u、冉、央、史、册、斥、庚d、曳、弗、母、夷、单d、舟、聿、兼d、華d、更、里、束、東、朿、事、果、垂、秉、臾、庸d、惠u、革、柬、禺、重、鬼、禹、畢、歎e、象、黑、熏。

如果单笔相交也不拆分的话,更增加了如下13个成字部件:孓、中、巿、尹、吊、未、末、本、世、申、甲、电、吏。

这就说明了GF-3001规范的设想虽好,却无实用价值,因为清单内共有560个部件,实在是太多了。

当然“可不可”拆分与“要不要”拆分是两回事,有的字虽可拆分,但为着别方面的考量,也可以不予拆分,拆分与否也是相对的。

笔者认为在一定条件下,交重结构可以拆分其一,可依照部件顺序分解的,

则下列部件就可拆开:禸、夬、毋、内、冉、央、史、册、斥、庚d、母、单d、舟、聿、兼d、華d、更、里、事、臾、庸d、惠u、革、禺、禹、畢、歎e象、黑、熏。其二,有字理可依的,则交夹结构的部件如:夷、束、東、朿、秉、柬,亦可拆开。

成字部件由于只构成本字,实际上失去了部件作为构字单位的意义。多笔画的成字部件太多,不便于记忆,也不利于编码输入。

 

3. 单笔应否拆出

基本笔画 横、竖、撇、点、折 应可作为部件之一,几乎已成为定论。但专

家们的意见,也并非完全一致。如“示”、“亍”的拆分。苏培成和晓东先生以成字优先原则拆分为[二、小][一、丁];“云”拆分为[二、厶]。傅永和先生则以“云”有明显的分割沟,而拆成为[] [一厶]

由于不考虑分割沟,费氏对含“一”的字,有的视为“字”作了拆分,如“韭”字;有的视为相接的笔画不作拆分,如“丽”字。 据统计,横笔在

<辞海> 的正体字中出现频度最高,约为30%。笔者认为在拆分作业上,单笔画“一”不宜有两属性,原则上均可拆分。至于能否拆分,得视分后余件能否成字或可否与他字匹配。尽可能将“一”从字中拆分出来,这样可以增加“多笔部件”的统字率。

在通常情况下,人们认为点画在字中的作用和地位都不能算做部件。但是仍然有相当一部分字中的点画,看起来与其它部件的作用相当,如勺、玉、主、太、犬、户 等字。在费氏的拆分理论中不排除点画的拆分。而容许拆分也造成了新的问题,即拆分后所得的部件构形完全相同,如太/犬拆分后同为[大丶],玉/主拆分后同为[王丶],己//巳拆分后同为[u],从而使不少字的区别在部件这一层次很难体现。笔者认为要不要拆分,其重点不在于此,只要它们的区别性可体现在这一层次就可以了。

 

另外,与苏培成先生一样,晓东先生也没有对二字作拆分。这可能是因为他们都把两字的下半部作为点画来看待。笔者认为,乒、乓二字的下半部应可视为撇笔及捺笔的变形,他们在结构模式上与兵、岳二字具有明显的相似性,对他们作拆分符合字形结构和人们的心理习惯。

倘若单笔画不能作为部件,则下列各字(举例):乱、虬、扎、礼、氕、旧、轧、幻、已币、卫、个、乳、乒、乓、再…,都变成了成字部件。这个例子说明在一定条件下,把单笔画当作部件拆分,对于编码输入有利。重要的是单笔部件应给予某些限制。例如,费氏在他的拆分理论中规定每次拆分只能有一个“单笔部件”,并且每次拆分后都应包含“多笔部件”,这些原则值得大家借鉴。

再如有些限制的规定也是可以参考的:对离接单笔部件作拆分,应保证拆分后的多笔部件成字或具有较强的通用性,如字,拆分后的多笔部件是。又如字,拆分后的几个部件都是整字。而如字,其中的笔画块不成字也不具有通用性,故不作拆分。

又如在一分为二”拆出的两个部件中,务必至少有一个是部首或成字的前提下,才能进行,如:良[],亚[-业]。否则不拆分,如:为、甫 等字。要之,笔者认为基本笔画 横、竖、撇、点()、折 都可作为部件之一,在一定条件及限制下,都可拆分。而所谓“有条件的拆分,各家的具体规定不同,也显示了拆分规则的相对性。

 

4. 多笔部件的拆分问题

多笔部件有些笔画过多。如 鼠、熏、曾、黑、惠 等字,笔画都在十画以

上。造成如此拆分结果的原因是部件内部的组成具有唯一性。将他们拆分出来与不作拆分,并不减少部件总数。但人的短时记忆一般以七个单位为限。因此从识字教学的角度看,如果拆出的部件本身笔画繁多,识记较为困难,并不是一件好事。

这涉及对于拆分的宽严态度,苏培成和晓东先生的理论主张用宽式拆分,即只要该字的其中一个部件具有较强的通用性,可以替换其它部件,就应对它作拆分。这样难免增加了一些通用性较弱且不成字的部件。费锦昌先生在其理论中强调了汉字部件的通用性,主张采用严式拆分,从而增加了像上例所举的一些成字部件。笔者倾向于前者,即宽式拆分,认为除了分出的部件只能与本字组字,如非、門之类外,其它应尽可能予以拆分。

有些成字部件如果本身的识记有一定困难,就很难作为构成其它汉字的基础单位。成字部件身兼成字及部件两任,如何限制成字部件数量,采用科学而简易的方法使它确定在一定数量范围之内,就显得相当重要。以[]为例,章为象形字,可分为[立早],但分为 [立日十] 可能更佳。

有人采用首尾码来定义并输入,对比较特别的汉字作了“大部件”处理,他们认为这样既可减少基本部件数目,又不会为拆分汉字而烦恼。例如: 那、制、敖、带、敢、眉、农、发等等,便可如此处理。笔者并不反对这样的输入方式,但总认为这是一种权宜之计,不足为法。何况笔者追求的是汉字的基本结构,“大部件”不是拆分的最后成果。

 

5 分割沟问题

有明显间隙的部件,可以一目了然的看出来。对那些没有明显间隙的、连接在一起构字的部件,潘氏提出隐性间隙”的概念。他认为隐性间隙符合认知心理。如示” 拆为二、小 ,人们应可接受。在二”与“小”之间,就有隐性间隙存在。此外,潘氏曾把二部件字及三部件字作过分析及统计认为有显性间隙,看去一目了然的,占部件字总数为 87%95%

他认为:有的笔画与笔画之间,虽然是彼此分隔的,但是应该算一个部件,因为它是块状”的。例如:氵、冫、丬…,这些笔画群中,存在一种内聚形式,使人觉得它们是一个块”。又如:彡、巛、二、三、川、刂 等,这些笔画群中,存在一种平行的形式,也使人觉得它们是一个块”。

其实所谓隐性间隙”也好,块状”也好,都是基于人们先入为主的认知,人们己认识了二、小,看到示”,自然而然的就认为示的部件是二、小,而非一[一小]

有人主张要注意笔画间的关系:拆分时遇到横笔与拆分后余件的横笔有长短区分时,应保证拆分前后横笔间的关系不变。这样,对示、元、云” 等字,就有了统一的拆分标准,可将他们分别拆为“二、小”;“二、儿”;“二、厶”。而对“土”和“士”这样的字,就不予拆分,以保证二者在部件这一层次上有所区别,以利于它们组合汉字时易于区别和称说。

可见在分割沟的认知上,即使是同一家,也是因为拆分的对象()不同,而难以获得一致的见解及作法。

还有人主张:无明显间缝结构的汉字,在一分为二的两个部件中,要有一个前提或条件才可拆分,即所拆出的部件一定都是固有的规范部件。前提条件限制了拆分的随意性,确保了拆出部件的规范性。例如“丙”要拆出一个成字时,只能是“内”,其余部分必定是“”,“舌”要拆出成字时,只能是“千口”。

笔者认为如果是合体字,部件间的界限较为明显,引进分割沟”的概念,来表示分界,作为拆分的一个依据,是有利无弊。但若是一个变形的独体字,例如上述的舌、丙都是象形字,不如抛弃分割沟的观念,直接从该字的构形来决定如何拆分,舌的字形显示它是由千口两成字部件组成的。这也表示拆分主要是据形,若是据义,舌是不可分的。

 

6 相似部件的认同问题

潘氏认为 [丷八][小],看起来好象两个点笔倒置,但 [] 是由一个点笔和一个撇笔构成,[] 是由一个撇笔和一个捺笔构成,完全是不同的笔形,合并不利于课堂教学,尽管字典检索中是合并的。利用字形相似合并固可减少部件总数,但部件是拼字的基本单元,一个部件要拼多个字,一个错了,就会有多个错误。郑码里的认同替代,比比皆是,例如它把“曲”,拆为“日、刂”,用“刂”替代了“〢”。它把“承”拆为“乛三水”,这样的替代,实在令人不可想象。(大意)作为拼形汉字的倡导者,潘氏反对把相似部件认同使用,是可以理解的。然而由于30多种笔画变化构成的方块汉字,如果不把相似的部件归并,则构形千形百态,驳杂繁琐,不仅不便于记忆,而且在有限的键盘字码之下,也难以有效的分配码元。这是输入操作的实际问题。正如我们把多种笔画简化为5种基本笔画一样,笔者认为相似构形的认同使用,值得肯定。现在以GF规范内的部件举例说明那些近形部件可以认同共码:

  e/七、比e/匕、报j/卩、改e/己、可k/丁、延x/止、亲d/木、带u/卅、冒u//曰、青d/月、隶u/x、電d/电、犀m/氺、西//覀、竹/⺮、

u/聿、糹/纟…。

认同使用的部件当然应编为同码,而编为同码的不仅限于此等部件,还包括繁简及异形的部首, 如 食//饣、馬/马、鳥s/s、車/车、犬/犭、水//氵、

//钅、彑/彐,这些都是合乎逻辑的,有助于字码与码元间的映射与连系。

 

7. 笔画能否切割的问题

笔者在拆分原则中曾有这样的规定:拆分要避免任意把笔画断开,或重复使用

同一笔画,这样才可保持汉字的属性(笔画数目)于不变”。其实这不仅是笔者个人的看法,台湾的编码界也几乎一样的坚持。因为顾名思义,汉字的部件”如同一部机器的构件,拆分后要保证能重装回去。若把笔画断开,等于构件上的一根螺丝断了;若重复使用一个笔画,等于多了一根螺丝,都装不回去。

兹以里”的拆分为例来说明:里曰土,或:里甲二,这样的拆分前后的笔画数目不变,部件的顺序也不变。倘若把 “里”的竖笔切断,分为田土,表面上看来好像比较符合字义,但拆分前后的笔画数不一致,无谓的增了一个竖笔。把重”拆为千里,也有同样问题,拆分的结果,改变了汉字的属性。

  网友谢君正从事 7万个汉字大字符集的研究,他遍览了大字库的所有字形,认为部件间单笔画的连接,大体可分为 延伸、粘连二种,如果甲部件的一个笔画是向乙部件延伸,只有贯穿关系,就不作共享。如果甲部件的一个笔画与乙部件的一个笔画粘连,就可以共享。例如 果、重、熏 的竖笔都属于共享,拆分时需要剪断(大意如此)

  笔者认为这是由于汉字的连笔关系,当二个独体字(田、土)组合成为合体字()时,为着字体整合而把二部件(田土)的竖笔连写,拆分时还原而把竖笔断开,似乎言之成理。但独体字的二个竖笔既已整合为一,就合体字的笔数言,只能算是一笔。汉字的笔数是汉字的重要属性之一,拆分前后保持一致,应是要点。(就像数学等号前后的数目要相符一样)。因此笔者建议如果要把笔画断开的话,不妨先作一些假定,例如把里中[]的竖笔当作虚笔”,看作是[]构件上的凹槽,可以把它嵌入[]构件的竖笔中;而计算笔数时,虚笔等于零,因此在拆分前后的笔数仍可保持不变,但这样的设想太费事了。笔者的拆分方式是:

→曰 --- 依部件次序,但容许部件 []的竖笔贯穿部件[]

[千首2] ---依部件次序,拆分前后保持9

[u] ---依部件次序,拆分前后保持12

有人质疑 [千首2] 作为部件的资格,其实这个部件的构字率不低(字频31),大家用惯了,约定俗成,也就成了部件了。路,本来是没有的,走的人多了也就成了路”(鲁迅语)

 

8. 部件与理据 

部件是否有理据,是否一定要按理据来拆分,各家的看法不同。王文生先生认为:如果部件是部首或成字,表意功能与单字的词汇意义相近,认作是传承理据,如果部件是笔画组()、或部首成字的表意功能与单字的词汇意义无关,认作是演变理据。但不是无理据。部件规范GF 3001-3.12 认为拆分有二种:有理据拆分和无理据拆分:根据结构理据所进行的部件拆分,称为有理据拆分;当无法分析理据或理据与字形发生矛盾时,依照字形所进行的部件拆分,称为无理据拆分。  笔者同意GF规范内所述的观念。问题是:碰到二者有矛盾时,该如何选择?笔者倾向于据形优先,据义其次”这个原则。汉字虽是形、音、义的三位一体,但文字是一种符号,当以形为主,形是躯体,音、义是附丽于形的。

  潘德孚先生认为应离开字义对拆分的干扰,必须把字形看成一些笔画结构符号。运用定义分解汉字,有些地方会有一些困难,例如“习”还可以再拆为[、],这些东西,拆,还是不拆?有人因此说汉字的拆分没有规律性。笔者则认为拆分的规律性是相对的,以“习”的字例言,可依折分的目的来确定拆还是不拆,习”作为编码输入的部件,以不拆为宜;而就求取汉字的基本结构(基元)言,则习”应拆为 [、冫] 2元,因为它们都是已存在的固有基元。

 

2.0.  拆分在实践上的相对性

 以下为在拆分过程中所发现的问题,有的是网友提出而自我检讨的。汇集于此,

表示汉字拆分不仅在理论上,也在实践中呈现它的相对性。一个矛盾问题的答案

并非只有一种。这是到目前为止收集的实践上的问题,日后若有新的发现,当再摘

要补充。

1. 一字要不要拆分,要怎样分法,主要是看拆分后的部件,可否与他字匹配。而

这也是由具体的个别情况来决定的。现就凹、凸字例分别讨论如次:凹繁体字中

有个次常用字(sui3)其部件是:山、隹、凹s(下缺一),因此在笔者的部件

表中,凹是拆成二个部件的:[s、一]。凸没有上述的类似情况,凸当成为独

体部件。其它类似的情形如繁体 亞 字,似乎该作为独体,但在繁体常用字

中,其部件分别是 士、冖、亞s(上缺一),因此我把 亞 拆为二元:[一、亚s]

壺的简体可拆成:[ ];亞的简体亦可拆成 [ ],而业是

独体字,拆分有一定道理,显示字简化后对于拆分带来的好处

 

2. 按形归类和按义归类有时存在一定的矛盾,难以兼顾,如何解决? 例如:攴/

/, //t, /, //卩…。笔者的建议是:

(1) 字形不同的,部件表应分列;但意义相似的可编为同码,如:彑/, //, /月,攴//夊,可编为同码。

(2) 意义虽不同,但字形不易区别的,可认同使用,如:日//u…。

 

3. 如何妥善解决一些新旧字形或字形变异的问题? 如:[]的新旧字形 /[]的新旧字形 黄/黃,还有:囱/囪、凡/卂 等字形变异问题。笔者的建议是:

 (1)字形相差较大的如:黄/黃(笔画不同)、囱/囪,宜分别拆分。

(2)字形相近的如凡/卂、及/(笔画不同,但它是不拆分的部件)可认同使用

 

4 求汉字基元,拆分时不宜为字理所限,例如卜为基元之一,由基元组成,如果考量字理,就不能拆分,势必增多基元的数量。笔者并非不注重字源或字理,那是值得讨论的另一码事。含汉字字理的单元,不一定就是基元。我们得到不含字理的基元后,可用基元组(复部件)的观念来解释字理,例如用基元 (地平线) +()来解释的字理。因此寻得汉字基元后,仍可以基元组编码输入,例如,笔者虽把拆分为二,却把足当作一个码元(基元组)来输入。

 

5. 繁简体的差异,在拆分编码过程中尽可能予以缩小,例如繁简的独体部首,如马/馬、车/车… 宜编为同码。[u] 宜与 [u] 认同使用。[d] [齿d] 也可以同码处理。

繁体的繁笔字如:黽、齊、龜在部件中固可以整字当作部件,但要寻取基元,还得把它拆开:

--- xE、彐自中而侧”的笔序拆为3 个部件

--- 亠、丫、刀、齊j、齊d 依通常笔序分为5 个部件

--- ⺈、黽x、彐、彐、己u、乂 自中而侧”的笔序拆为6 个部件

对照上述繁体的简化字 黾、齐、龟 的拆分:

--- 口电    ---亠乂[d]    --- ⺈电

显示了汉字的简化,给汉字拆分带来的便捷。事实上由众多拆分的实践可以证明:汉字字形结构的合理简化,可能是解决拆分纷歧问题的唯一途径

 

3.0  从归纳统计中拟定部件表

 

笔者在上文2.0-1节中说过:“部件本身虽具有组字能力的客观独立性,却带有相当程度的主观的人为规定性,例如2笔画成字不拆,3笔画部首不拆,便是一种人为规定。再由现有各家差异的部件表中,寻求共同的部件,应比由一家拆分而得的部件更为客观。

1. 规定的不拆部件

1). 2 画的字不拆而当作部件的:二、十、丁、七、卜、八、人、入、儿、九、匕、几、刁、了、乃、刀、力、又、乜、乂、凵、匚、厂、万,共24

2). 201部首中3画以下的部首不拆而当作部件:冂 勹 亠 冫冖 卩 厶 廴 干 工 土 廾 大 尢 寸 弋口 囗 巾 山 彳彡 夕 夂 丬广 门 宀彐 尸 己 弓 女 飞 小 子 马 幺 巛,扣除前项 2 画成字之外,净得39个。

  以上人为规定的不拆部件共计63 (24+39)

2. 从现行部件表中归纳统计得出的共同部件

由各家部件表归纳得出的共同部件:包括GF-3001规范部件、潘码、钱码、谢码、李码、大易、戴码共7家,归纳统计的部件出现3次以上者均列入考虑。

3. 由以上二项获得的综合部件共有335个。

值得一提的是前述第1项人为规定的63个部件,竟有62个包含在第2项各家共

同部件中,这表示二笔画的字不拆,以及三笔画以下的部首不拆,是各家的共识,也可以说这些笔画少或构字率高的部件,己经是汉字固有的基本结构,不劳大家再作拆分了。

4. 经过遗漏补充、以及繁简部件必须对应等必要的调整之后,共得拟定的部件合计362个,如附件。

 

4.0  基元表的拟定与本文小结

1. 拟定部件时须考量编码输入问题,例如码元数量、码长大小、字码分配等,拆分汉字时难免多所顾虑,并有一些规则与限制,例如相交的部件不可拆出单笔划等等。但在寻求基元时,主要“依笔序、可匹配” 这个原则。

2. 寻求基元的方法,是在362个部件表中,再把一部分繁笔的部件细分,摆脱字义及编码的束缚,纯粹从汉字的字形结构着手。要注意的:

  a. 基元是汉字的字母,宜在 300个左右,也就是应约等于英文字母的10倍。

  b. 基元至少要能组成两岸繁简的通用规范字,约7,000

3. 学童学习以基元为准,按基元顺序“写”字,总比依笔画写字,容易记忆,而且能在实践中逐渐认知汉字的字形结构系统。认识了300个基元,及一般笔序就可写出七千个汉字来。练习写字,像在计算机上游戏,写到正确时才在屏幕上跳出字来。用基元在计算机上“写”字,只求正确,不必求快。复杂的汉字,可能需要十多个基元才能写完。例如:

    士、冖、一、口、立d、冫、⺈、人、心 --- 9 基元,22

    - 自、田、丌、[十口]、冖、口、口、寒m、衣d --- 9基元,36

    -  e、冂、一、口、臼r、冖、木、木、大、火 ---10基元,30

4. 基元表的擬定可以帮助我们检讨現行简化字,端正原来的那种只顾减少笔画,不顾拆分方便与否的做法。例如把臨简化作“临”,把三个口,简成“二口并连

反而增加一个生疏的部件。为简化一个字,增加一个新部件,实在不上算,类似这样的字就要改进。

5. 试想若能使用统一的汉字基元,依统一的笔序,组成通用字,对于汉字教学、汉字排序、计算机编码输入,会有多大的好处!组字时字符的排列虽是二维的,但有标准的笔序,二维可以化成一维,与西文以 A,B,C 组字相若。而由字组词,汉字比西文占了优势。(3- 4千个汉字可组成数十万个词)。两相比较,汉字基元虽比罗马字母多了10倍,而汉词用字则少了60倍以上。要之,笔者以为在计算机作为书写工具之后,汉字基本结构的探讨研究,应是促使汉字继续发展的重要项目之一。

6  本文小结:笔者虽赞同GF-3001部件规范 1.1所述,拆分汉字要根据汉字的构字规律,采用“从形出发、尊重理据”的原则来制定。但该规范所制定的560个部件,数量太多,不便实用,因此建议把汉字拆分的条件放宽,例如:1).“交重”结构在某些条件下可以拆分,2).“基本笔画”在一些限制下可当作部件处理。

本文从理论上及实践上证明了:汉字的拆分具有相对性,受到许多具体的条件限制。各家取样目标不同,拆分理念有别,所构成的“部件表”明显有相当差异。即使如本文3.0所述,以统合方式求得的共同部件为基础,来构建一个新的“综合部件表”,也只能减少它们之间的差别。笔者认为这主要是汉字先天上的结构问题因此建议在汉字解构过程中,如果发现有些字确实很难处理(分解)或处理得很不理想,我们就有理由把这个字加以改造(优化)

 

附:漢字部件表362/基元表267,网页 http://chinese.exponode.com/4_4a.htm