试论部件拆分的相对性 ---汉字拆分的相对论
引言
汉字的拆分,由于如下因素,有其相对性,因而拆分后各家所得的“部件表”便有相当的差异:1).字集的大小,2).拆分的目的,3).拆分的理念及方式。
字集的大小不仅影响拆分后的部件数量,也影响拆分的方式。例如,“豆”是个部首,有完整的字义,含“豆”的字,除豆的部首属字外,还包括
登、豈(岂)、豊、戲(戏)、壹 等字属,对于5万字以上的字集言,估计当在100字以上,直接以豆为部件,可算是合理的设计。但就七千多个的通用字言,豆拆分为二,则是较佳的设计,因为成字部件太多,不便于编码输入。
汉字拆分的目的一般是作为形码输入,另一个目的是笔者所强调的是将汉字解构,以求基本结构(基元)。再以豆为例,把豆分为[一/口]、[䒑] 2部件;还是把它分为一、口、䒑 3部件,作为编码输入,都是可行的方式。但为求基元,豆一分为三是必须的,因为分后的余件都是组字频率高的基元。
就拆分的理念言,主要与拆分的目的相关,如果只为编码输入,一些难以拆分的字,当然可以不拆分,也可以去头摘尾,甚至以万用符号代替,都可达到目的。但若为教学着想,为了在拆分过程中学习汉字的笔序,认识汉字的基本结构,就不能这样做。以”黽”(黾)字为例,这是较难写的繁体字,一般以整字编码输入,不必分解。但在书写时它还得依笔序分为3个单元:中间的骨干[黽心] (),左方部件E,右方部件彐,这些也是黽字的基元。
另一种拆分理念不同的是部件或基元应否含义。汉字由独体的“文”组成合体的“字”,拆分是它的逆反过程,照理说求得含义的基元,应是拆分的理想目标。但隶变之后的汉字,在合体字中说明字理(形声或会意)比较容易;而拆分后的部件大都是独体,很难自现有字形中去说明字理(象形或指事),必须借助于古字体来作解释。如果坚持每一部件都要含义,势必增加拆分的难度,而无法拆分到末级。
另一方面,寻求含义的基元,发现同义异形的部件,不仅有利于简化编码的设计,(例如把彑/彐编为同码),更可认知字形的古今演变,对于探讨汉字的基本结构,是一项富于启发性、前瞻性的工作。因为汉字拆分的最高目标不在于编码输入,而在求取基本结构,在于从汉字解构过程中,去发现优化汉字的途径。例如,如何统合“同义异形”的基元,简化汉字”垒床架屋”式的复杂结构等。
1.0 拆分在理论上的相对性
以下各节摘述一些专家关于拆分的理论,并补充笔者个人的一些看法。因部件构形不易在屏幕上显示,下文以英文字母表示部件的相对位置:上=u,下=d,左=e,右=r,框=k,心=x,角= j,省=s…。例如 [鼠d] 表鼠字的底部,[惠u] 表惠字的头部(叀),[歎e]表歎字的左旁,[黎j]表黎字右上角(勹丿)。
1. 部件的客观独立性vs.主观规定性
费锦昌先生在总结多家部件理论的基础上,针对拆分问题作了分析研究,得出了部件的定义。他认为部件是“现代汉字字形中具有独立组字能力的构字单位,它大于或等于笔画、小于或等于整字”。而笔画在满足一定条件下参与构字时,就是所谓的单笔部件。与单笔部件相对应的多笔部件即是一般意义上的部件。另外,他还提出了复合部件的概念,那是由多笔部件进一步组合而成的,可用于识字教学。例如鼻、龍(龙)、鼓、麻…,既是部首,又可算是复合部件。
部件本身虽具有组字能力的客观独立性,却带有相当程度的主观的人为规定性,这几乎是公认的事实。费氏认为解决好部件的科学定义后,就可找到拆分原则和方法,确定部件的范围和数量。但由于众多的实践证明,笔者认为即使解决好部件的科学定义,也不易获得统一的拆分原则和方法,在本质上部件的客观独立性只是相对的,这是笔者与费氏看法不同之处。
吴铮在<从识字教学看部件拆分原则>中,认为若以识字教学为目的,不应笼统
的将某一原则视为首要的衡量标准,原则间存在着相互制约的关系,必须具体的
确定各原则的适用范围。
晓东先生则认为:“相对独立性是部件的基本特征,具体表现在通用性、不可分割性和部件间有分割沟这些特点上”。依笔者的解释:所谓通用性,即具有组字的能力,可与他字匹配。所谓不可分割性,即认为它是基础部件,不宜再行拆分。而所谓部件间分割沟,指的可能是在汉字构形上显示的自然界限。然而这三个所谓“部件特征”,都是人为规定的部件“性质”,也可能因设计者而异,并不是绝对的。换言之,下了部件的定义之后,仍难有一致的拆分方式及成果。以下的讨论就可证明此点。
2. 交重结构应否拆分
专家们大多认为交重结构不应拆分, 例如潘德孚先生认为:“交叉结构、包
围结构都是汉字的基本结构,基本结构若加以拆分,会有多种拆法,不符合汉字的结构规律”。GF 3001规范5.1也是如此规定。笔者以为对这问题不妨作反向思考:如果不拆分,会导致什么结果?以GF规范所列部件为例,笔者认为可拆分的部件就有如下46个:旡、禸、冘、夬、毋、内、丹、妻u、冉、央、史、册、斥、庚d、曳、弗、母、夷、单d、舟、聿、兼d、華d、更、里、束、東、朿、事、果、垂、秉、臾、庸d、惠u、革、柬、禺、重、鬼、禹、畢、歎e、象、黑、熏。
如果单笔相交也不拆分的话,更增加了如下13个成字部件:孓、中、巿、尹、吊、未、末、本、世、申、甲、电、吏。
这就说明了GF-3001规范的设想虽好,却无实用价值,因为清单内共有560个部件,实在是太多了。
当然“可不可”拆分与“要不要”拆分是两回事,有的字虽可拆分,但为着别方面的考量,也可以不予拆分,拆分与否也是相对的。
笔者认为在一定条件下,交重结构可以拆分。其一,可依照部件顺序分解的,
则下列部件就可拆开:禸、夬、毋、内、冉、央、史、册、斥、庚d、母、单d、舟、聿、兼d、華d、更、里、事、臾、庸d、惠u、革、禺、禹、畢、歎e象、黑、熏。其二,有字理可依的,则交夹结构的部件如:夷、束、東、朿、秉、柬,亦可拆开。
成字部件由于只构成本字,实际上失去了部件作为构字单位的意义。多笔画的成字部件太多,不便于记忆,也不利于编码输入。
3. 单笔应否拆出
基本笔画 横、竖、撇、点、折 应可作为部件之一,几乎已成为定论。但专
家们的意见,也并非完全一致。如“示”、“亍”的拆分。苏培成和晓东先生以成字优先原则拆分为[二、小],[一、丁];“云”拆分为[二、厶]。傅永和先生则以“云”有明显的分割沟,而拆成为[一]和 [一厶]。
由于不考虑分割沟,费氏对含“一”的字,有的视为“字”作了拆分,如“韭”字;有的视为相接的笔画不作拆分,如“丽”字。 据统计,横笔在
<辞海> 的正体字中出现频度最高,约为30%。笔者认为在拆分作业上,单笔画“一”不宜有两属性,原则上均可拆分。至于能否拆分,得视分后余件能否成字或可否与他字匹配。尽可能将“一”从字中拆分出来,这样可以增加“多笔部件”的统字率。
在通常情况下,人们认为点画在字中的作用和地位都不能算做部件。但是仍然有相当一部分字中的点画,看起来与其它部件的作用相当,如勺、玉、主、太、犬、户
等字。在费氏的拆分理论中不排除点画的拆分。而容许拆分也造成了新的问题,即拆分后所得的部件构形完全相同,如太/犬拆分后同为[大丶],玉/主拆分后同为[王丶],己/已/巳拆分后同为[己u乚],从而使不少字的区别在部件这一层次很难体现。笔者认为要不要拆分,其重点不在于此,只要它们的区别性可体现在“字”这一层次就可以了。
另外,与苏培成先生一样,晓东先生也没有对“乒”、“乓”二字作拆分。这可能是因为他们都把两字的下半部作为点画来看待。笔者认为,乒、乓二字的下半部应可视为撇笔及捺笔的变形,他们在结构模式上与兵、岳二字具有明显的相似性,对他们作拆分符合字形结构和人们的心理习惯。
倘若单笔画不能作为部件,则下列各字(举例):乱、虬、扎、礼、氕、旧、轧、幻、已、币、卫、个、乳、乒、乓、再…,都变成了成字部件。这个例子说明在一定条件下,把单笔画当作部件拆分,对于编码输入有利。重要的是单笔部件应给予某些限制。例如,费氏在他的拆分理论中规定每次拆分只能有一个“单笔部件”,并且每次拆分后都应包含“多笔部件”,这些原则值得大家借鉴。
再如有些限制的规定也是可以参考的:对离接单笔部件作拆分,应保证拆分后的多笔部件成字或具有较强的通用性,如“旦”字,拆分后的多笔部件是“日”。又如“亟”字,拆分后的几个部件都是整字。而如“丽”字,其中的笔画块不成字也不具有通用性,故不作拆分。
又如在“一分为二”拆出的两个部件中,务必至少有一个是部首或成字的前提下,才能进行,如:良[丶 艮],亚[-业]。否则不拆分,如:为、甫 等字。要之,笔者认为基本笔画 横、竖、撇、点(捺)、折 都可作为部件之一,在一定条件及限制下,都可拆分。而所谓“有条件”的拆分,各家的具体规定不同,也显示了拆分规则的相对性。
4. 多笔部件的拆分问题
多笔部件有些笔画过多。如 鼠、熏、曾、黑、惠
等字,笔画都在十画以
上。造成如此拆分结果的原因是部件内部的组成具有唯一性。将他们拆分出来与不作拆分,并不减少部件总数。但人的短时记忆一般以七个单位为限。因此从识字教学的角度看,如果拆出的部件本身笔画繁多,识记较为困难,并不是一件好事。
这涉及对于拆分的宽严态度,苏培成和晓东先生的理论主张用宽式拆分,即只要该字的其中一个部件具有较强的通用性,可以替换其它部件,就应对它作拆分。这样难免增加了一些通用性较弱且不成字的部件。费锦昌先生在其理论中强调了汉字部件的通用性,主张采用严式拆分,从而增加了像上例所举的一些成字部件。笔者倾向于前者,即宽式拆分,认为除了分出的部件只能与本字组字,如非、門之类外,其它应尽可能予以拆分。
有些成字部件如果本身的识记有一定困难,就很难作为构成其它汉字的基础单位。成字部件身兼成字及部件两任,如何限制成字部件数量,采用科学而简易的方法使它确定在一定数量范围之内,就显得相当重要。以[章]为例,章为象形字,可分为[立早],但分为 [立日十] 可能更佳。
有人采用首尾码来定义并输入,对比较特别的汉字作了“大部件”处理,他们认为这样既可减少基本部件数目,又不会为拆分汉字而烦恼。例如: 那、制、敖、带、敢、眉、农、发等等,便可如此处理。笔者并不反对这样的输入方式,但总认为这是一种权宜之计,不足为法。何况笔者追求的是汉字的基本结构,“大部件”不是拆分的最后成果。
5 分割沟问题
有明显间隙的部件,可以一目了然的看出来。对那些没有明显间隙的、连接在一起构字的部件,潘氏提出“隐性间隙”的概念。他认为隐性间隙符合认知心理。如“示” 拆为二、小 ,人们应可接受。在“二”与“小”之间,就有隐性间隙存在。此外,潘氏曾把二部件字及三部件字作过分析及统计认为有显性间隙,看去一目了然的,占部件字总数为 87%及95%。
他认为:有的笔画与笔画之间,虽然是彼此分隔的,但是应该算一个部件,因为它是“块状”的。例如:氵、冫、丬…,这些笔画群中,存在一种内聚形式,使人觉得它们是一个“块”。又如:彡、巛、二、三、川、刂 等,这些笔画群中,存在一种平行的形式,也使人觉得它们是一个“块”。
其实所谓“隐性间隙”也好,“块状”也好,都是基于人们先入为主的认知,人们己认识了二、小,看到“示”,自然而然的就认为示的部件是二、小,而非一[一小]。
有人主张要注意笔画间的关系:拆分时遇到横笔与拆分后余件的横笔有长短区分时,应保证拆分前后横笔间的关系不变。这样,对“示、元、云” 等字,就有了统一的拆分标准,可将他们分别拆为“二、小”;“二、儿”;“二、厶”。而对“土”和“士”这样的字,就不予拆分,以保证二者在部件这一层次上有所区别,以利于它们组合汉字时易于区别和称说。
可见在分割沟的认知上,即使是同一家,也是因为拆分的对象(字)不同,而难以获得一致的见解及作法。
还有人主张:无明显间缝结构的汉字,在一分为二的两个部件中,要有一个前提或条件才可拆分,即所拆出的部件一定都是固有的规范部件。前提条件限制了拆分的随意性,确保了拆出部件的规范性。例如“丙”要拆出一个成字时,只能是“内”,其余部分必定是“一”,“舌”要拆出成字时,只能是“千口”。
笔者认为如果是合体字,部件间的界限较为明显,引进“分割沟”的概念,来表示分界,作为拆分的一个依据,是有利无弊。但若是一个变形的独体字,例如上述的舌、丙都是象形字,不如抛弃分割沟的观念,直接从该字的构形来决定如何拆分,舌的字形显示它是由千口两成字部件组成的。这也表示拆分主要是据形,若是据义,舌是不可分的。
6 相似部件的认同问题
潘氏认为 [丷八]、[小],看起来好象两个点笔倒置,但 [丷] 是由一个点笔和一个撇笔构成,[八] 是由一个撇笔和一个捺笔构成,完全是不同的笔形,合并不利于课堂教学,尽管字典检索中是合并的。利用字形相似合并固可减少部件总数,但部件是拼字的基本单元,一个部件要拼多个字,一个错了,就会有多个错误。郑码里的认同替代,比比皆是,例如它把“曲”,拆为“日、刂”,用“刂”替代了“〢”。它把“承”拆为“乛三水”,这样的替代,实在令人不可想象。(大意)作为拼形汉字的倡导者,潘氏反对把相似部件认同使用,是可以理解的。然而由于30多种笔画变化构成的方块汉字,如果不把相似的部件归并,则构形千形百态,驳杂繁琐,不仅不便于记忆,而且在有限的键盘字码之下,也难以有效的分配码元。这是输入操作的实际问题。正如我们把多种笔画简化为5种基本笔画一样,笔者认为相似构形的认同使用,值得肯定。现在以GF规范内的部件举例说明那些近形部件可以认同共码:
切e/七、比e/匕、报j/卩、改e/己、可k/丁、延x/止、亲d/木、带u/卅、冒u/日/曰、青d/月、隶u/唐x、電d/电、犀m/氺、西/襾/覀、竹/⺮、
書u/聿、糹/纟…。
认同使用的部件当然应编为同码,而编为同码的不仅限于此等部件,还包括繁简及异形的部首, 如 食/飠/饣、馬/马、鳥s/鸟s、車/车、犬/犭、水/氺/氵、
金/釒/钅、彑/彐,这些都是合乎逻辑的,有助于字码与码元间的映射与连系。
7. 笔画能否切割的问题
笔者在拆分原则中曾有这样的规定:“拆分要避免任意把笔画断开,或重复使用
同一笔画,这样才可保持汉字的属性(笔画数目)于不变”。其实这不仅是笔者个人的看法,台湾的编码界也几乎一样的坚持。因为顾名思义,汉字的“部件”如同一部机器的构件,拆分后要保证能重装回去。若把笔画断开,等于构件上的一根螺丝断了;若重复使用一个笔画,等于多了一根螺丝,都装不回去。
兹以“里”的拆分为例来说明:里→曰土,或:里→甲二,这样的拆分前后的笔画数目不变,部件的顺序也不变。倘若把 “里”的竖笔切断,分为田土,表面上看来好像比较符合字义,但拆分前后的笔画数不一致,无谓的增了一个竖笔。把“重”拆为千里,也有同样问题,拆分的结果,改变了汉字的属性。
网友谢君正从事 7万个汉字大字符集的研究,他遍览了大字库的所有字形,认为部件间单笔画的连接,大体可分为
延伸、粘连二种,如果甲部件的一个笔画是向乙部件延伸,只有贯穿关系,就不作共享。如果甲部件的一个笔画与乙部件的一个笔画粘连,就可以共享。例如 果、重、熏 的竖笔都属于共享,拆分时需要剪断(大意如此)。
笔者认为这是由于汉字的连笔关系,当二个独体字(田、土)组合成为合体字(里)时,为着字体整合而把二部件(田土)的竖笔连写,拆分时还原而把竖笔断开,似乎言之成理。但独体字的二个竖笔既已整合为一,就合体字的笔数言,只能算是一笔。汉字的笔数是汉字的重要属性之一,拆分前后保持一致,应是要点。(就像数学等号前后的数目要相符一样)。因此笔者建议如果要把笔画断开的话,不妨先作一些假定,例如把里中[田]的竖笔当作“虚笔”,看作是[田]构件上的凹槽,可以把它嵌入[土]构件的竖笔中;而计算笔数时,虚笔等于零,因此在拆分前后的笔数仍可保持不变,但这样的设想太费事了。笔者的拆分方式是:
里→曰 土 --- 依部件次序,但容许部件 [土]的竖笔贯穿部件[曰]
重→[千首2笔] 曰 土 ---依部件次序,拆分前后保持9笔
黑→[黑u] 土 灬 ---依部件次序,拆分前后保持12笔
有人质疑 [千首2] 作为部件的资格,其实这个部件的构字率不低(字频31),大家用惯了,约定俗成,也就成了部件了。“路,本来是没有的,走的人多了也就成了路”(鲁迅语)。
8. 部件与理据
部件是否有理据,是否一定要按理据来拆分,各家的看法不同。王文生先生认为:如果部件是部首或成字,表意功能与单字的词汇意义相近,认作是传承理据,如果部件是笔画组(块)、或部首成字的表意功能与单字的词汇意义无关,认作是演变理据。但不是无理据。部件规范GF 3001-3.12 认为拆分有二种:有理据拆分和无理据拆分:根据结构理据所进行的部件拆分,称为有理据拆分;当无法分析理据或理据与字形发生矛盾时,依照字形所进行的部件拆分,称为无理据拆分。 笔者同意GF规范内所述的观念。问题是:碰到二者有矛盾时,该如何选择?笔者倾向于“据形优先,据义其次”这个原则。汉字虽是形、音、义的三位一体,但文字是一种符号,当以形为主,形是躯体,音、义是附丽于形的。
潘德孚先生认为应离开字义对拆分的干扰,必须把字形看成一些笔画结构符号。运用定义分解汉字,有些地方会有一些困难,例如“习”还可以再拆为[、冫],这些东西,拆,还是不拆?有人因此说汉字的拆分没有规律性。笔者则认为拆分的规律性是相对的,以“习”的字例言,可依折分的目的来确定拆还是不拆,“习”作为编码输入的部件,以不拆为宜;而就求取汉字的基本结构(基元)言,则“习”应拆为 [、冫] 2元,因为它们都是已存在的固有基元。
2.0. 拆分在实践上的相对性
以下为在拆分过程中所发现的问题,有的是网友提出而自我检讨的。汇集于此,
表示汉字拆分,不仅在理论上,也在实践中呈现它的相对性。一个矛盾问题的答案
并非只有一种。这是到目前为止收集的实践上的问题,日后若有新的发现,当再摘
要补充。
1. 一字要不要拆分,要怎样分法,主要是看拆分后的部件,可否与他字匹配。而
这也是由具体的个别情况来决定的。现就凹、凸字例分别讨论如次:凹,繁体字中
有个次常用字“嶲”(sui3)其部件是:山、隹、凹s(下缺一),因此在笔者的部件
表中,凹是拆成二个部件的:[凹s、一]。凸,没有上述的类似情况,凸当成为独
体部件。其它类似的情形如繁体
亞 字,似乎该作为独体,但在繁体常用字“壺”
中,其部件分别是
士、冖、亞s(上缺一),因此我把 亞 拆为二元:[一、亚s]。
壺的简体“壶”可拆成:[士 冖 业];亞的简体“亚”亦可拆成 [一 业],而业是
独体字,拆分有一定道理,显示“亞”字简化后对于拆分带来的好处。
2. 按形归类和按义归类有时存在一定的矛盾,难以兼顾,如何解决? 例如:攴/
攵/夊, 日/曰/冒t, 肉/月, 耳/阝/卩…。笔者的建议是:
(1) 字形不同的,部件表应分列;但意义相似的可编为同码,如:彑/彐, 耳/阝/卩, 肉/月,攴/攵/夊,可编为同码。
(2) 意义虽不同,但字形不易区别的,可认同使用,如:日/曰/冒u…。
3. 如何妥善解决一些新旧字形或字形变异的问题? 如:[及]的新旧字形 及/及,[黄]的新旧字形 黄/黃,还有:囱/囪、凡/卂 等字形变异问题。笔者的建议是:
(1)字形相差较大的如:黄/黃(笔画不同)、囱/囪,宜分别拆分。
(2)字形相近的如凡/卂、及/及(笔画不同,但它是不拆分的部件)可认同使用。
4 求汉字基元,拆分时不宜为字理所限,例如卜为基元之一,“下”由基元“一”及“卜”组成,如果考量字理,“下”就不能拆分,势必增多基元的数量。笔者并非不注重字源或字理,那是值得讨论的另一码事。含有汉字字理的单元,不一定就是基元。我们得到不含字理的基元后,可用“基元组”(复部件)的观念来解释字理,例如用基元“一” (地平线) +“卜”(人)来解释“下”的字理。因此寻得汉字基元后,仍可以“基元组”编码输入,例如,笔者虽把“足”拆分为二,却把足当作一个码元(基元组)来输入。
5. 繁简体的差异,在拆分编码过程中尽可能予以缩小,例如繁简的独体部首,如马/馬、车/车… 宜编为同码。[帶u] 宜与 [带u] 认同使用。[齒d] 与 [齿d] 也可以同码处理。
繁体中的繁笔字如:黽、齊、龜在部件中固可以整字当作部件,但要寻取基元,还得把它拆开:
黽 --- 黽x、E、彐,依“自中而侧”的笔序拆为3 个部件
齊 --- 亠、丫、刀、齊j、齊d ,依通常笔序分为5 个部件
龜 --- ⺈、黽x、彐、彐、己u、乂 ,依“自中而侧”的笔序拆为6 个部件
对照上述繁体的简化字 黾、齐、龟 的拆分:
黾 --- 口电 齐 ---亠乂[介d] 龟 --- ⺈电
显示了汉字的简化,给汉字拆分带来的便捷。事实上由众多拆分的实践可以证明:汉字字形结构的合理简化,可能是解决拆分纷歧问题的唯一途径。
3.0 从归纳统计中拟定部件表
笔者在上文2.0-1节中说过:“部件本身虽具有组字能力的客观独立性,却带有相当程度的主观的人为规定性”,例如2笔画成字不拆,3笔画部首不拆,便是一种人为规定。再由现有各家差异的部件表中,寻求共同的部件,应比由一家拆分而得的部件更为客观。
1. 规定的不拆部件
1). 2 画的字不拆而当作部件的:二、十、丁、七、卜、八、人、入、儿、九、匕、几、刁、了、乃、刀、力、又、乜、乂、凵、匚、厂、万,共24个
2). 201部首中3画以下的部首不拆而当作部件:冂 勹 亠 冫冖 卩 厶 廴 干 工 土 廾 大 尢 寸 弋口 囗 巾 山 彳彡 夕 夂 丬广 门 宀彐 尸 己 弓
女 飞 小 子 马 幺 巛,扣除前项 2 画成字之外,净得39个。
以上人为规定的不拆部件共计63个 (24+39)。
2. 从现行部件表中归纳统计得出的共同部件
由各家部件表归纳得出的共同部件:包括GF-3001规范部件、潘码、钱码、谢码、李码、大易、戴码共7家,归纳统计的部件出现3次以上者均列入考虑。
3. 由以上二项获得的综合部件共有335个。
值得一提的是前述第1项人为规定的63个部件,竟有62个包含在第2项各家共
同部件中,这表示二笔画的字不拆,以及三笔画以下的部首不拆,是各家的共识,也可以说这些笔画少或构字率高的部件,己经是汉字固有的基本结构,不劳大家再作拆分了。
4. 经过遗漏补充、以及繁简部件必须对应等必要的调整之后,共得拟定的部件合计362个,如附件。
4.0 基元表的拟定与本文小结
1. 拟定部件时须考量编码输入问题,例如码元数量、码长大小、字码分配等,拆分汉字时难免多所顾虑,并有一些规则与限制,例如相交的部件不可拆出单笔划等等。但在寻求基元时,主要“依笔序、可匹配”
这个原则。
2. 寻求基元的方法,是在362个部件表中,再把一部分繁笔的部件细分,摆脱字义及编码的束缚,纯粹从汉字的字形结构着手。要注意的:
a. 基元是汉字的字母,宜在 300个左右,也就是应约等于英文字母的10倍。
b. 基元至少要能组成两岸繁简的通用规范字,约7,000个。
3. 学童学习以基元为准,按基元顺序“写”字,总比依笔画写字,容易记忆,而且能在实践中逐渐认知汉字的字形结构系统。认识了300个基元,及一般笔序就可写出七千个汉字来。练习写字,像在计算机上游戏,写到正确时才在屏幕上跳出字来。用基元在计算机上“写”字,只求正确,不必求快。复杂的汉字,可能需要十多个基元才能写完。例如:
懿 –士、冖、一、口、立d、冫、⺈、人、心 --- 9 基元,22笔
齉 - 自、田、丌、[十口]、冖、口、口、寒m、衣d --- 9基元,36笔
爨 - 臼e、冂、一、口、臼r、冖、木、木、大、火 ---10基元,30笔
4. 基元表的擬定可以帮助我们检讨現行简化字,端正原来的那种只顾减少笔画,不顾拆分方便与否的做法。例如把臨简化作“临”,把三个口,简成“二口并连”
反而增加一个生疏的部件。为简化一个字,增加一个新部件,实在不上算,类似这样的字就要改进。
5. 试想若能使用统一的汉字基元,依统一的笔序,组成通用字,对于汉字教学、汉字排序、计算机编码输入,会有多大的好处!组字时字符的排列虽是二维的,但有标准的笔序,二维可以化成一维,与西文以 A,B,C 组字相若。而由字组词,汉字比西文占了优势。(3- 4千个汉字可组成数十万个词)。两相比较,汉字基元虽比罗马字母多了10倍,而汉词用字则少了60倍以上。要之,笔者以为在计算机作为书写工具之后,汉字基本结构的探讨研究,应是促使汉字继续发展的重要项目之一。
6 本文小结:笔者虽赞同GF-3001部件规范 1.1所述,拆分汉字要根据汉字的构字规律,采用“从形出发、尊重理据”的原则来制定。但该规范所制定的560个部件,数量太多,不便实用,因此建议把汉字拆分的条件放宽,例如:1).“交重”结构在某些条件下可以拆分,2).“基本笔画”在一些限制下可当作部件处理。
本文从理论上及实践上证明了:汉字的拆分具有相对性,受到许多具体的条件限制。各家取样目标不同,拆分理念有别,所构成的“部件表”明显有相当差异。即使如本文3.0所述,以统合方式求得的共同部件为基础,来构建一个新的“综合部件表”,也只能减少它们之间的差别。笔者认为这主要是汉字先天上的结构问题。因此建议在汉字解构过程中,如果发现有些字确实很难处理(分解)或处理得很不理想,我们就有理由把这个字加以改造(优化)。
附:漢字部件表362/基元表267,网页 http://chinese.exponode.com/4_4a.htm