试为异体字字形分组归类
1.0 引言
台湾教育部出版的<异体字字典>(2004第五版)收字106,230字,以收录棣定、楷化后的字形为主。其中正体 29,892个,异体字76,338个,异体占了 72%。
文献上充斥着如此巨量的异体字,反映了汉字形体孳乳流变与旁歧的情况,十分严重。从甲金文起就有不少 ”一字多形” 的例子,棣变、楷化之后,纷歧繁衍更多。这现象使阅读古籍者感到困扰,并造成文化信息传承的障碍。
日前笔者浏览该
<异体字字典> 时,发现一个可以简省字形统计的方式:即在一群异体字中,可依字形的 ”类似度”,分成数组。每一组用1个异体字作代表;其它类形的字就当作该异体字的”异写”,
而可忽略不计。如此挑选出来的异体字较具代表性;而字量亦可缩至3万字以下,有利于对异体字作进一步的抽样研究。
本文乃从该字典的异体字中,抽举少数字例,尝试为异体字”分组归类”。这种方法是否适当,请大家给予批评指教。
2.0 异体字概说
所谓异体是相对于正体而言,在一个正字标准下,文献上与此正字同音同义而形体有异的字,谓之异体字。正字是造字构形的产物,原则上皆有理据可以解释;异体则多来自构形或书写的变异,并非全有理据。
造成大量异体字的原因,约有如下数端:
1. 造字的时间、地点不同,有的是古代留传下来的,如”禮”是篆书,”礼”是古文。
2. 为的更好的表音或表义,如汉作 ”絝”,而后作 ”袴”,今作 ”裤”。
3. 由简化而产生,如糉简作粽,筍简作笋。
4. 形符、声符的简化或繁化,例如从衣的[褓],说文原从纟部。
5. 形符、声符位置变换,如熹/熺,峰/峯、蹴/蹵、蛾/䖸…。
6. 笔划书写的各式变化,这里面包括了不少错别字的约定俗成。
就笔划的变化来说,有的由于书写工具的不同,如纸面挥毫或碑上刀刻,笔形自然有差。有的由于文献作者或传录人的笔误,或书法家的艺术创作。还有因对帝皇或尊长避讳而成的”缺笔”字。例如避宋
”赵玄朗”之讳,朗作;孔丘之讳,丘作。这是封建时代尊君敬贤的表示,无可厚非;但在现代人看来,这是对汉字的宰割,不值得传承。
汉字历史悠久,孳乳变异累积起来,就十分可观了。
与正体词义比较,异体字大概可分为:
1). 全同异体,正、异体词义全同,犹如二个大小相等的同心圆迭合,正体可取代异体。
2). 包孕异体,正体词义含盖了异体,犹如一个大圆内含了一个小圆,正体亦可取代异体。
3). 交叉异体,二者只有部分词义相通,犹如二圆交叉,交叉部分词义相同。视情况而定,一般是无法取代
但异体的观念是相对的,可能因时因地而异,上述分类并非固定不变,在汉字流传应用过程中,有些全等异体可能变成交叉异体。此项词义的衍变,在考订古籍时要格外留意。
3.0 异构与异写
在一群异体字中,可依字形结构的 ”类似度”,分成数组。例如,[叟]的异体字共有24个,可分成如下8组 (参见3.1表):
1). 从 [臼又] 的5字
2). 从 [申又] 的3字
3). 从 [火又] 的5字
4). 从 [亻火又] 的2字
5). 从 [白反] 的4字
6). 从 [火夕] 的 3 字
7) 从 [火寸] 的3字
8). 从 [宀火] 的1字
每组用一个异体字来代表它的构形;不同的组有不同的构形。组内附属的字,谓之异写字。换言之,甲组与乙组间的差异是构形(异构),而组内各字的微差是异写。
以下就台版<异体字字典>中的一些字例,来说明如何为异体字分组。
3.1 叟 的异体分组
A00477
【叟】 |
异 |
1傁2 3 4 5 (从臼又,臼有微变) 6 7 8 (从申又) 9 叜10 11 (从宀火又,火有微变) 12 13 (从亻宀火又) 14 15 16 17 (从亻白反,白微变为自) 18 19 20 (从宀火夕,火形有微变) 21 22 23 (从宀火寸,火形有微变) 24 (从宀火火) |
[叟],说文作叜,在室(宀)内手(又)持火,本义为搜。火代表权力,古代家中执火的人都是老者,故叟表老人。异体傁则加人旁表示此意。
如上所述,[叟]的异体可分为如下8组,每一组指定一个异体字为代表,其它类型的异体则称为该字的异写:
1 傁,(五经文字);上表编号[2-5]为[1]号的异写。
9 叜,(说文,又部);编号[10-11]为它的异写。
统计 [叟]的异体8,异写16。
3.2 不 的异体分组
A00010
【不】 |
异 |
1 2 3 4 5 (不的异写) 6 (从一丷不) 7 8 (从八个) 9 (从亠丫冂) 10 (从𠫔小) 11 (从𠫔丩乚) 12 (从木) 13 从冖几) |
上表编号 [1-5],均与正体[不]类型,可称为[不]的异写字。
统计 [不] 的异体 7,异写6 。
3.3 陽的异体分组
陽,高明也,从阜,昜声 (说文)。昜,同陽 (汉语大字典)。
4阳,陽异体 (字学三正),兼简化字正体;[5]为其异写。
6氜,陽异体 (正字通)
7阦,陽异体 (字汇);[8] 为其异写。
[9-14] ,为[陽]的异写。
统计 [陽]异体5,异写10。
3.4 坡 的异体分组
坡,阪也。从土皮声 (说文),地势倾斜之地。
2 ,坡的异体 (集韵);声符叵取代了皮。[3] 是异写,偏旁换位。
4 岥,坡异体(集韵),另兼正字。
统计坡的异体3,异写1。
3.5 菅 的异体分组
A03500
【菅】 |
异 |
1 2 3 4 |
菅,禾本科植物,比喻轻贱,如”草菅人命”。
[3] 、[4] 为菅的异写。(与正体构形相似,只部件不同:以冖代宀; 以艸代艹)
统计[菅]的异体1,异写3
3.6 聘 的异体分组
A03271
【聘】 |
异 |
5 从耳臼丂 |
聘,访也。从耳甹声 (说文)
[5] 为正体[聘]的异写。
统计[聘]的异体7,异写7
3.7 天 的异体分组
A00849
【天】 |
异 |
1 从丆冂 2 从兀冂 3 4 5 6 7 从兀 8 从冖儿 9 从一先 10 从入人 11 12 13兲14 15 从八 1617 18 从大 19 从日⺇ 20 21 22 从艹曳 23靝 从青气 2425 从青无 |
天,顚也。至高无上,从一大 (说文)
1 ,同天(唐岱岳观碑)。上表编号 [2]为它的异写。
2 ,同天 (五雜組)
3 ,为「天」之古文 (正字通)。编号
[4-7]为它的异写。
8 ,天異體,(字彙補)
16 ,甲骨文天作 ,楷化作,编号 [17-18]为它的异写。
20 ,古文天字 (玉篇,艹部)。编号 [21-22]为异写。
统计 [天]的异体12,异写13。
各字均有所本,惟字理大都难解,例如 ”天” 为何从艹曳?
3.8 土 的异体分组
编号 [1-3],为正体[土]的异写
编号4 [士],为[土]的异体,但本身兼作正字。编号 [5]为士的异写
统计 [土]的异体、兼正体1,异写4。
[士]既已作为正字,且字义与土有别,似不必再归入土的异体内。
3.9 個 的异体分组
1[个],是[個]的异体,兼简化字正体。编号[2-3]是 [个] 的异写。
编号 [5-6],[個]的异写。
7[箇]:[個]的异体,本身兼作正字
统计 [個]的异体3,异写4
3.10 爾 的异体分组
爾,汝也 (玉篇)
12尔,爾异体(金石文字辨异),兼简化字正体。编号 [13-14]为它的异写。
15,爾异体 (汉隶字源),编号 [16-17]为它的异写。
统计[爾]的异体7,异写13
3.11 照 的异体分组
A02424 【照】 |
异 |
1 炤 2 3 4 5 6 78 9 (大,火讹变) 10111213 14 (目,日讹变) 15 16燳 17 18 19 20曌21 2223 (字, 空訛變) 24瞾25 262728 29 30 |
照,明也,从火昭声 (说文)
1 炤,昭异体,兼正体( 重订直音篇 );上表编号[2]为它的异写。
上表编号[10-14] 均为照的异写字。
20曌,照的异体 (集韻),另兼正體;编号 [21-23]为它的异写
24瞾,照异体(正字通);编号[25-28]为它的异写。
统计[照]异体 11 ,异写 19
4.0 台版<异体字字典>简介
台湾2001年初版的<异体字字典>,其正字标准主要是依据台湾教育部于1982年起颁布的常用、次常用、罕用三个字表,及 CNS11643码本内字形。收录的异体字是以文献上己隶变或楷定的字形为主。基本使用的文献约可分为如下12类:
01说文类,02古文字,03简牍类,04隶书类,05碑刻类,06书帖类,
07字书类,08韵书类,09字样书,10俗字谱,11佛经,12现代字书。
编辑所参考书籍包括 经、史、子、集 四大类共1442种。
2004年五版字典收录了异体字76,338字,相较于大陆戴召萃主编的<异体字典>,只收异体字3000多个,确实齐全许多。(就笔者所知<汉语大字典>收字54,678内含盖1万多个异体字,李圃主编的<异体字典>收入不少古文字异体;不知近年来大陆专为异体字出版的字典还有那些?)
对于台版<异体字字典>,学者公认的优点为:
a). 收字最多,方言俗体并录,每字均注明来源依据。
b). 径就文献取形,以正字领属异体的方式编排,便于正、异体对照。
c). 编辑成果以网页显示,有利大众检索。网页 http://140.111.1.40/main.htm
但笔者认为该字典亦有待完善之处:
a).扫描字形欠美观,图片处理须改进。(第六版异体字形已改为宋体模式)
b).把简化字当作异体处理,在两岸规范字未统合之前,两岸互视对方为异体,固然是事实;但编辑字典是两岸共用的,两岸现行的规范字都要以正体看待才比較合理。
5.0 异体字处理随想
1. 异体字主要用于考订文献、整理古籍。个人认为除了一套存真的善本及字书须保留异体字外,所有出版的古籍,应尽可能以正字取代。全同异体及包孕异体,不必说了;即使
”交叉异体”也要作适当的处理,即:正、异体词义相通的,自可以正体取代;异体词义没有正字可概括的,该字即须扶正升格,作正字使用。
2. 从古至今累积的异体字资料,是汉字字形孳乳演变的纪录,是研究汉字历史发展的一个重要资源。字形演变有成例可追循者,须作系统性的归纳分析,以明字形流变的轨迹。
3. 流行的未必都好,好的未必都流行,世事如此,文字也是一样 。现行的规范字,还有一些构形过于繁复的,不妨从异体中得到启示,选取简单妥适的字来取代它,以下只举3个例子,相信还有不少异体字,比现行规范字易学易用。
a. 囊(22笔,襄省声)的异体共有30个,较简的合理字形为 [/冖/龷/𧘇],15笔;另一异体为 [/冖/表],15笔,引自<碑别字新编>及<中华字海>。笔者认为该字还可省作 [/冖/衣],13笔,从衣,以便归部。
b. 龠(17笔),异体4个,最简的为 [/⺍/𠕁],11笔,字见<中文大辞典>人部,建议采用之。
c.鼎(13笔),异体42个,以[目/爿片]变形最少,且可拆分,字见<精严新集大藏音>片部。
4. 形、音、义是汉字的一体三面,作为讯息的载体或符号,最理想的状态是一形一音一义。实际上这很难做到,多音字是一形多音,同音字是一音多形,这且不谈。多义字是一形多义,通常也是多音,而以音辨义。异体字则是一义多形,不仅违背了符号的唯一性,而且浪费了文字资源,增加阅读困难。因此,异体字除前述功能而需保留于古籍善本、字典、字书之外,应排斥于正式出版物之中。
5. 异体可分为合乎六书原则而滋生发展者,或不合六书原则而书写递变者。前者是造字的产物,可称为异构字;后者是构形或书写的变化,可称为异写字。
本文尝试把异体字分组归类,把类形的字,以一个异体字作代表,意在浓缩异体字量,便于抽样作进一步探究,(诸如异体字的结构分析及部件统计等等)。否则,面对如此海量(76,000)的异体字,必令人望洋兴叹而却步矣。
附 錄
1. <异体字字典>第六版试用版问世
最近(2012年8 月)台湾<异体字字典>第六版试用版问世。与旧版不同之处有三:
1).正字及若干异体字内码使用 Unicode。
2) 异体字字形采用宋体字形,比前版美观。
3).查询系统作了大幅度扩充,可以多种方式查询。
网页如下:
http://dict2.variants.moe.edu.tw/variants/rbt/index.rbt
2. 汉字字种究为多少?
2004年德国有人对几本大型汉语字典收录的异体数量进行了研究,得出的结果:
1). 经过几千年的积累,汉字系统的规模(总量)约为:26,000个”字种”。
2).《康熙字典》42,176字(不含《备考》里的音义不详字)、《汉语大字典》54,709字、《中华字海》85,586字、
台湾教育部《异体字字典》106,230。
收字数量的差别在于:后出版的字典大量地增加异体,及不应该算作汉字和汉语的符号(不成字的部件;日、
朝、越及中国少数民族仿汉字的字符等),而字种数量并没有增加多少。这四本字典的核心部分(字种)是基本
相当的,《康熙字典》只少约1,000个
3. 异体有如文字”积木”之戏
浏览那些式样缤纷的异体,心中有一种感觉,好像那是古代文人,把汉字”部件”当作积木,互相取代而积造不同建筑的
”积木” 之戏,且看[照]的异体如何变化 ----
[昭],从日召声,明也;昭可换成火旁成炤;部件刀以⺈代之 成 。
[照],从灬昭声,日光也;照以⺈代刀 成 ,以丷代刀成;
刀误作夕 成 ;口误作巳成;日误作目成。
[照]中之灬以火代之 -
,部件刀代之以⺈成 ;代之以丷成;
召代之以㠯成;[照]中之火误作大 作 或作;
[照]部件 日、刀、口、火 重新排列 成 。[炤] 加灬成 ;[照] 加火 成 燳。
[照]中召代之以赤成会意字 ,[照]中之灬变作几几成
唐后武则天造日月当空之字为自己起名
--- 曌;以月代日成;
以双日代双月作;空误作字成,这些都是[照]的异体。
武氏又作瞾,取双目对空之意;空中之工误作土成 ;
误作口成;瞾中之空误作字成,误作定成;
日照于眼为 ;明加明既是[照]的异体 ,也是[朗]的异体---
----这不是古代有闲文人,以不同的部件,玩着异体字的[积木]之戏吗?