试为异体字字形分组归类

 

1.0 引言

 

台湾教育部出版的<异体字字典>(2004第五版)收字106,230字,以收录棣定、楷化后的字形为主。其中正体 29,892个,异体字76,338异体占了 72%

 

文献上充斥着如此巨量的异体字,反映了汉字形体孳乳流变与旁歧的情况,十分严重。从甲金文起就有不少 ”一字多形” 的例子,棣变、楷化之后,纷歧繁衍更多。这现象使阅读古籍者感到困扰,并造成文化信息传承的障碍。

 

日前笔者浏览该 <异体字字典> 时,发现一个可以简省字形统计的方式:即在一群异体字中,可依字形的 类似度”,分成数组。每一组用1个异体字作代表;其它类形的字就当作该异体字的异写”, 而可忽略不计。如此挑选出来的异体字较具代表性;而字量亦可缩至3万字以下,有利于对异体字作进一步的抽样研究。

 

本文乃从该字典的异体字中,抽举少数字例,尝试为异体字”分组归类”。这种方法是否适当,请大家给予批评指教。

 

 

2.0 异体字概说

 

所谓异体是相对于正体而言,在一个正字标准下,文献上与此正字同音同义而形体有异的字,谓之异体字。正字是造字构形的产物,原则上皆有理据可以解释;异体则多来自构形或书写的变异,并非全有理据

 

造成大量异体字的原因,约有如下数端:

1. 造字的时间、地点不同,有的是古代留传下来的,如”禮”是篆书,”礼”是古文。

2. 为的更好的表音或表义,如汉作 ”絝”,而后作 ”袴”,今作 ”裤”。

3. 由简化而产生,如糉简作粽,筍简作笋。

4. 形符、声符的简化或繁化,例如从衣的[],说文原从纟部。

5. 形符、声符位置变换,如/熺,/、蹴/蹵、蛾/䖸…

6. 笔划书写的各式变化,这里面包括了不少错别字的约定俗成。

 

就笔划的变化来说,有的由于书写工具的不同,如纸面挥毫或碑上刀刻,笔形自然有差。有的由于文献作者或传录人的笔误,或书法家的艺术创作。还有因对帝皇或尊长避讳而成的”缺笔”字。例如避宋 ”赵玄朗”之讳,朗作;孔丘之讳,丘作。这是封建时代尊君敬贤的表示,无可厚非;但在现代人看来,这是对汉字的宰割,不值得传承。

 

汉字历史悠久,孳乳变异累积起来,就十分可观了。

 

与正体词义比较,异体字大概可分为:

1). 全同异体,正、异体词义全同,犹如二个大小相等的同心圆迭合,正体可取代异体。

2). 包孕异体,正体词义含盖了异体,犹如一个大圆内含了一个小圆,正体亦可取代异体。

3). 交叉异体,二者只有部分词义相通,犹如二圆交叉,交叉部分词义相同。视情况而定,一般是无法取代

 

但异体的观念是相对的,可能因时因地而异,上述分类并非固定不变,在汉字流传应用过程中,有些全等异体可能变成交叉异体。此项词义的衍变,在考订古籍时要格外留意。

 

 

3.0  异构与异写

 

在一群异体字中,可依字形结构的 类似度”,分成数组。例如,[]的异体字共有24个,可分成如下8 (参见3.1)

1). [臼又] 5

2). [申又] 3

3). [火又] 5

4). [亻火又] 2

5). [白反] 4

6). [火夕] 3

7)  [火寸] 3

8). [宀火] 1

 

每组用一个异体字来代表它的构形;不同的组有不同的构形。组内附属的字,谓之异写字。换言之,甲组与乙组间的差异是构形(异构),而组内各字的微差是异写。

以下就台版<异体字字典>中的一些字例,来说明如何为异体字分组。

 

3.1 的异体分组

 

A00477



12  3 4  5 (从臼又,臼有微变)

6  7  8   (从申又)

9 10  11  (火又,火有微变)

12  13  (从亻火又)

14  15  16  17  (白反,白微变为自)

18  19  20   (火夕,火形有微变)

21  22  23  (火寸,火形有微变)

24  (从宀火火)

 

[]说文作,在室()内手()持火,本义为搜。火代表权力,古代家中执火的人都是老者,故叟表老人。异体则加人旁表示此意。

 

如上所述,[]的异体可分为如下8组,每一组指定一个异体字为代表,其它类型的异体则称为该字的异写

 

1 (五经文字);上表编号[2-5][1]号的异写。

6(龙龛手鉴);编号[7-8][6]号的异写。

9 (说文,又部);编号[10-11]为它的异写。

12(说文,又部);编号[13]为它的异写。

14(龙龛手鉴);编号  [15-17]为它的异写。

18(汉语大字典);编号[19-20] 为它的异写。

21(汉语大字典);编号[22-23] 为它的异写。

24(龙龛手鉴)

 

统计 []的异体8,异写16

 

 

3.2  的异体分组

 

A00010



1  2  3  4  5  (不的异写)

6   (从一丷不)

7  8  (从八个)

9  (从亠丫冂)

10  (𠫔)

11  (𠫔丩乚)

12  (从木)

13  从冖几)

 

[]:花萼上的蒂,象形。小篆作,隶变后作「」。

 

上表编号 [1-5],均与正体[]类型,可称为[]的异写字。

 

6,不的异体 (龙龛手鉴)

7不的异体 (四声篇海),编号[8]为其异写

9,不的异体 (隶辨)

10,不的异体(玉篇)

11,不字 (金石文字辨异)

12,不的异体 (金石文字变异)

13,不的古文 (龙龛手鉴)

 

统计 [] 的异体 7,异写6

 

 

3.3 的异体分组

 

A04432



1,(日勿)

23 (从目旦勿)

4 5  (从阝日)

6  (从日气)

78  (从阝火)

910 11 121314 (从日勿)

15 (从阝)

 

陽,高明也,从阜,昜声 (说文)。昜,同陽 (汉语大字典)

 

1 (六书正)[]的异写

2 陽异体 (龙龛),编号 [3]  为其异写

4,陽异体 (字学三正)兼简化字正体[5]为其异写。

6陽异体 (字通)

7,陽异体 (字汇)[8] 为其异写

 

[9-14]      ,为[]的异写。

15 ,陽异体 (字汇补)

 

统计 []异体5,异写10

 

 

3.4 的异体分组

 

A00760 【坡】



1

2  3

4

 

坡,阪也。从土皮声 (说文),地势倾斜之地。

 

1 ,坡的异体 (正字通);右偏旁是篆文[]的写法。

2 ,坡的异体 (集韵);声符叵取代了皮。[3] 是异写,偏旁换位。

4 ,坡异体(集韵),另兼正字。

 

统计坡的异体3,异写1

 

 

3.5 的异体分组

 

A03500



1 2 3 4

 

菅,禾本科植物,比喻轻贱,如”草菅人命”。

 

1  ,菅之古文 (韵会); 编号[2] 为其异写。

 

[3] [4] 为菅的异写。(与正体构形相似,只部件不同:以冖代宀; 以艸代艹)

 

统计[]的异体1,异写3

 

 

3.6 的异体分组

 

A03271



1 女口

2 3  4  耳口

5 耳臼

6 7  身由

8 9  身中

1011  身丷

1213  身臼

14 身目丁

 

聘,访也。从耳甹声 (说文)

 

1,聘的异体 (字汇补)

2聘的异体 (四声篇海),上表编号 [3-4]为其异写。

 

[5] 为正体[]的异写。

 

6,聘的异体(玉篇),编号[7]为其异写。

8聘的异体(偏旁碑别字),编号[9]为其异写。

10聘的异体(偏旁碑别字),编号[11]为其异写。

12聘的异体(字汇),编号[13]为其异写。

14聘的异体(汉语大字典)

 

统计[]的异体7,异写7

 

 

3.7 的异体分组

 

A00849



1 丆冂

2 从兀冂

3 4  5  6  7  从兀

8 从冖

9 从一先

10 从入人

11 12  1314  15  从八

1617  18  从大

19 从日⺇

20 21 22  从艹曳

23从青气

2425  从青无

 

天,顚也。至高无上,从一大 (说文)

 

1 同天(唐岱岳观碑)。上表编号 [2]为它的异写。

2 ,同天 (五雜組)

3 ,为「天」之古文 (正字通)。编号 [4-7]为它的异写。

8 ,天異體,(字彙補)

9 ,天(玉篇)

10 ,天字(偏类碑)

11 ,为「天」之古文(字学)编号 [12-15]为异写

16 ,甲骨文天作 ,楷化作编号 [17-18]为它的异写。

19 ,天(龙龛手鉴)

20 ,古文天字 (玉篇,艹部)编号 [21-22]为异写。

23 ,同天(正字通,青部),会意。

24 ,天之异体 (字汇补),编号[25]为其异写。

 

统计 []的异体12,异写13

各字均有所本,惟字理大都难解,例如 ”天” 为何从艹曳?

 

 

3.8 的异体分组

 

A00740



12  3 (本字亦為[]之異體)

4 5  

 

编号 [1-3],为正体[]的异写

 

编号4 [],为[]的异体,但本身兼作正字。编号 [5]为士的异写

 

统计 []的异体、兼正体1,异写4

[]既已作为正字,且字义与土有别,似不必再归入土的异体内。

 

 

3.9  的异体分组

 

A00190



1 2 3

4  5  6

7

 

1[],是[]的异体,兼简化字正体。编号[2-3] [] 的异写。

 

4 []的异体 (汉简文字类篇)

 

编号 [5-6][]的异写。

 

7[][]的异体,本身兼作正字

 

统计 []的异体3,异写4

 

 

3.10 的异体分组

 

A02477



12  3  4  5 从小

67  从人

89  10  

11从亼

121314  从小

1516  17

1819  20 从人

 

,汝也 (玉篇)

 

1,爾字 (汉隶字源);上表编号 [2-5] 为其异写。

6,爾异体 (玉篇);编号 [7] 为其异写。

8,爾异体 (字鉴);编号 [9-10] 为其异写。

11,爾异体 (龙龛)

12,爾异体(金石文字辨异)兼简化字正体。编号 [13-14]为它的异写。

15,爾异体 (汉隶字源),编号 [16-17]为它的异写。

18,爾异体 (集韵),编号 [19-20]为它的异写。

 

统计[]的异体7,异写13

 

 

3.11 的异体分组

 

 

 

A02424 【照】



1 2

3 4  5 6 78  9 (,火讹变)

10111213 14  (,日讹变)

15  16

17

18

19

2021 2223 (字, 空訛變)

2425 262728

29

30

 

照,明也,从火昭声 (说文)

 

1 ,昭异体,兼正体( 重订直音篇 );上表编号[2]为它的异写。

3,照异体(中华字海);编号[4-9]为它的异写。

 

上表编号[10-14] 均为照的异写字。

 

15,照异体(中华字海);编号[16]为它的异写。

17,照异体(中华字海)

18,照异体(中华字海,日部)

19,照异体(重订直音篇,火部)

20照的异体 (集韻),另兼正體;编号 [21-23]为它的异写

24照异体(正字通);编号[25-28]为它的异写。

29,照异体(字汇补,日部)

30 ,照异体,又作朗的异体 (汉语大字典)

 

统计[]异体 11 ,异写 19

 

 

4.0 台版<异体字字典>简介

 

台湾2001版的<异体字字典>,其正字标准主要是依据台湾教育部于1982年起颁布的常用、次常用、罕用三个字表,及 CNS11643码本内字形。收录的异体字是以文献上己隶变或楷定的字形为主。基本使用的文献约可分为如下12类:

 

01说文类,02古文字,03简牍类,04隶书类,05碑刻类,06书帖类,

07字书类,08韵书类,09字样书,10俗字谱,11佛经,12现代字书。

编辑所参考书籍包括 经、史、子、集 四大类共1442种。

 

2004年五版字典收录了异体字76,338字,相较于大陆戴召萃主编的<异体字典>,只收异体字3000多个,确实齐全许多。(就笔者所知<汉语大字典>收字54,678含盖1万多个异体字,李圃主编的<异体字典>收入不少古文字异体;不知近年来大陆专为异体字出版的字典还有那些?)

 

对于台版<异体字字典>,学者公认的优点为:

a). 收字最多,方言俗体并录,每字均注明来源依据。

b). 径就文献取形,以正字领属异体的方式编排,便于正、异对照。

c). 编辑成果以网页显示,有利大众检索。网页  http://140.111.1.40/main.htm

 

但笔者认为该字典亦有待完善之处:

a).扫描字形欠美观,图片处理须改进。(第六版异体字形已改为宋体模式)

b).把简化字当作异体处理在两岸规范字未统合之前,两岸互视对方为异体,固然是事实;但编辑字典是两岸共的,两岸现行的规范字都要以正体看待才比較合理。

 

 

5.0  异体字处理随想

 

1. 异体字主要用于考订文献、整理古籍。个人认为除了一套存真的善本及字书须保留异体字外,所有出版的古籍,应尽可能以正字取代。全同异体及包孕异体,不必说了;即使 交叉异体”也要作适当的处理,即:正、异词义相通的,自可以正体取代;异体词义没有正字可概括的,该字即须扶正升格,作正字使用。

 

2. 从古至今累积的异体字资料,是汉字字形孳乳演变的纪录,是研究汉字历史发展的一个重要资源。字形演变有成例可追循者,须作系统性的归纳分析,以明字形流变的轨迹。

 

3. 流行的未必都好,好的未必都流行,世事如此,文字也是一样 。现行的规范字,还有一些构形过于繁复的,不妨从异体中得到启示,选取简单妥适的字来取代它,以下只举3个例子,相信还有不少异体字,比现行规范字易学易用。

a. (22,襄省声)的异体共有30个,较简的合理字形为  [///𧘇]15;另一异体为 [//]15笔,引自<碑别字新编><中华字海>。笔者认为该字还可省作 [//]13笔,从衣,以便归部。

 

b. (17),异体4个,最简的为 [//𠕁]11笔,字见<中文大辞典>人部,建议采用之。

 

c.(13),异体42个,以[/爿片]变形最少,且可拆分,字见<精严新集大藏音>片部。

 

4. 形、音、义是汉字的一体三面,作为讯息的载体或符号,最理想的状态是一形一音一义。实际上这很难做到,多音字是一形多音,同音字是一音多形,这且不谈。多义字是一形多义,通常也是多音,而以音辨义。异体字则是一义多形,不仅违背了符号的唯一性,而且浪费了文字资源,增加阅读困难。因此,异体字除前述功能而保留于古籍善本、字典、字书之外,应排斥于正式出版物之中。

 

5. 异体可分为合乎六书原则而滋生发展者,或不合六书原则而书写递变者。前者是造字的产物,可称为异构字;后者是构形或书写的变化,可称为异写字。

本文尝试把异体字分组归类,把类形的字,以一个异体字作代表,意在浓缩异体字量,便于抽样作进一步探究,(诸如异体字的结构分析及部件统计等等)。否则,面对如此海量(76,000)的异体字,必令人望洋兴叹而却步矣。

 

 

  

 

1. <异体字字典>第六版试用版问世

 

最近(20128 )台湾<异体字字典>第六版试用版问世。与旧版不同之处有三:

1).正字及若干异体字内码使用 Unicode

2) 异体字字形采用宋体字形,比前版美观。

3).查询系统作了大幅度扩充,可以多种方式查询。

 

 网页如下:

http://dict2.variants.moe.edu.tw/variants/rbt/index.rbt

 

 

 

2.  汉字字种究为多少?

 

2004年德国有人对几本大型汉语字典收录的异体数量进行了研究,得出的结果:

 

1).  经过几千年的积累,汉字系统的规模(总量)约为:26,000字种

2).《康熙字典》42,176字(不含《备考》里的音义不详字)、《汉语大字典》54,709字、《中华字海》85,586字、

台湾教育部《异体字字典》106,230

 收字数量的差别在于:后出版的字典大量地增加异体,及不应该算作汉字和汉语的符号(不成字的部件;日、

 朝、越及中国少数民族仿汉字的字符等),而字种数量并没有增加多少。这四本字典的核心部分(字种)是基本

相当的,《康熙字典》只少约1,000



3. 异体有如文字积木之戏

 

浏览那些式样缤纷的异体,心中有一种感觉,好像那是古代文人,把汉字部件当作积木,互相取代而积造不同建筑的

 积木之戏,且看[]的异体如何变化 ----

 

[],从日召声,明也;昭可换成;部件代之

 

[],从灬昭声,日光也;照以 ,以

 

误作 误作误作

 

[]中之代之 - ,部件代之以 ;代之以

 

代之以[]中之误作 或作

 

[]部件 日、刀、口、火 重新排列 [] []

 

[]代之以成会意字 []中之变作几几

 

把部件人二日日火组成 ,像火烧房子,竟也是[]的异体。

 

唐后武则天造日月之字为自己起名 ---

代双误作这些都是[]的异体。

 

武氏又,取之意;中之误作

误作中之误作,误作

 

照于 既是[]的异体 ,也是[]的异体---

 

----这不是古代有闲文人,以不同的部件,玩着异体字的[积木]之戏吗?