简一繁多 字组的对译方案    1/2007

关键词:简繁非对称字  异体  或体   累增    

1.0 提要

在可见的未来,中文仍是简、繁并行。简繁之间的正确对译,是大家关注的问题。目前简繁体对译的最大困难是”简一繁多”,亦即一个简化字相当于多个繁体字。本文乃就海峡两岸规范字的对比中所得的非对称字组262个,加以剖析,说明就大陆规范言,那些传承字可以当作异体处理;那些字宜分列出来,并考虑加入大陆规范中,以使繁简体可作对称的转译,亦即计算机自动对译时,可能不需另作人工校核。

检讨「一对多」262字 后,建议在大陆规范(GB)中先行增加 繁体字32 个。其余230字可暂定为简体的异体字,不至于影响繁简对译时的文义。(若要考量字义的精确性,这些暂定的异体字,尚须进一步研讨才可定论)。又在拟增补的32中,易生歧义的/發髮、/后後、/台颱、/干幹、/面麵  5 字最需优先解决。

2.0 分析

笔者曾将大陆规范(GB)通用字7,000与台湾标准(CNS)常用字5,401及部分次常用字(1719) 的字形,作逐字的对照比较 [r1]在对照中发现其中有262个是”非对称”字,即一个简化字相当于二个或二个以上的繁体。其原因是台湾标准收字范围较宽,在其选字原则中有这样的規定 [r2]

1. 字形有数种而音义无别者,取一字为正体,余体若通行,则附注之,如:的附体

2 .字有多体,其义古通今异者予以并收(如:間/閒);古别今同者亦予并收(如:証/證)。 

就大陆规范言,这些非对称字,有些字可当作异体处理;而有些字则必须分列增补,以便繁简对译时,免生歧义,或使表意更加精确。

  处理异体字可用几何图形来比方,字义含盖的范围就像个圆形,如果甲乙二字互为异体,则是二个半径相等(或相若)的同心圆;如果甲字的字义含盖了乙字的字义,像个大圆内含着个小圆,就可采用甲字而舍弃乙字;如果两个圆形相交,只有部分字义(交叉处)相同,二者就不算是异体,而必须分列。另一方面,倘若二字在罕用义上有别,但常用的字义上相同,亦暂可不予增列,以免大陆规范增加太多的繁体字。

兹把此262简一繁多的非对称字,照上述原则,逐字分析如下文附表,并获得结论如次。

3.0 結論

为使陆规的通用字,在繁简转译时对称,则现有的规范字(7000),擬增补如下繁体字--- 蔔、衝、噹[口当]、彫、鬥、髮、彿、枴、後、薑、逕、釦、睏、裡、慄、燐、麵、糢、、盤、悽、羶、罈、醃、簷、 搾、併、幹、濛、係、 霤、颱…合計32個,兹说明如下---  

1.  因归部(形符)或声符较佳,以台湾标准字取代大陆规范(GB)字者4:盤[]、羶[]、醃[]、簷[]

2.  GB增补的繁体字,其偏旁宜类推简化者5:噹[口当]、釦[钅口]、麵[麦面][钅重][风台]

3.  建议以新创的简化字取代繁体者3:鬥→[门斗]、髮→[发彡]幹→[人干]

4.  其它为求表意更加精确所增补的繁体字20:蔔、衝、彫、彿、枴、 後、薑、逕、睏、裡、慄、燐、糢、悽、 罈、搾、併、濛、係、霤,(参考附表说明)。

5. 就目前个人所知,最易发生歧义的是下列数字:/發髮 (例如清朝称太平军为髮匪,转译后变成 發匪”)/后後(皇天后土 变成皇天)/台颱(台风是指表演者的台风还是吹来的颱风﹖)/干幹 (“干涉翻成幹涉”)/面麵(面粉是吃的还是化装用的﹖),这些易生歧义的字 (5) 宜优先解决;其它只影响表意精确度的字(28)等到日后讨论繁简体统合时再行处理。

6. 因为台湾标准字含有不少异体,增补后 简一繁多的情况还是会存在,但其时大陆规范字对应的是台湾标准甲字或甲字的异体,繁简转时当不致发生歧义。

7. “非对称繁简字的解决方向是缩小二者之间的差异,如果某些通行的繁体,有其优点,则不妨容纳并行。大陆规范如此做法,台湾标准也应该一样,这样就可逐渐的缩小二者间的差距,达到简繁统合的终极目标。

8.笔者认为一旦决定把某些繁体字加入大陆规范,就要照简化字类推法则办理,例如:麵→[麦面]、颱[风台]…。必要时也可以将繁体字简化或改造后再行加入,例如为避免 '' 的歧义,引进繁体 '' ,可把髮简为[发彡],亦即把原有的 '' 当作声符,另加上形符 '',以资区别。因为增添的繁体字不多,相信大众会很快的适应这些新字的。

4.0 附表:非对称字(262)分析表  (蓝色表拟增补的繁体字)

  或体指台湾教育部<常用国字标准字体表>甲字或作乙字的批注,以及字书 [r3] 内的说明,即一字二形;可認为是等径同心圆的异体。累增指增形的异体字,如採为采的累增。异体加注台湾规范者,专指<通用汉字标准交换码>内所注明的异体,只有6 个字。附表1,2 262字,只建议32个字提出并加入大陆规范,其余230字目前暂认作异体;俟后讨论两岸规范字统合时,再行详细研究确定。

1. 一对二字(235)- ,

/菴庵:,草庐,小寺同菴;另指草名,但罕用

/擺:摆,多用作动词, (襬已列入大陸規範)

/板闆:板义可含

/杯盃:盃或体

/背揹:揹动词,但背可兼动、名词

/錶表:錶名词,但表可兼动、名词

/別彆:彆有委曲忍受义,但不常用

/蔔卜:分列,为蔬菜,宜从艹

/佈布:布,但布可兼动、名词

/纔才:纔或体

/采採:同为动词,累增

/彩綵:彩义含綵[色彩,彩衣]

/剷鏟:铲可兼动(剷)、名(鏟)词

/嚐嘗:嘗可兼嚐(试味)义

/嗔瞋:怒曰嗔,与瞋通

/吃喫:喫或体

/痴癡:癡,台湾规范的异体

/衝沖:分列,衝突的从行,较为形象化

/虫蟲:虫义含,虫另有虺(hui3)义

/丑醜:丑可兼醜义

/出齣:出可兼齣义

/錘鎚:鎚或体

/箠棰:箠为棰的或体

/脣唇:脣或体

/啖啗:吃食之义上, 啖、啗二字相通

/当噹:分列,象声,从口为佳,简作[口当]

/盪蕩:蕩含盪义(摇动,洗涤,放荡)

/堤隄:隄或体

/牴抵:抵可兼牴(抵触)

/彫雕:分列为佳,专指雕刻,雕专指鸟

/吊弔:吊本作弔,现指缢死及量词;弔指弔唁

/咚鼕:咚含鼕(鼓声)义

/鬥斗:分列,[门斗]

/炖燉:炖义含燉(煮)

/儿兒:从简,兒不用

/髮發:分列,改作[发彡]

/翻繙:翻可兼繙义(揭开,翻译,翻覆) 

/範范:范可兼範义

仿/仿倣:仿兼倣(模仿)义

/豐丰:从简,豐可不用

/彿佛:彿分列,使佛专指佛教

/伕夫:夫含(力役的男子)

/複復:复可兼複/復义

/杆桿:从简,桿不用

/槓杠:从简,槓不用

/個箇:在量词上,箇为个(個)或体

/構构:从简,構不用

/僱雇:雇为本字

/颳刮:刮可兼颳(起风)

/挂掛:掛为挂或体

/枴拐:拐动词,名词,分列

/珪圭:圭义含(瑞玉)

/銲焊:銲通焊(焊接)

/盒合:盒,古字作合,专指盒子

/鬨哄:幺喝,哄动上通哄;鬨有斗义,罕用

/后後:分列,使后专指后妃

/胡鬍:胡可兼鬍义

/划劃:从简;划含劃原有刻划,区分之义

/譁嘩:譁或体

/坏壞:1.坏同坯,2.坏作壞簡體

/迴回:回可含(回旋,环绕等)

/燬毀:燬,烈火也(玉篇),焚燒;毀含燬義

/彙匯:汇可兼彙义

/穫獲:获可兼穫义(收割禾稼)

/饑飢:从简,饑不用

/幾几:从简,幾不用

/績勣:勣或体                      

/跡蹟:迹/蹟为跡的或体

/傢家:家可含傢(傢伙)义

/姦奸:奸可兼姦义(邪恶,淫乱,狡诈)

/薦荐:从简;薦,台湾规范异体

/鑒鑑:鑑义己为鉴、镜义取代

/姜薑:分列,蔬类,宜从艹

/勦剿:勦或体

/杰傑:音同,杰为俗体

/觔筋:音同,在主要字义(肌腱)上亦同

/盡儘:儘累增

/徑逕:另有直接(副词)义,宜分列

/巨鉅:鉅累增

/捲卷:捲累增 ,卷兼捲義

/濬浚:从简,濬不用

/剋克:剋累增 ,克兼剋義

/阬坑:阬或体

/扣釦:扣动词,名词,分列,金旁简化[钅口]

/夸誇:夸可兼誇义

/餽饋:音同,在主要字义上(致赠)

/崑昆:崑,山名,可用昆代

/諮咨:諮,累增

/睏困:另有所指(想睡),分列

/瑯琅:琅含瑯(琅琊,珐琅)

/貍狸:从简,貍不用

/琍璃:琍异体

/里裡:裡相当于裹,里/分列为佳

/栗慄:栗,树木;,身发抖;各有所指,分列

/曆歷:可兼曆/歷义

/帘簾:簾异体

/煉鍊:在冶金/修炼之义上炼通鍊

/樑梁:樑,累增,台湾规范异体

/痳淋:痳,病名,可用淋代

/燐磷:指燐火,磷指矿石,分列为佳

/蔆菱:蔆为菱本字

/爐鑪:鑪或体

/鹵滷:滷,累增

/侖崙:崙,山名,可用侖代

/羅儸:儸,族名,可用罗代

/痲麻:痲,病名,可用麻代

/黴霉:黴异体

/彌瀰:瀰(水满)为弥()的引申义

/秘祕:秘或体

/麵面:分列,形旁麥简化[麦面]

/憫愍:忧伤/怜恤,悯通愍;愍另有乱义,罕用

/糢模:,在面食上通饃;在模糊上通模,分列

/乃迺:迺或体

/妳你:分列,妳,女性用

/捻撚:捻,以指搓、捏; 說文作撚

/念唸:念可兼唸義

/孃娘:孃,

/齧嚙:齧,同啮

/煖暖:煖通暖(温,使热)

/槃盤:槃异体;盘宜复原有形声功能的繁体盤,

/彷徬:彷,彷彿;在彷徨义上同徬,一字二音

/砲炮:砲或体

/踫碰:踫,异体

/疋匹:在量词(布帛,马匹)上疋通匹

/辟闢:闢,累增

/扑撲:扑为撲或体

/僕仆:从简,使仆兼仆()/()

/樸朴:从简,使朴兼朴/樸义

/淒悽:悽属于内心感觉,分列

/慼戚:戚可兼慼义

/韆千:千可兼韆义

/籤簽:在标记/竹签之义上签通籤

/拑鉗:鉗,拑(台規是次常用字)

/纖縴:纤可兼纖/縴义

/鎗槍:鎗,亦作枪(或体)

/強彊:彊,或体

/秋鞦:秋可兼鞦义

/球毬:毬,今字作球

/麴曲:曲可兼麴义

/蜷踡:蜷可兼踡义

/熔鎔:鎔,异体

/箬篛:篛,或体

/曬晒:从简;曬,台湾规范的异体

/膻羶:以羶代膻,从羊,较为形象化,易记认

/舍捨:舍可兼捨义

/沈:(瀋 的簡化字已列入大陸規範)

/賸剩:賸,异体

/尸屍:尸含屍

/虱蝨:蝨,字亦作虱(或体)

湿/溼濕: 溼,或体

/藷薯:藷

/術朮:从简,術不用

/鬆松:松可兼鬆义

/崧嵩:崧异体

/蒐搜:蒐异体

/痠酸:酸可兼痠义

/蓑簑:簑异体

/牠它 (牠己列入大陆规范)

/罈壇:坛对应壇;,陶器,宜分列

/嘆歎:歎或体

/籐藤:籐异体

/体體:从简,體不用

/眺覜:覜异体

/聽听:听[yin3]嬉笑,罕用;[ting]聽简字

/糰團:團可兼糰义

/託托:托可兼託义

/挽輓:挽可兼輓义

/喂餵:喂可兼餵义

/污汙:污或体

/谿溪:谿异体

/譆嘻:譆为嘻异体(同指赞叹声,悲叹声)

/席蓆:蓆累增

/鹹咸:咸可兼鹹义

/銜啣:啣或体

/弦絃:絃异体

/閑閒:閒异体

/瓖鑲:瓖异体

/嚮向:嚮,累增

/筱篠:集韵:筱或作篠

/傚效:傚,累增

/洩泄:洩或体

/幸倖:幸含(宠幸,侥幸,非分所得)

/兇凶:凶可兼义(暴徒,狠恶)

/脩修:修,修养; 脩,肉脯;但不常用

/籲吁:从简,籲不用

/鬚須:从简,鬚不用

/卹恤:卹,

/勛勳:勳,台湾规范的异体

/燻熏:燻,累增

/醃腌:常用义是盐渍食物,以代腌为佳

/菸煙:菸,今字作煙;烟为煙或体

/簷檐:以代檐,簷通行, 从竹比从木易辨异

/岩巖:岩为巖简体

/嚥咽:咽义含(yan4,吞)

/燄焰:燄异体

/豔艷:台湾规范艷为豔异体

/颺揚:扬含颺(飘扬)

/餚肴:餚,累增

/迤迆:迆,异体

/殷慇:慇,累增

/佣傭:佣可兼傭义

/涌湧:涌为湧或体

/遊游:游含,(游之含义较广)

/鬱郁:從,鬱不用

/欲慾:慾,累增

/御禦:御可兼禦义

/愿願:願异体

/嶽岳:嶽,异体

/云雲:雲,累增,云兼雲義

/喒咱:喒,异体

/讚贊:讚,累增

/臟髒:脏可兼臟/髒二义

/譟噪:在喧哗,嘈杂之义上通噪

/紮扎:在捆扎之義上同

/榨搾:榨名词,动词,分列

/沾霑:霑,累增

/占佔:佔,累增

/照炤:照含(明,耀)义

/棹櫂:櫂为棹或体

/癥症:癥結可否以症结取代,有待讨论

/証證:在凭证,谏诤,验证上证證相通

/緻致:緻,累增

/制製:制可兼製义

/志誌:志可兼誌义

/鐘鍾:钟可兼鐘鍾二义;但鍾是姓,分列

/冢塚:塚,累增

/周週:周可兼週义

/冑胄:胄可取代冑/胄二形

/硃朱:在深红之义上硃与朱通

/築筑:築,累增 ,筑另作地名解

/注註:注可兼註义

/專耑:专一之义上与专通;耑另有端义

/準准:准可兼準义

/霤溜:霤專指簷霤,溜分列

/貲資:(貲簡化字已列入大陸規範)

/祐佑:佑可兼祐义  

/訢欣: 欣可兼訢义

/珮佩:佩可兼珮义

/嬝裊:嬝为异体

/壎塤:为异体

/苹蘋:蘋二讀,ping2=苹,pin2草名,不分列

 

2. 一對三字以上(27)---                

/刨鉋鑤:刨可兼动(刨)名(鉋)词; 鑤,为刨或

/并併並:并可与并/並对应,副詞;(併吞,合併)为动词,宜另列

/氾泛汎:汎/氾或体

/幹 榦干:干与干/对应;宜另列,或取幹的右旁,[人干]

/局侷跼:局与局/侷对应; 跼,曲身,字本作局,又有偏举一足义,但不常用

/濛蒙矇:蒙与蒙/矇对应;另列,例濛濛细雨蒙蒙细雨更加形象化

/陞升昇:同为动词;升含昇/陞義

/甦蘇穌:甦为异体; 穌义与苏同

/係系繫:系可与系/繫对应;/乃是之义,宜另列

/瘉愈癒:愈可取代瘉义; 癒,累增

/捆綑 梱:綑通捆(绑束), 梱名詞,捆動詞,三者均可通用

/隻只:只与只/隻对应;(zhi)另有,宜分列 (祇字已列入大陸規範)

/檯台臺颱:台与台/臺对应; 檯累增;改从[风台],以免台風颱風混淆

 

5.0 附录:台湾规范字CNS-11643概述

5.1  台灣CNS-11643 所含”標準字體”的來源

. 19829月教育部公布<常用国字标准字体表>共收4808字。本表主要参考师大国文研究所之 常用字表”(2408)、教育部之国民学校常用字汇表”(4708)15种数据,合并统计其频率,再参酌各方意见修订而成。本字表以楷书为准,字形有数种而音义无别者,取一字为正体,余体若通行,则附注如下,例如:为正体,字附见[]。选取原则:(1)取其最通行者,例如:取慷不取[忄亢](2)取其合于初形本义者,例如:取腳不取脚;(3)取其笔划较简、使用较广者,例如:取炮不取[碼交](4)字有多体,其义古通今异者予以并收(/),古别今同者亦予并收(/)

. 198212月教育部公布<次常用国字标准字体表>共收6330字。选字的原则:(1)凡十三经、四史、楚辞、文选、淮南子、老子、庄子、荀子、韩非子、吕氏春秋、管子等;(2)以中文大辞典为根据,再参酌其它辞书,凡某字之词头次数出现超过二次以上者;(3)  现代学术专业或地方性用字,经讨论决定者。

[]:除4.0 附表所列的或体字外,台湾标准书册内还注明的或体字: /侄  夠/够  墳/坟  亙/亘  憑/凭  撐/撑  據/据  擔/          攜/携  敘/叙  沈/沉  況/况  溫/温  澄/澂  災/灾  爐/罏  瓊/琼  疊/叠  禮/礼  繡/绣* 缽/钵* 罵/骂* 腳/脚  膽/胆  著/着  蒞/莅  裡/   褲/绔* 豬/猪  贗/赝* 蹤/踪  逾/踰  針/鍼  鏽/锈* 鐵/铁* 雞/鸡* 體/体  黏/粘  洌/冽  ( *原注是繁体偏旁) 可知”或体”字形,有些与简化字相同

5.2 台湾规范字CNS11643的公布

. 198610月行政院科委会、教育部、中央标准局等合编之<通用汉字标准交换码>CNS11643,共收编规范字13051字。乃以教育部之常用字汇(4808)、次常用字汇(6330)为根据,再由现行之主要中文系统中过滤选择使用频率较高之1907 字合编而成。异体字部分,原则上不另编码,只选择最常用的异体字:勋()、梁()、荐()、痴()、艳()、晒() 6个字。字形方面,概依教育部    标准字体表制作,逐字查考,统一点画。编码顺序,以先笔划后部首的方式排列。其中常用字5401部分,乃由常用字汇4808,及国小教科书之常用字587字及异体字6字合编而成。将该规范字集13051,扣除常用字5401后,所余的7650字,则为次常用字集;内含上述之次常用字标准字体6330个。

. 1988年6月 <通用汉字标准交换码>CNS11643,增補6148罕用字,合計共 19199字;但罕用字並不予以編碼。  

参考—[r1] 参见笔者网站 http://chinese.exponode.com/5_1_1.htm  <两岸规范字字形的比较与分析>

  [r2] 参见本文附录台湾规范字概述

  [r3] 其它--高树藩等所编:<国民常用标准字典>,及<形音义综合大字典>