简繁”非对称字”的综合统计及处理
目录
1.0 本文主旨 2.0 简繁“非对称”字组的综合统计
3.0 简繁“非对称”字的处理方式
4.0 “非对称”字处理说明
5.0 提供”新简”与”新繁”的对译程序 6.0简繁 ”非对称” 字调整后的效益
7.0 附件1,2,3
1.0 本文主旨
所谓简、繁 ”非对称” 字,即一个简体字对应了多个繁体字(一对多)。这在语文论谭上不少人讨论过,至于如何处理也各有不同的方案。本文的重点(与众不同之处)有二:
1. 从多种资料来源、作全面性的综合统计,共得简、繁对应字组3024个,(比大陆规范的2235组超出很多), “非对称”字组532个。其中除简、繁体关系外,还夹杂着不少与异体字的对应。
2. 在处理”非对称”字组时,考量到简化字约定俗成的延伸义,例如”佩”在繁体语境中表”佩带”义,但在简体语境中,已延伸其字义包含了所佩带的玉器(珮)。
这些”非对称”字组,经笔者逐一分析后,归纳出三种途径来解决:
1. 大陆规范增加了传承字18个 (新规范称为”新简”)
2. 台湾规范采用了大陆简化字105个,亦即认同了这些字的延伸义 (新规范称为”新繁”)
3. “非对称”字组中的异体字403个,在转译后皆以规范字来取代。
“一对多”问题解决之后,经以简繁转译程序反复试验证实:在不用软件智能设计之下,可使”新简”及”新繁”体作 ”一对一” 的可逆对应。从而拉近了简、繁规范字在字形上的差异,使海峡两岸的共用字增加了300多个,而”新繁”体的异体字则减少了400多个;为中华 ”书同文”作先期的准备工作。
2.0. 简繁“非对称”字组的综合统计
“非对称”(一对多)字组的统计纲要,请参见下表。各项数据来源的演绎,详附件1。
资料来源 |
简字组数 |
“一对多”组数 |
1. 台湾规范Big5-13060字 |
2723 |
378 |
2. 大陆规范-7000字 |
2346 |
18 |
3. 普通古籍用字-11614 |
2616 |
413 |
4. Unihan基本集-27134字 |
3014 |
277 |
5. I-CORE-9809字 |
2424 |
148 |
综 合 净 得 (组) |
3024 |
532 |
3.0 简、繁体“非对称”字的处理方式
原则:在通用字义的相容上,使简、繁体作 ”一对一” 的对应,避免不必要的误解。具体方法有三,兹举例说明如次:
1. 在必要时大陆规范须增加一些传承字 ----
例一:后 / 后後:
繁体à简体à繁体
後 à后 à 後 : 对应无误。但简体”后”转作繁体”後”时,某些词会有错译,例如:
皇后à皇后à皇後 : 这种错译,在海外平面媒体并不罕见,因此大陆规范须增 ”後`” 字。
增加之后,后/后、後/後 各自作 ”一对一” 的对应,就不会错译了。
例二:发 / 發髮:
发 à 發 : 对应无误。但发作髮解时,则:
头发à 頭發 : 这种错译常在海外报章杂志上发现,因此大陆规范须增 ”髮`” 字。
大陆规范要增加的传承字共18个,如下表所示。其理由详第4.0节。
後 |
鬥 |
乾 |
幹 |
彙 |
裡 |
遊 |
穀 |
髮 |
歷 |
嶽 |
濛 |
薑 |
鬱 |
襬 |
縴 |
髒 |
摺 |
|
|
上表中”鬱”的笔划太多,共29笔,须考虑简化,或另寻他字取代;亦可沿用大陆规范的”郁”字。
2. 在字义相通时,台湾规范可采用一些简化字----
例一: 出 / 出齣
繁体à简体à繁体
出 à出 à 出 : 同字对译无误。
齣 à出 à 出 : 此即繁体 ”齣”转成简体 ”出” 后,不再转回繁体 ”齣”而仍转成 ”出”。亦即简、繁体都不用 齣 字。按 <字汇补>:”传奇中一回为一齣,乃食之已久,复出嚼之。今传奇进而复出,故作齣”。可见以出代齣来表示一场戏,不仅省了笔划,而且更易使人明白。
例二: 扎 / 扎紮
繁体à简体à繁体
扎 à扎 à 扎 : 同字对译无误。但若 扎/紮对应时便会出现问题---
紮 à扎
à 紮 :
掙扎à挣扎à掙紮
在捆扎的意义上,扎/紮可通用。倘若简体挣扎译成繁体掙紮,便说不通了。因此港、台应比照大陆,不用紮字,用扎兼表挣扎与捆扎之义。其实在繁体语境中,亦常用扎表捆扎之义。
简化字在大陆己通行60多年,不少简化字兼有二个以上的繁体字义,例如佩兼有珮义。在简体语境中,”佩”己延伸了字义,使它含有所佩带的玉器(珮)之义,且己约定俗成。笔者认为在繁体语境中只要未造成误解,简化字的引申义应予以认可。换言之,台湾规范应增加一些简化字,以便简、繁体作”一对一”的对应,就不至于有错译发生。可认同使用的简化字共有105个,如下表所示:
表中在 [ >] 前表示弃用的字,在 [ >] 后表示采纳的字。下文第4.0节将详细说明其理由。
弔>吊 |
伕>夫 |
兇>凶 |
佈>布 |
併>并 |
彿>佛 |
昇>升 |
侷>局 |
剋>克 |
姦>奸 |
屍>尸 |
倖>幸 |
珮>佩 |
祐>佑 |
迴>回 |
陞>升 |
隻>只 |
唸>念 |
啣>衔 |
崑>昆 |
崙>仑 |
捲>卷 |
捨>舍 |
硃>朱 |
紮>扎 |
脩>修 |
逕>径 |
釦>扣 |
傚>效 |
幾>几 |
復>复 |
揹>背 |
睏>困 |
註>注 |
週>周 |
傭>佣 |
塗>涂 |
慄>栗 |
準>准 |
裌>夾 |
僕>仆 |
劃>划 |
慇>殷 |
摺>折 |
滷>卤 |
蓆>席 |
製>制 |
誌>志 |
紥>扎 |
颱>台 |
廕>荫 |
徵>征 |
慼>戚 |
慾>欲 |
磐>盘 |
範>范 |
蔔>卜 |
衝>冲 |
複>复 |
颳>刮 |
衚>胡 |
儘>尽 |
噹>当 |
禦>御 |
錶>表 |
霑>沾 |
糢>模 |
縴>纤 |
醜>丑 |
闆>板 |
懞>蒙 |
嚮>向 |
罈>坛 |
鞦>秋 |
鬆>松 |
鼕>冬 |
矇>蒙 |
繫>系 |
譆>嘻 |
鬍>胡 |
麴>曲 |
覈>核 |
鏇>旋 |
瀰>弥 |
鹹>咸 |
齣>出 |
儸>罗 |
麯>曲 |
鬚>须 |
囌>苏 |
纔>才 |
尅>克 |
係>系 |
託>托 |
悽>凄 |
傢>家 |
雲>云 |
彆>別 |
緻>致 |
燐>磷 |
餵>喂 |
穫>获 |
糰>团 |
韆>千 |
輓>挽 |
3. 异体字的过滤
a. 在”简一繁多”的字组中,选用与简体对应的繁体字时,除考量字频外,应尽可能与简体的字形相近。同组中未选用的字,则当作异体处理,例如:
弦 - 弦絃 : 对应的繁体应取”弦”舍”絃”,把絃归入异体。
泛 - 泛氾汎 : 对应的繁体应取”泛”,把氾/汎归入异体。
侄 - 侄姪 : 侄/姪通用,侄从人,中性,较优,选为对应的繁体。
咱 - 咱偺喒 : 咱,会意易解,且结构分明,选作对应的繁体;其它归入异体。
b. 己经约定俗成的繁体对应字,本文仍沿用之。但有几个字因结构复杂,则拟改为结构简单的对应字。如下表所示。
简 - 繁 |
现行对应 |
本文采用的对应 |
帘 -
帘簾 |
帘/簾对应 |
沿用,考虑改用帘 |
炖 -
炖燉 |
炖/燉对应 |
沿用 |
洒 -
洒灑 |
洒/灑对应 |
沿用,考虑改用洒 |
晒 -
晒曬 |
晒/曬对应 |
沿用,考虑改用晒 |
荐 -
荐薦 |
荐/薦对应 |
沿用,考虑改用荐 |
栖 -
栖棲 |
栖/棲对应 |
沿用 |
蚕 -
蚕蠶 |
蚕/蠶对应 |
沿用,考虑改用蚕 |
惊 -
惊驚 |
惊/驚对应 |
沿用,考虑改用惊 |
蜡 -
蜡蠟 |
蜡蠟对应 |
沿用,考虑改用蜡 |
踊 -
踊踴 |
踊踴对应 |
沿用 |
坝 -
壩垻 |
坝/壩对应; 垻异体 |
沿用 |
屃 -
屓屭 |
屃/屭对应; 屓异体 |
沿用 |
竖 -
竪豎 |
竖/豎对应; 竪异体 |
沿用 |
闹 -
鬧閙 |
闹/鬧对应; 閙异体, |
沿用 |
绣 -
綉繡 |
绣/繡对应; 綉异体 |
已改用”綉”作对应 |
钥 -
鈅籥鑰 |
钥/鑰对应; 鈅籥/异体 |
已改用鈅 |
铁 -
鉄銕鐵 |
铁/鐵对应; 鉄銕/异体 |
已改用鉄 |
镋 -
鎲钂 |
镋/钂对应; 鎲异体 |
已改用鎲 |
镌 -
鐫鎸 |
镌/鐫对应; 鎸异体 |
已改用鎸 |
锈 -
銹鏽 |
锈/鏽对应; 銹异体, |
已改用銹 |
c. 在532 ”非对称” 字组中,经统计共有403个是与规范字字义相通的异体。这些异体自宜在简繁
转译中,把它们过滤掉,详第4.0节的说明。这样作可以净化文本字种,有助于阅读与了解,更可
减少简、繁体规范之间的字形差异,为中华 ”书同文” 典定基础。
4.0 “非對稱”字的處理說明
1. 大陆规范要增加的传承字
为使简、繁作”一对一”的对应,大陆规范究竟要恢复使用多少个传承字?这是见仁见智。笔者参考了海外常见的错译字,初步认定先恢复如下18个传承字。
需增加 |
简 – 繁 |
理 由 |
後 |
后 - 后後 |
后/後分立;以免皇后会误作皇後。 |
鬥 |
斗 - 斗鬥鬦鬭 |
斗/鬥分立,以免五斗米误译作五鬥米; 鬦/鬭是鬥的异体。 |
乾幹 |
干 - 干乾幹榦 |
干/幹/乾分立,可避免不少误译(如幹涉);榦可认作幹的异体。 |
彙 |
汇 - 匯彙滙 |
汇/匯对应; 滙异体; 彙分立, 以免匯款错译作彙款。 |
裡 |
里 - 里裡裏 |
里/裡分立,以免千里错译作千裡。裏为裡异体,裡结构清爽,用裡。 |
遊 |
游 - 游遊 |
游遊分立,以免游泳错译作遊泳。 |
穀 |
谷 - 谷穀 |
谷/穀分立,以免山谷错译作山穀。 |
髮 |
发 - 發髮 |
发/發对应;髮分立, 以免頭髮错译作頭發。 |
歷 |
历 - 曆歷厤 |
历/曆对应;歷分立; 以免歷史错译作曆史; 厤异体,不用。 |
嶽 |
岳 - 岳嶽 |
岳/嶽分立, 可免岳飛错译作嶽飛。 |
濛 |
蒙 - 蒙濛懞矇 |
濛分立; 蒙包孕了懞矇,以蒙代之。 |
薑 |
姜 - 姜薑 |
姜/薑分立, 以免姜子牙错译作薑子牙。 |
鬱 |
郁 - 郁鬱 |
郁/鬱分立, 以免郁達夫错译作鬱達夫。 |
縴 |
纤 - 縴纖 |
纤/纖对应;縴分立。以免纖維错译作縴維。 |
髒 |
脏 - 臟髒 |
脏/臟对应;髒分立。以免心臟错译作心髒。 |
襬 |
摆 - 擺襬 |
摆/擺对应;襬分立。以免擺動错译作襬動。 |
摺 |
折–折摺 |
折/折对应;摺分立。以免摺迭错译作折迭。 |
2. 在字义相通时,台湾规范可采用的简化字(105)
在此场合,简繁体大多是包孕关系,例如仆包孕了僕,含有仆倒、奴仆二义,故两岸可共享仆字。
棄>用 |
簡 -
繁 |
理 由 |
弔>吊 |
吊 - 吊弔 |
吊/弔包孕,兩岸同用吊字。以免上吊误译作上弔。 |
伕>夫 |
夫 - 夫伕 |
夫/伕包孕, 兩岸共用夫字,以免夫婦误译作伕婦。 |
兇>凶 |
凶 - 凶兇 |
凶/兇包孕,兩岸共用凶字;以免吉凶误译作吉兇 |
佈>布 |
布 - 布佈 |
布/佈包孕,同用布字,可免布匹误译作佈匹。 |
彿>佛 |
佛 - 佛彿 |
佛/彿包孕,兩岸同用佛字;可免佛教误译作彿教。 |
昇>升 |
升 - 升昇陞 |
升包孕了昇/陛,兩岸共用升字,避免升斗误作昇斗。 |
係>系 |
系 - 系係繫 |
系包孕了係/繫, 兩岸共用系字。避免系統误作係統。 |
侷>局 |
局 - 局侷跼 |
局包孕了侷/跼,同用局字,可免局部错译作侷部。 |
剋>克 |
克 - 克剋尅 |
克包孕了剋/尅,同用克字;可免公克误译作公剋。 |
姦>奸 |
奸 - 奸姦 |
奸/姦包孕,兩岸同用奸字。可免奸商误译作姦商。 |
屍>尸 |
尸 - 尸屍 |
尸含屍义,共用尸字,以免尸位素餐误作屍位素餐。 |
倖>幸 |
幸 - 幸倖 |
幸/倖包孕,兩岸同用幸字;可免幸福错译作倖福。 |
珮>佩 |
佩 - 佩珮 |
佩/珮包孕,同用佩字。佩,亦指人佩帶的玉器;可免欽佩误译作欽珮。 |
祐>佑 |
佑 - 佑祐 |
佑/祐包孕,兩岸同用佑字。 |
託>托 |
托 - 托託 |
托/託包孕,兩岸同用托字;可免托住误译作託住。 |
迴>回 |
回-回迴囬廻囘 |
回/迴包孕, 可免回歸误译作迴歸。 |
隻>只 |
只 - 只衹隻 |
只包孕了衹/隻,共用只; 可免只有误译作隻有。 |
唸>念 |
念 - 念唸 |
念/唸包孕,兩岸同用念字;可免觀念错译作觀唸。 |
啣>銜 |
衔 - 啣銜 |
衔/銜对应; 銜/啣包孕,用銜;以免頭銜错译作頭啣。 |
崑>昆 |
昆 - 昆崑崐 |
昆/崑包孕,兩岸同用昆字; 以免昆仲错译作崑仲。 |
崙>侖 |
仑 - 侖崙 |
仑/侖对应; 侖/崙包孕,用侖字。 |
悽>凄 |
凄 - 凄淒悽 |
凄/淒对应; 凄/悽包孕,用凄。 |
捲>卷 |
卷 - 卷捲 |
卷/捲包孕,兩岸同用卷字,可免書卷错译作書捲。 |
捨>舍 |
舍 - 舍捨 |
舍/捨包孕,兩岸同用舍字;可免宿舍错译作宿捨。 |
硃>朱 |
朱 - 朱硃 |
朱硃包孕,兩岸同用朱字, 可免朱門误译作硃門。 |
紮>扎 |
扎 - 扎紮紥 |
扎/紮包孕,共用扎字,以免掙扎误译作掙紮。 |
脩>修 |
修 - 修脩 |
修/脩包孕,兩岸同用修字;可免修身错译作脩身。 |
逕>徑 |
径 - 徑逕 |
径/徑对应;徑/逕包孕,取徑;以免田徑賽错作田逕賽。 |
釦>扣 |
扣 - 扣釦 |
扣/釦包孕,兩岸同用扣字, 可免扣門误译作釦門。 |
傢>家 |
家 - 家傢 |
家/傢包孕,兩岸同用家字;可免家庭错译作傢庭。 |
傚>效 |
效 - 效傚 |
效/傚包孕,兩岸同用效字;可免效勞错译作傚勞。 |
幾>几 |
几 - 几幾 |
几尚有几桌义,共用几字。以免茶几误译作茶幾。 |
揹>背 |
背 - 背揹 |
背/揹包孕,兩岸同用背字;可免肩背错译作肩揹。 |
睏>困 |
困 - 困睏 |
睏/困包孕,兩岸同用困字;可免困苦误译作睏苦。 |
註>注 |
注 - 注註 |
注/註包孕,兩岸同用注字;可免注意错译作註意。 |
週>周 |
周 - 周週 |
周/週包孕,兩岸同用周字;可免周全错译作週全。 |
雲>云 |
云 - 云雲 |
云/雲包孕, 同用云字;以免孔子云误译作孔子雲。 |
傭>佣 |
佣 - 佣傭 |
佣/傭包孕, 取佣;以免佣金误译作傭金。 |
塗>涂 |
涂 - 涂塗凃 |
涂塗包孕, 兩岸同用涂字; 凃是异体,不用。 |
慄>栗 |
栗 - 栗慄 |
栗/慄包孕, 兩岸同用栗字;可免栗子错译作慄子。 |
準>准 |
准 - 准準 |
准準包孕,兩岸同用准字;以免准許错译作準許。 |
裌>夾 |
夹 - 夾裌 |
夹/夾对应;夾/裌包孕,用夾。以免夾住错译作裌住。 |
僕>仆 |
仆 - 仆僕 |
仆/僕包孕,取仆;以免前仆后继误译作前僕後繼。 |
劃>划 |
划 - 划劃 |
划/劃包孕,同用划字;可免划船误译作劃船。 |
彆>別 |
别 - 別彆 |
别/別对应; 彆异体,不用。以免離別错译作離彆。 |
慇>殷 |
殷 - 殷慇 |
殷/慇包孕,同用殷字; 以免殷商错译作慇商。 |
滷>鹵 |
卤 - 鹵滷 |
卤/鹵对应; 鹵/滷包孕,同用鹵字。 |
蓆>席 |
席 - 席蓆 |
席/蓆包孕,兩岸同用席字;可免主席错译作主蓆。 |
製>制 |
制 - 制製 |
制/製包孕,兩岸同用制字,可免制度错译作製度。 |
誌>志 |
志 - 志誌 |
志/誌包孕,兩岸同用志字,可免意志错译作意誌。 |
輓>挽 |
挽 - 挽輓 |
挽/輓包孕,兩岸同用挽字;可免挽救错译作輓救`。 |
颱>台 |
台 -
台臺颱檯 |
台 包孕了 颱/臺/檯3字, 兩岸共用台字。 |
廕>蔭 |
荫 - 蔭廕 |
荫/蔭对应; 蔭/廕包孕,取蔭。 |
徵>征 |
征 - 征徵徴 |
征徵包孕,兩岸同用征字。徴,是徵异体,不用。 |
慼>戚 |
戚 - 戚慼鏚 |
戚慼包孕, 兩岸同用戚字;可免親戚错译作親慼。鏚是异体,不用。 |
慾>欲 |
欲 - 欲慾 |
欲慾包孕, 兩岸同用欲字。 |
磐>盘 |
盘 - 盤槃磐 |
盘/盤对应; 盘包孕了槃磐,用盘。 |
範>范 |
范 - 范範 |
范/範包孕, 用范;以免范先生错译作範先生。 |
緻>致 |
致 - 致緻 |
致緻包孕,兩岸同用致字;可免致力错译作 緻力。 |
蔔>卜 |
卜 - 卜蔔 |
卜分立,以卜代蔔,可免卜卦误译作蔔卦。 |
衝>冲 |
冲 -
沖衝 |
冲/沖对应;冲/衝包孕,用冲。 |
複>复 |
复 - 复復複 |
复包孕了復/複,用复。 |
颳>刮 |
刮 - 刮颳 |
刮/颳包孕,兩岸同用刮字。 |
儘>盡 |
尽 - 盡儘 |
尽/盡对应; 尽/儘包孕,用尽。 |
噹>當 |
当 - 當儅噹 |
当/當对应; 當包孕了儅/噹,用當 |
燐>磷 |
磷 - 磷燐 |
磷/燐包孕, 兩岸同用磷字。 |
禦>御 |
御 - 御禦 |
御/禦包孕, 用御;以免御用错译作禦用。 |
錶>表 |
表 - 表錶 |
表/錶包孕,兩岸同用表字;可免表達错译作錶達。 |
霑>沾 |
沾 - 沾霑 |
沾/霑包孕,兩岸同用沾字。 |
糢>模 |
模 - 模糢 |
模糢包孕, 兩岸同用模字; 以免模範错译作糢範。 |
縴>纤 |
纤 - 縴纖 |
纤/纖对应;縴分立。 |
醜>丑 |
丑 - 丑醜 |
丑/醜包孕,用丑;以免辛丑年误译作辛醜年。 |
闆>板 |
板 - 板闆 |
板/闆包孕,兩岸同用板字;可免木板错译作木闆。 |
餵>喂 |
喂 - 喂餵 |
喂餵包孕, 兩岸同用喂字。 |
嚮>向 |
向 - 向曏嚮 |
向包孕了曏/嚮,同用向字,可免方向误译作方嚮。 |
罈>坛 |
坛-壇罈墰壜罎 |
坛/壇对应; 壇 包孕了 罈/墰/壜/罎, 用壇。 |
鞦>秋 |
秋 - 秋鞦 |
秋/鞦包孕,兩岸同用秋字。鞦韆亦可作秋千。 |
鬆>松 |
松 - 松鬆 |
松/鬆包孕,兩岸同用松字;可免松樹错译作鬆樹。 |
矇>蒙 |
蒙 - 蒙濛懞矇 |
蒙濛分立; 蒙包孕了懞矇,以蒙代之。 |
穫>獲 |
获 - 獲穫 |
获/獲对应; 獲/穫包孕,用獲。 |
譆>嘻 |
嘻 - 嘻譆 |
嘻譆包孕, 兩岸同用嘻字。 |
鬍>胡 |
胡 - 胡鬍衚 |
胡包孕了鬍/衚,同用胡字;可免胡人错译作鬍人。 |
麴>曲 |
曲 - 曲麴麯 |
曲包孕了麴/麯,同用曲字。可免歌曲误译作歌麯。 |
覈>核 |
核 - 核覈 |
核/覈包孕, 兩岸同用核字。可免核能错译作覈能。 |
鏇>旋 |
旋 - 旋鏇 |
旋鏇包孕, 兩岸同用旋字;以免凱旋错译作凱鏇。。 |
瀰>彌 |
弥 - 彌瀰 |
弥/彌对应; 彌/瀰包孕,同用彌。 |
糰>團 |
团 - 團糰 |
团/團对应; 團/糰包孕,取團;以免團結错译作糰結。 |
鹹>咸 |
咸 - 咸鹹 |
咸/鹹包孕, 用咸;以免咸豐错译作鹹豐。 |
齣>出 |
出 - 出齣 |
出/齣包孕, 兩岸共用出字, 以免外出误译作外齣。 |
儸>羅 |
罗 - 儸羅 |
罗/羅对应; 羅/儸包孕,用羅。以免包羅错译作包儸。 |
鬚>須 |
须 - 須鬚 |
须/須对应;須包孕鬚; 以免須要错译作鬚要。 |
囌>蘇 |
苏 - 蘇甦囌 |
苏/蘇对应; 甦异体,不用; 蘇/囌包孕,用蘇/苏。 |
纔>才 |
才 - 才纔 |
才/纔包孕,用才字。說文:纔,帛雀頭色,一曰微黑色;此义今不用。 |
韆>千 |
千 - 千韆 |
千包孕韆,用千; 鞦韆可與秋千对应。 |
上表是假定简体的字义、包孕了繁体的字义,在这样条件下,所拟定的”一对一”的简繁对应。
有些”一对多”的字并非包孕关系,例如折迭的”摺”,简化字作”折”,并不适当。把纸摺迭并不把纸折断,而且”折”是个多义字(弄断、周折、折返、夭折、挫折、折寿、折扣、折服…),不宜再兼”摺”义,因此”摺”宜分立,把它加入大陆规范字内。
3 异体改用规范字
本文所谓”异体”可分为如下二部分:其一是 Big-5规范内的异体,亦即偶而会出现的罕用字。例如尼姑居住的”庵”,亦可写作”菴”。大陆规范用”庵”,台湾规范”庵”常用、”菴”罕用。为求简繁体统合,宜以”庵”为海峡两岸共享字,而把”菴”当作异体处理。下文 [表a.] 为此类异体,共有145字。
其二是Big-5规范外的异体,共258字,详见下文 [表b.]
表a. 在Big-5规范内的异体( 145)
下表中在 [ >] 前表示异体,在 [ >] 后表示规范字。
氾>泛 |
汎>泛 |
佔>占 |
阬>坑 |
卹>恤 |
姪>侄 |
枴>柺 |
炤>照 |
耑>端 |
郃>合 |
玆>茲 |
珪>圭 |
砲>炮 |
衹>只 |
訏>吁 |
迺>乃 |
梱>捆 |
毬>球 |
琍>璃 |
產>産 |
絃>弦 |
脣>唇 |
訢>欣 |
喫>吃 |
痠>酸 |
菸>煙 |
菴>庵 |
詠>咏 |
鰮>鰛 |
閑>閒 |
勣>績 |
徬>彷 |
煖>暖 |
痲>麻 |
綑>捆 |
覜>眺 |
鉋>刨 |
鉤>鈎 |
榦>幹 |
槃>盤 |
綵>彩 |
臺>台 |
蒐>搜 |
說>説 |
閤>合 |
麼>麽 |
儅>當 |
暱>昵 |
鋤>耡 |
閱>閲 |
頫>俯 |
蓴>蒓 |
勳>勛 |
嬝>裊 |
彊>強 |
燄>焰 |
嚐>嘗 |
壎>塤 |
濬>浚 |
燬>毀 |
牆>牆 |
盪>蕩 |
繈>襁 |
縯>演 |
醞>醖 |
鍊>煉 |
轀>轀 |
櫂>棹 |
檯>台 |
璿>璇 |
癒>愈 |
繡>綉 |
鎚>錘 |
霤>溜 |
顏>顔 |
颺>揚 |
餽>饋 |
嚥>咽 |
癡>痴 |
譁>嘩 |
孃>娘 |
癥>症 |
譟>噪 |
鏽>銹 |
饑>飢 |
攜>擕 |
瓖>鑲 |
鐵>鉄 |
贗>贋 |
鑑>鑒 |
譾>謭 |
巖>岩 |
籤>簽 |
籥>鈅 |
鑤>刨 |
黴>霉 |
鼇>鰲 |
鑰>鈅 |
讚>贊 |
鑽>鉆 |
鱷>鰐 |
豔>艷 |
钂>鎲 |
钁>鐝 |
梘>筧 |
癧>鬁 |
蹾>蹲 |
噁>惡 |
裏>裡 |
罋>甕 |
嫋>裊 |
骾>鯁 |
凴>憑 |
啓>啟 |
舖>鋪 |
滙>匯 |
綫>線 |
搆>構 |
溼>濕 |
灩>灧 |
瘉>愈 |
箇>個 |
樑>梁 |
歎>歎 |
篛>箬 |
鬨>哄 |
謠>謡 |
谿>溪 |
繙>翻 |
蹟>跡 |
鏟>剷 |
鯗>鮝 |
鐫>鎸 |
齧>嚙 |
鑪>爐 |
鹼>鹼 |
葯>藥 |
韁>繮 |
籲>吁 |
牴>抵 |
盃>杯 |
偺>咱 |
啗>啖 |
琯>管 |
甦>蘇 |
|
|
|
|
|
|
|
b. 在Big-5规范外的异体字( 258)
表中在 [ >] 前表示异体字,在 [ >] 后表示规范字。
攷>考 |
阯>址 |
彔>錄 |
杴>鍁 |
旂>旗 |
毧>絨 |
迻>移 |
埰>採 |
厤>曆 |
喒>咱 |
喦>岩 |
媮>偷 |
晻>暗 |
牋>箋 |
甯>寧 |
絏>紲 |
粧>妝 |
壼>壺 |
煇>輝 |
葠>參 |
塼>磚 |
慴>懾 |
劄>札 |
銕>鉄 |
敺>驅 |
槼>規 |
氂>犛 |
澂>澄 |
嫺>嫻 |
曏>向 |
縕>緼 |
縚>絛 |
賮>贐 |
鋻>鑒 |
駮>駁 |
嬭>奶 |
擣>搗 |
歛>斂 |
鍼>針 |
鞝>緔 |
繖>傘 |
嬾>懶 |
甖>罌 |
穨>頹 |
艣>櫓 |
鏚>戚 |
闚>窺 |
騣>鬃 |
儹>攢 |
懽>歡 |
纍>累 |
衊>蔑 |
罏>壚 |
攩>擋 |
欑>攢 |
讌>宴 |
鷳>鷴 |
欞>櫺 |
倮>裸 |
僞>偽 |
兎>兔 |
凃>涂 |
凟>瀆 |
凥>居 |
劒>劍 |
匲>奩 |
匳>奩 |
匵>櫝 |
厈>岸 |
厛>廳 |
厠>廁 |
厰>廠 |
嚻>囂 |
囘>回 |
囬>回 |
囯>國 |
垻>壩 |
堢>堡 |
堦>階 |
塲>場 |
壠>壟 |
夀>壽 |
娬>嫵 |
嬀>媯 |
尲>尷 |
屓>屭 |
崐>昆 |
崬>崠 |
幷>並 |
廻>迴 |
廼>乃 |
徴>征 |
悞>誤 |
慙>慚 |
慤>愨 |
憙>喜 |
搇>撳 |
擧>舉 |
敍>敘 |
敭>揚 |
斈>學 |
朞>期 |
栢>柏 |
椀>碗 |
殻>殼 |
氊>氈 |
汚>汙 |
涖>蒞 |
潙>溈 |
澁>澀 |
濶>闊 |
烖>災 |
爲>為 |
牐>閘 |
牕>窗 |
犇>奔 |
獆>嘷 |
瓌>瑰 |
甎>磚 |
畱>留 |
眎>視 |
眡>視 |
矦>侯 |
硶>磣 |
礮>炮 |
秔>稉 |
稺>稚 |
窰>窯 |
竝>並 |
竪>豎 |
籢>奩 |
絍>紝 |
綳>繃 |
緍>緡 |
緜>綿 |
緤>紲 |
繦>襁 |
罎>罈 |
罸>罰 |
聼>聽 |
脇>脅 |
臯>皋 |
舗>鋪 |
舘>館 |
艪>櫓 |
菓>果 |
蓡>參 |
蚉>蚊 |
蜽>魎 |
衆>眾 |
衞>衛 |
襍>雜 |
覻>覷 |
訦>諶 |
詧>察 |
詾>訩 |
譌>訛 |
讁>謫 |
讐>讎 |
讛>囈 |
賔>賓 |
賛>贊 |
賫>齎 |
贜>贓 |
蹏>蹄 |
躰>體 |
軃>嚲 |
輭>軟 |
邨>村 |
鄕>鄉 |
酧>酬 |
醻>酬 |
鉢>缽 |
鋜>鐲 |
鎋>轄 |
鑛>礦 |
隂>陰 |
隖>塢 |
隣>鄰 |
隷>隸 |
霛>靈 |
靣>面 |
靭>韌 |
鞌>鞍 |
頽>頹 |
顇>悴 |
飃>飄 |
飇>飆 |
飈>飆 |
饝>饃 |
駡>罵 |
騐>驗 |
髩>鬢 |
鬦>鬥 |
鬪>鬥 |
鬭>鬥 |
鮌>鯀 |
鮷>鯷 |
鰌>鰍 |
鰺>鯵 |
鵶>鴉 |
鷀>鶿 |
鷄>雞 |
鷼>鷴 |
鸎>鶯 |
麪>麵 |
鼈>鱉 |
𦉾>網 |
婬>淫 |
釬>銲 |
鞀>鞉 |
墝>磽 |
毉>醫 |
燿>耀 |
醼>宴 |
鷰>燕 |
羢>絨 |
觝>抵 |
螘>蟻 |
諡>謚 |
譭>毀 |
鶤>鵾 |
処>處 |
剹>戮 |
叠>疊 |
喆>哲 |
嵗>歲 |
幱>襴 |
樷>叢 |
歗>嘯 |
瘻>瘺 |
皷>鼓 |
墰>壇 |
壜>壇 |
懕>懨 |
戯>戲 |
煑>煮 |
爗>燁 |
竈>灶 |
竚>佇 |
縂>總 |
縧>絛 |
覔>覓 |
覰>覷 |
辤>辭 |
辳>農 |
韤>襪 |
頟>額 |
舩>船 |
艢>檣 |
賉>恤 |
賍>贓 |
閙>鬧 |
関>關 |
騗>騙 |
驘>騾 |
鱓>鱔 |
鵞>鵝 |
|
|
|
|
|
|
5.0 ”新简”与”新繁”的对译程序
为着简、繁体 ”一对一” 的对应,大陆规范增加了18个传承字,此新规范称之为”新简”。另一方面,台湾规范采用了105个简化字,此新规范称之为”新繁”。
笔者提供一个”新简”与”新繁”的对译程序让大家试用:http://www.exponode.com/misc/ch_conversion_new.php
该程序经笔者试验证实:不用智能设计,新繁与新简之间 可以做到”一对一”的转译。
请打开上面网页:可以看到4 个窗口:
1. 现行繁体 与 新简 的转换:现繁 → 新简
2. 现行简体 与 新繁 的转换:现简 → 新繁
3. 新简 与 新繁 的转换:新简 → 新繁
4. 新繁 与 新简 的转换:新繁 → 新简
第1,2项转换是单向的,第3,4项是双向(可逆)的:新简 ↔ 新繁。
这样设计乃假定在 ”书同文” 之前,大家先采用”新简”、”新繁”作规范,以使二者作 ”一对一” 的对应,避免在海外平面媒体中常见的错译。
如果不调整简繁的对应,任凭”一对多”存在,即使千方百计采用了智能设计,错译还是无法全免。
6.0 简、繁 ”非对称” 字调整后的效益
1. 简、繁“一对多”字组(324个),经过前文3.0节所述使用三种方式调整,成为“一对一”字组(1036个)之后,除了可以避免简、繁转译时的错译之外,对海峡两岸规范字还有不少有利影响。
a.就台湾规范13,060字而言,现行简繁体差异从2723字组减至2400字组,亦即有323简繁体字组的字形趋于同一。
b. 就大陆规范7000字言,现行简繁体差异从2346字组减至2302字组,亦即有44简繁体字组的字形趋于同一。
2. 再把上述”新繁”及”新简”的字形差异,详加分析如次:(另参见附件2)
调整后简繁体字形差异:字例
---------------- |
Big5-13060 |
陆规7000 |
1. 字形微差:勻/匀、戶/户、冊/册、丟/丢… |
51字 (2%) |
61 (3%) |
2. 只部首差异:廂/厢、悶/闷、欽/钦、惻/恻… |
1097字(46) |
1092 (47%) |
3. 其它差异:實/实、對/对、屢/屡、嶇/岖… |
1252字(52%) |
1149 (50%) |
上表第1项,简、繁体字形微小差异,虽无碍于认读,但对于汉字编码及字序排列不利,应予早日调整。
上表第2项,简繁体部首的差异虽只有10多个,若能调整统合,则将有1000多个简繁体字形,因之趋于统一,其杠杆作用甚大。有些部首亦可简繁并用,例如钅/金、讠/言…,类似 氵/水、忄/心,均是适应”方块”字形格局,因位置不同而变形,此等简繁部首应可并用。
由上表统计可知简繁部首取得一致之后,简繁体字形差异便会缩减了一半,可望向“书同文”目标 ,迈进了一大步。
7.0 附件
附件1. 简繁非对称字组综合统计的演绎
http://chinese.exponode.com/6_8.htm
本附件全面显示下表综合统计的细项内容及其演绎过程,花了笔者不少工夫,公之于此,以供有兴趣研究者参考。
资料来源 |
简字组数 |
“一对多”组数 |
1. 台湾规范Big5-13060字 |
2723 |
378 |
2. 大陆规范-7000字 |
2346 |
18 |
3. 普通古籍用字-11614 |
2616 |
413 |
4. Unihan基本集-27134字 |
3014 |
277 |
5. I-CORE-9809字 |
2424 |
148 |
综 合 净 得 (组) |
3024 |
532 |
附件2 简繁非对称字调整后效益
http://chinese.exponode.com/6_9.htm
本附件说明下表统计的由来
调整后简繁体字形差异 |
Big5-13060 |
陆规7000 |
1. 字形微差 |
51 字(2%) |
61字(3%) |
2. 只部首差异 |
1097字 (46) |
1092字(47%) |
3. 其它差异: |
1252字(52%) |
1149字(50%) |
附件3. 非对称字说明总表
本总表分为3项来说明:
1). 大陆规范拟增的18个传承字 (见前文)
2). 台湾规范拟璔的105个简化字 (见前文)
3). 其它简、繁”非对称”字 (详下表)
项目 |
简 – 繁 |
简 繁 一 对 多 处 理 方 式 说 明 |
3 |
乃 - 乃迺廼 |
乃/迺分立,迺除[乃]义外,尚作姓解;廼是迺的异体。 |
3 |
儿 - 儿兒 |
儿/兒对应; 但繁體亦有儿字,用在詞尾助詞。 |
3 |
厂 - 厂廠厰 |
厂/廠对应; 厰异体。 |
3 |
么 - 么麼 |
么/麼簡繁对应 |
3 |
于 - 于於 |
于/於对应 |
3 |
万 - 万萬 |
万/萬对应 |
3 |
丰 - 丰豐 |
丰/豐簡繁对应 |
3 |
与 - 与與 |
与/與簡繁对应 |
3 |
气 - 气氣 |
气/氣簡繁对应 |
3 |
占 - 占佔 |
佔是异体, 兩岸共用占字, 以免占卜误译作佔卜。 |
3 |
奶 - 奶嬭 |
嬭為奶异体,規範字不用它。 |
3 |
巨 - 巨鉅 |
巨/鉅分立,簡化字己有钜字,如此可免巨人误译作鉅人。 |
3 |
扑 - 扑撲 |
扑/撲对应 |
3 |
札 - 札劄 |
劄為异体,兩岸同用札字 |
3 |
圣 - 圣聖 |
圣/聖对应 |
3 |
宁 - 宁寧甯 |
宁/寧对应; 甯為寧异体, 規範字不用。 |
3 |
仿 - 仿倣 |
仿/倣簡繁对应 |
3 |
伙 - 伙夥 |
伙/夥对应 |
3 |
吁 - 吁籲訏 |
吁/籲对应;訏是吁的异体。 |
3 |
合 - 合郃閤 |
合包孕了郃/閤, 兩岸同用向字,可免合作误译作閤作。 |
3 |
吃 - 吃喫 |
喫是异体, 規範字不用。 |
3 |
夸 - 夸誇 |
夸/誇对应 |
3 |
朴 - 朴樸 |
朴/樸对应 |
3 |
污 - 污汙汚 |
污/汙对应; 汚是异体,不用。 |
3 |
考 - 考攷 |
攷是异体, 規範字不用。 |
3 |
虫 - 虫蟲 |
虫/蟲对应 |
3 |
优 - 优優 |
优/優对应 |
3 |
价 - 价價 |
价/價对应 |
3 |
冱 - 冱沍 |
冱/沍对应 |
3 |
庄 - 庄莊 |