如何在现状下使繁简 ”非对称”字组成为”一对一”的对应
----- 并提出新的繁简转换软件供大家试用 ----
1.0. 引言
目前海峡两岸交流频繁,繁、简文本的对译,全靠自动转换。常因繁简”非对称”对应的问题需要人工校对,否则可能出错。所谓非对称字包括 一简多繁、一繁多简、及其所含的异体字。短时期内要修订两岸文字规范,看来并不容易。但在繁简对照的字表中作些变通处理,却是可行的。本文试提一个具体方案,拟定了繁简对应字表并转换程式,希能在如下条件下,做到较正确的对译:
a. 原则上不用软件的智能设计。
b. 容许在简体语境中出现少数繁体字。
c. 繁体正体字与简体作 ”一对一” 的可逆对应。
d. 繁体异体字与简体也各作 ”一对一” 的单向对应。以图示之如次:
繁体正体字ßà简体ç繁体异体字
寧ßà宁 ç甯
軟ßà软 ç輭
抵ßà抵 ç牴
↖觝
上图显示繁体正体字及其所属的异体字无论有多少个,对于简体言,都是”一对一”的对应。而且繁体正体字与简体字之间的对应是可逆的,而异体字向简体的转换则只能是单向的,这样就能保持繁简之间的”一对一”关系。例如,简体”抵”各自对应了繁体”抵、牴、觝”,表示它的字义与这3字相当。因”抵”与”牴、觝”之间是包孕异体关系,而”抵”的含义最广,故列之为繁体中的正体,与同形的简体”抵”对应;而异体”牴、觝”也是各自与简体 ”抵”一一对应。
依笔者从收集的多种资料中观察,繁简”非对称”问题,归根结底是如何解决异体字的对应问题。
2.0 繁简”非对称”字组来源及数量
首先要从现行用字资料中寻找繁简差异的字组,以及”非对称”字组的数目,现把它归纳之如下表:
资料来源 |
繁简差异 |
一简多繁 |
备 注 |
Big-5, 13060个(台湾常用及次常用字) |
2724字組 |
378字組 |
含异体 |
来自Unihan的统计, 题目忘记 (作者京典) |
2662 |
74 |
含异体 |
一般古籍用字的统计11614 (李牧) |
2616 |
413 |
含异体 |
七份非一一对应简繁字研究比较(陈明然) |
/ |
324 |
字組介紹,不代表作者意見 |
综合 |
2842 |
475 |
含异体 |
以上综合共得”一简多繁”475组,加上”一繁多简”15组,共有489”非对称”字组有待处理。
3.0 繁简”非对称”字组分类
”非对称”字组可分为如下数类:
3.1 D类:繁体有2个字与简体对应,其中1个字形与简体同,但并不通行;而另1个字形不同的繁体却是通行的正体,共有106组,列之如次表。正体字与简体作可逆对应,异体字与简体则作一对一的单向对应。请注意表中第二栏繁简字形完全相同,两栏的简体字形也相同。
D类– 106组
简<->繁正 |
繁异->简 |
儿<->兒 |
儿-儿 |
于<->於 |
于-于 |
万<->萬 |
万-万 |
占<->佔 |
占-占 |
夸<->誇 |
夸-夸 |
朴<->樸 |
朴-朴 |
虫<->蟲 |
虫-虫 |
优<->優 |
优-优 |
价<->價 |
价-价 |
冱<->沍 |
冱-冱 |
庄<->莊 |
庄-庄 |
异<->異 |
异-异 |
忏<->懺 |
忏-忏 |
机<->機 |
机-机 |
网<->網 |
网-网 |
佣<->傭 |
佣-佣 |
听<->聽 |
听-听 |
杆<->桿 |
杆-杆 |
杠<->槓 |
杠-杠 |
怀<->懷 |
怀-怀 |
扰<->擾 |
扰-扰 |
帘<->簾 |
帘-帘 |
杰<->傑 |
杰-杰 |
泄<->洩 |
泄-泄 |
肴<->餚 |
肴-肴 |
虱<->蝨 |
虱-虱 |
岭<->嶺 |
岭-岭 |
怜<->憐 |
怜-怜 |
极<->極 |
极-极 |
沓<->遝 |
沓-沓 |
泞<->濘 |
泞-泞 |
炖<->燉 |
炖-炖 |
虮<->蟣 |
虮-虮 |
挂<->掛 |
挂-挂 |
迤<->迆 |
迤-迤 |
昵<->暱 |
昵-昵 |
柜<->櫃 |
柜-柜 |
洼<->窪 |
洼-洼 |
洁<->潔 |
洁-洁 |
种<->種 |
种-种 |
胜<->勝 |
胜-胜 |
苹<->蘋 |
苹-苹 |
恒<->恆 |
恒-恒 |
冢<->塚 |
冢-冢 |
凌<->淩 |
凌-凌 |
涌<->湧 |
涌-涌 |
狸<->貍 |
狸-狸 |
皋<->臯 |
皋-皋 |
党<->黨 |
党-党 |
栖<->棲 |
栖-栖 |
涂<->塗 |
涂-涂 |
茧<->繭 |
茧-茧 |
蚕<->蠶 |
蚕-蚕 |
赶<->趕 |
赶-赶 |
适<->適 |
适-适 |
捻<->撚 |
捻-捻 |
琅<->瑯 |
琅-琅 |
惊<->驚 |
惊-惊 |
据<->據 |
据-据 |
淀<->澱 |
淀-淀 |
痒<->癢 |
痒-痒 |
硅<->矽 |
硅-硅 |
离<->離 |
离-离 |
秸<->稭 |
秸-秸 |
筑<->築 |
筑-筑 |
腌<->醃 |
腌-腌 |
雇<->僱 |
雇-雇 |
棱<->稜 |
棱-棱 |
确<->確 |
确-确 |
羡<->羨 |
羡-羡 |
舄<->潟 |
舄-舄 |
跖<->蹠 |
跖-跖 |
痴<->癡 |
痴-痴 |
痹<->痺 |
痹-痹 |
触<->觸 |
触-触 |
愿<->願 |
愿-愿 |
榨<->搾 |
榨-榨 |
漓<->灕 |
漓-漓 |
蓑<->簑 |
蓑-蓑 |
蜷<->踡 |
蜷-蜷 |
蜡<->蠟 |
蜡-蜡 |
踊<->踴 |
踊-踊 |
霉<->黴 |
霉-霉 |
蝎<->蠍 |
蝎-蝎 |
翱<->翺 |
翱-翱 |
雕<->彫 |
雕-雕 |
檐<->簷 |
檐-檐 |
篱<->籬 |
篱-篱 |
藤<->籐 |
藤-藤 |
牦<->犛 |
牦-牦 |
丰<->豐 |
丰-丰 |
与<->與 |
与-与 |
气<->氣 |
气-气 |
扑<->撲 |
扑-扑 |
圣<->聖 |
圣-圣 |
吊<->弔 |
吊-吊 |
熏<->燻 |
熏-熏 |
几<->幾 |
几>几 |
伙<->夥 |
伙>伙 |
尸<->屍 |
尸>尸 |
仆<->僕 |
仆>仆 |
辟<->闢 |
辟->辟 |
咸<->鹹 |
咸>咸 |
云<->雲 |
云>云 |
划<->劃 |
划>划 |
范<->范 |
範>范 |
3.2 E类:繁体有2个以上的字与简体对应,其中1个为正体,它的字形与简体相同。共有165个,列之如次表。正体字与简体作可逆对应,异体字与简体则各作”一对一”的单向对应。
E类–166组
簡<->繁正 |
繁異->簡 |
凶<->凶 |
兇>凶 |
夫<->夫 |
伕>夫 |
扎<->扎 |
紮>扎 |
只<->只 |
隻>只 |
布<->布 |
佈>布 |
札<->札 |
劄>札 |
仿<->仿 |
倣>仿 |
合<->合 |
閤>合 |
吃<->吃 |
喫>吃 |
奸<->奸 |
姦>奸 |
托<->托 |
託>托 |
朱<->朱 |
硃>朱 |
污<->污 |
汙>污 |
考<->考 |
攷>考 |
佛<->佛 |
彿>佛 |
佑<->佑 |
祐>佑 |
呆<->呆 |
獃>呆 |
困<->困 |
睏>困 |
坑<->坑 |
阬>坑 |
址<->址 |
阯>址 |
床<->床 |
牀>床 |
彷<->彷 |
徬>彷 |
志<->志 |
誌>志 |
灶<->灶 |
竈>灶 |
佩<->佩 |
珮>佩 |
刮<->刮 |
颳>刮 |
制<->制 |
製>制 |
卷<->卷 |
捲>卷 |
周<->周 |
週>周 |
幸<->幸 |
倖>幸 |
弦<->弦 |
絃>弦 |
征<->征 |
徵>征 |
念<->念 |
唸>念 |
拐<->拐 |
枴>拐 |
昆<->昆 |
崑>昆 |
杯<->杯 |
盃>杯 |
板<->板 |
闆>板 |
松<->松 |
鬆>松 |
注<->注 |
註>注 |
沾<->沾 |
霑>沾 |
舍<->舍 |
捨>舍 |
芸<->芸 |
蕓>芸 |
表<->表 |
錶>表 |
侄<->侄 |
姪>侄 |
咽<->咽 |
嚥>咽 |
哄<->哄 |
鬨>哄 |
咱<->咱 |
偺>咱 |
恤<->恤 |
卹>恤 |
背<->背 |
揹>背 |
致<->致 |
緻>致 |
厘<->厘 |
釐>厘 |
复<->復 |
複>复 |
洒<->洒 |
灑>洒 |
俯<->俯 |
頫>俯 |
修<->修 |
脩>修 |
准<->准 |
準>准 |
唇<->唇 |
脣>唇 |
娘<->娘 |
孃>娘 |
家<->家 |
傢>家 |
席<->席 |
蓆>席 |
挽<->挽 |
輓>挽 |
晒<->晒 |
曬>晒 |
核<->核 |
覈>核 |
殷<->殷 |
慇>殷 |
浚<->浚 |
濬>浚 |
留<->留 |
畱>留 |
症<->症 |
癥>症 |
秘<->秘 |
祕>秘 |
荐<->荐 |
薦>荐 |
偷<->偷 |
媮>偷 |
啖<->啖 |
啗>啖 |
庵<->庵 |
菴>庵 |
彩<->彩 |
綵>彩 |
御<->御 |
禦>御 |
旋<->旋 |
鏇>旋 |
梁<->梁 |
樑>梁 |
欲<->欲 |
慾>欲 |
淫<->淫 |
婬>淫 |
焊<->焊 |
銲>焊 |
球<->球 |
毬>球 |
眺<->眺 |
覜>眺 |
累<->累 |
纍>累 |
麻<->麻 |
痲>麻 |
勖<->勖 |
勗>勖 |
剩<->剩 |
賸>剩 |
喂<->喂 |
餵/喂 |
堤<->堤 |
隄>堤 |
棹<->棹 |
櫂>棹 |
焰<->焰 |
燄>焰 |
菱<->菱 |
蔆>菱 |
腊<->腊 |
臘>腊 |
剿<->剿 |
勦>剿 |
搜<->搜 |
蒐>搜 |
暖<->暖 |
煖>暖 |
溜<->溜 |
霤>溜 |
溪<->溪 |
谿>溪 |
照<->照 |
炤>照 |
酬<->酬 |
醻>酬 |
棰<->棰 |
箠>棰 |
筱<->筱 |
篠>筱 |
旗<->旗 |
旂>旗 |
演<->演 |
縯>演 |
管<->管 |
琯>管 |
酸<->酸 |
痠>酸 |
墉<->墉 |
鄘>墉 |
嘻<->嘻 |
譆>嘻 |
模<->模 |
糢>模 |
澄<->澄 |
澂>澄 |
璃<->璃 |
琍>璃 |
蔑<->蔑 |
衊>蔑 |
璇<->璇 |
璿>璇 |
箬<->箬 |
篛>箬 |
噪<->噪 |
譟>噪 |
磷<->磷 |
燐>磷 |
膻<->膻 |
羶>膻 |
襁<->襁 |
繦>襁 |
翻<->翻 |
繙>翻 |
鬃<->鬃 |
騣>鬃 |
耀<->耀 |
燿>耀 |
燕<->燕 |
鷰>燕 |
吁<->吁 |
籲>吁 |
向<->向 |
嚮>向 |
扣<->扣 |
釦>扣 |
圭<->圭 |
珪>圭 |
妊<->妊 |
姙>妊 |
吨<->吨 |
噸>吨 |
沄<->沄 |
澐>沄 |
拓<->拓 |
搨>拓 |
肮<->肮 |
骯>肮 |
淋<->淋 |
痳>淋 |
移<->移 |
迻>移 |
筋<->筋 |
觔>筋 |
嗔<->嗔 |
瞋>嗔 |
效<->效 |
傚>效 |
毡<->毡 |
氈>毡 |
奶<->奶 |
嬭>奶 |
鬥<->鬥 |
鬭>鬥 |
乃<->乃 |
迺>乃 |
出<->出 |
齣->出 |
游<->游 |
遊->游 |
丑<->丑 |
醜->丑 |
栗<->栗 |
慄>栗 |
郁<->郁 |
鬱>郁 |
岳<->岳 |
嶽>岳 |
范<->范 |
範>范 |
才<->才 |
纔>才 |
升<->升 |
昇/陞>升 |
曲<->曲 |
麴/麯>曲 |
克<->克 |
尅/剋>克 |
刨<->刨 |
鉋/鑤>刨 |
局<->局 |
侷/跼>局 |
系<->系 |
係/繫>系 |
岩<->岩 |
喦/巖>岩 |
抵<->抵 |
觝/牴>抵 |
泛<->泛 |
氾/汎>泛 |
炮<->炮 |
礮/砲>炮 |
胡<->胡 |
鬍/衚>胡 |
捆<->捆 |
綑/梱>捆 |
戚<->戚 |
鏚/慼>戚 |
愈<->愈 |
瘉/癒>愈 |
叙<->叙 |
敍/敘>叙 |
暗<->暗 |
闇/晻>暗 |
宴<->宴 |
醼/讌>宴 |
台<->台 |
檯/臺/颱>台 |
回<->回 |
迴/囬/廻>回 |
并<->并 |
竝/並/併>并 |
蒙<->蒙 |
濛/懞/矇>蒙 |
3.3 J类:为着繁、简体的正确对译,也为着一些简化字的语意更清晰,在简体的语境中有少数字必须采用繁体。例如 ”谷” 一字兼有繁体 ”谷、穀” 义,这是常用字,须分别转译。再如简体 ”历”,目前对应了 ”历、曆、歷” 3 字,而 曆、歷 字义不同,宜把”歷”字分出另译。又如,鼕,鼓声,现译为冬,宜改译为简体已有的”咚”字。端,除端义外尚有专义; 端、耑二字宜分译。
此外,繁体么(yao)的字形应改作幺;以免与简体么(麼)混同。繁体坏,原是坯的异体,应废去不用,以免与简体坏(壞)混同。
在简体语境中须恢复为繁体的有10个:穀(谷)、薑(姜)、髮(发)、後(后)、麺 (面)、鬥(斗)、幹(干)、歷(历)、裡(里)、醜(丑),详下表说明。
简<->繁 |
繁 -- 简 |
说 明 |
谷<->谷 |
穀<->穀 |
谷/穀分译; (山谷≠山穀) |
姜<->姜 |
薑<->薑 |
姜/薑分译; (姜子牙≠薑子牙) |
发<->發 |
髮<->髮 |
发/發对应;髮分译 (头发≠頭發) |
后<->后 |
後<->後 |
后/後分译; (皇后≠皇後) |
面<->面 |
麵<->麺; 靣>面 |
麺/面分译 (面臨≠麵臨) |
斗<->斗 |
鬥<->鬥; 鬭>鬥 |
斗/鬥分译; (五斗米≠五鬥米) |
干<->干 |
幹<->幹; 乾<->乾 |
干/幹分译 (干涉≠幹涉); 榦>幹 |
历<->曆 |
歷<->歷; 厤>历 |
历與曆对应; 歷分译; (歷史≠曆史) |
里<->里 |
裡<->裡; 裏>里 |
里/裡分译; (公里≠公裡) |
丑<->丑 |
醜<->醜 |
丑醜分译; (辛丑≠辛醜) |
在繁体的语境中,目前留下的简体字只有游(以游当遊)、岳(嶽) 2字。
也许有人说,软件的智能设计不是可以解决这些问题吗?它确实可解决大部分问题,但不是全部。文章是灵活的,千变万化的,智能设计只是一个网眼大的滤网,总有一些”非对称”字,成了漏网之鱼,出现在人们眼前。因此笔者主张应少用智能设计,澈底的做法是重新改订 ”繁简对照表”。
可能有人质疑:这样一来,一些繁体字混杂在简体文章中,不是乱了套,不符合用字规范了么?--- 这是个观念问题,需多费些笔墨作一番解释:
1).现行简体字不过2,000多个字种,而一本繁体书籍翻译成简体文本之後,传承的繁体字,仍占相当数量。既是如此,多几个传承字又有何妨?
2).目前网络上繁、简体文章交流频繁,并可即时转译。对于常用的繁体字,当不陌生。这样繁简并存的文章,约定俗成之後,等于为日後两岸修订规范字作”先期试验”,也为未来两岸”书同文”做些启发性的指引工作。
3.4 Y类:在474个非对称的字组中,大多数是繁体异体字的对应问题,把它归为Y类。此类字可分为2小类:
1). 等同异体(Y1):二者字义几乎全等,例如 劄/札、喫/吃…。
2). 非全等异体(Y2):例如包孕异体,或虽有部分字义差异,但是罕用。例如 御/禦、庵/菴…。
所有异体字和正体一样,都可与相当的简体作”一对一”的对应,详下文第4.0节。
4.0 异体字的对应
4.1 Y1类--- 繁体正体字与简体作可逆对应,异体字各与简体成”一对一”的单向对应。请注意第二栏的简化字与第一栏的同形,这表示繁体的正体字、异体字都与同一的简体字对应。
本表直接录自所搜集的非对称字组资料,其中一部分异体字并不常见,可能来自港澳,而这些字都有unicode。汉字异体之多之杂,由此可见一般。
Y1类 157字组
简<->繁正 |
繁异->简 |
瓮<->甕 |
罋>瓮 |
为<->為 |
爲>为 |
产<->産 |
產>产 |
众<->眾 |
衆>众 |
伞<->傘 |
繖>伞 |
伪<->偽 |
僞>伪 |
剑<->劍 |
劒>剑 |
勋<->勳 |
勛>勋 |
医<->醫 |
毉>医 |
卤<->鹵 |
滷>卤 |
厕<->廁 |
厠>厕 |
参<->參 |
葠>参 |
叹<->嘆 |
歎>叹 |
启<->啟 |
啓>启 |
哗<->嘩 |
譁>哗 |
啮<->嚙 |
齧>啮 |
啸<->嘯 |
歗>啸 |
嚣<->囂 |
嚻>嚣 |
场<->場 |
塲>场 |
垄<->壟 |
壠>垄 |
垆<->壚 |
罏>垆 |
埙<->塤 |
壎>埙 |
墙<->牆 |
墻>墙 |
壳<->殼 |
殻>壳 |
奁<->奩 |
匳>奁 |
妆<->妝 |
粧>妆 |
妩<->嫵 |
娬>妩 |
妫<->媯 |
嬀>妫 |
娴<->嫻 |
嫺>娴 |
宾<->賓 |
賔>宾 |
尝<->嘗 |
嚐>尝 |
尽<->盡 |
儘>尽 |
屃<->屭 |
屓>屃 |
岁<->歲 |
嵗>岁 |
岽<->崠 |
崬>岽 |
恹<->懨 |
懕>恹 |
悫<->愨 |
慤>悫 |
惭<->慚 |
慙>惭 |
懒<->懶 |
嬾>懒 |
挡<->擋 |
攩>挡 |
捣<->搗 |
擣>捣 |
携<->攜 |
擕>携 |
敛<->斂 |
歛>敛 |
杂<->雜 |
襍>杂 |
棂<->欞 |
櫺>棂 |
椟<->櫝 |
匵>椟 |
橹<->櫓 |
艣>橹 |
欢<->歡 |
懽>欢 |
沩<->溈 |
潙>沩 |
涩<->澀 |
澀>涩 |
湿<->濕 |
溼>湿 |
滟<->灩 |
灧>滟 |
炉<->爐 |
鑪>炉 |
炼<->煉 |
鍊>炼 |
疬<->鬁 |
癧>疬 |
瘘<->瘺 |
瘻>瘘 |
盘<->盤 |
槃>盘 |
矿<->礦 |
鑛>矿 |
硗<->磽 |
墝>硗 |
碱<->鹼 |
堿>碱 |
窑<->窯 |
窰>窑 |
窥<->窺 |
闚>窥 |
竖<->豎 |
竪>竖 |
笺<->箋 |
牋>箋 |
纴<->紝 |
絍>纴 |
线<->線 |
綫>线 |
绣<->綉 |
繡>绣 |
绦<->絛 |
縧>绦 |
绱<->緔 |
緔>绱 |
绵<->綿 |
緜>绵 |
绷<->繃 |
綳>绷 |
缗<->緡 |
緍>缗 |
缰<->韁 |
繮>缰 |
罂<->罌 |
甖>罂 |
艳<->艷 |
豔>艳 |
荫<->蔭 |
廕>荫 |
药<->藥 |
葯>药 |
莅<->蒞 |
涖>莅 |
莼<->蓴 |
蒓>莼 |
蚁<->蟻 |
螘>蚁 |
规<->規 |
槼>规 |
讹<->訛 |
譌>讹 |
说<->説 |
說>说 |
谣<->謡 |
謠>谣 |
谥<->謚 |
諡>谥 |
谪<->謫 |
讁>谪 |
谫<->謭 |
譾>谫 |
赃<->贓 |
贜>赃 |
赆<->贐 |
賮>赆 |
赍<->齎 |
賫>赍 |
赝<->贗 |
贋>赝 |
软<->軟 |
輭>软 |
辉<->輝 |
煇>辉 |
辒<->輼 |
轀>辒 |
辖<->轄 |
鎋>辖 |
辞<->辭 |
辤>辞 |
迹<->跡 |
蹟>迹 |
邻<->鄰 |
隣>邻 |
酝<->醖 |
醞>酝 |
鉴<->鑒 |
鑑>鉴 |
针<->針 |
鍼>针 |
钩<->鉤 |
鈎>钩 |
钵<->缽 |
鉢>钵 |
钻<->鉆 |
鑽>钻 |
铁<->鐵 |
銕>铁 |
铲<->剷 |
鏟>铲 |
铺<->鋪 |
舖>铺 |
锄<->鋤 |
耡>锄 |
锈<->銹 |
鏽>锈 |
锤<->錘 |
鎚>锤 |
锨<->鍁 |
杴>锨 |
镋<->鎲 |
钂>镋 |
镌<->鎸 |
鐫>镌 |
镢<->钁 |
鐝>镢 |
闲<->閑 |
閒>闲 |
闸<->閘 |
牐>闸 |
阅<->閲 |
閱>阅 |
阶<->階 |
堦>阶 |
雠<->讎 |
讐>雠 |
颓<->頹 |
穨>颓 |
颜<->顔 |
顏>颜 |
飙<->飆 |
飈>飙 |
馆<->館 |
舘>馆 |
馈<->饋 |
餽>馈 |
驱<->驅 |
敺>驱 |
驳<->駁 |
駮>驳 |
骂<->罵 |
駡>骂 |
骡<->騾 |
驘>骡 |
鲞<->鮝 |
鯗>鲞 |
鲠<->鯁 |
骾>鲠 |
鲧<->鯀 |
鮌>鲧 |
鳄<->鰐 |
鱷>鳄 |
鳅<->鰍 |
鰌>鳅 |
鳌<->鰲 |
鼇>鳌 |
鳖<->鱉 |
鼈>鳖 |
鳝<->鱔 |
鱓>鳝 |
鸡<->雞 |
鷄>鸡 |
鹅<->鵝 |
鵞>鹅 |
鹇<->鷴 |
鷳>鹇 |
鹍<->鵾 |
鶤>鹍 |
鹚<->鶿 |
鷀>鹚 |
鼗<->鞀 |
鞉>鼗 |
伫<->佇 |
竚>伫 |
录<->錄 |
彔>录 |
镶<->鑲 |
瓖>镶 |
坞<->塢 |
隖>坞 |
么<->麼 |
麽>么 |
悯<->憫 |
愍>悯 |
砖<->磚 |
塼/甎>砖 |
绁<->絏 |
緤/紲>绁 |
绒<->絨 |
毧/羢>绒 |
袜<->袜 |
韤/襪>袜 |
视<->視 |
眡/眎>视 |
袅<->嬝 |
嫋/裊>袅 |
体<->體 |
体/躰>体 |
采<->採 |
采/埰>采 |
构<->構 |
构/搆>构 |
4.2 Y2类 --繁体正体字与简体作可逆对应,异体字各与简体成”一对一”的单向对应。
Y2类 37字组:
简<->繁正 |
繁异->简 |
个<->個 |
箇>个 |
仑<->侖 |
崙>仑 |
兹<->茲 |
玆>兹 |
冲<->沖 |
衝>冲
|
别<->別 |
彆>别 |
团<->團 |
糰>团 |
坛<->壇 |
罈>坛 |
夹<->夾 |
裌>夹 |
弥<->彌 |
瀰>弥 |
强<->強 |
彊>强 |
径<->徑 |
逕>径 |
恶<->惡 |
噁>恶 |
毁<->毀 |
燬>毁 |
汇<->彙 |
匯>汇 |
慑<->懾 |
慴>慑 |
术<->術 |
朮>术 |
摆<->擺 |
襬>摆 |
饥<->饑 |
飢>饥 |
荡<->蕩 |
盪>荡 |
证<->證 |
証>证 |
烟<->煙 |
菸>烟 |
签<->簽 |
籤>签 |
纤<->纖 |
縴>纤 |
绩<->績 |
勣>绩 |
罗<->羅 |
儸>罗 |
脏<->臟 |
髒>脏 |
获<->獲 |
穫>获 |
衔<->銜 |
啣>衔 |
赞<->贊 |
讚>赞 |
宁<->寧 |
甯>宁 |
钥<->鑰 |
籥>钥 |
须<->須 |
鬚>须 |
苏<->蘇 |
甦/囌>苏 |
凄<->淒 |
悽/凄>凄 |
当<->當 |
噹/儅>当 |
扬<->揚 |
颺/敭>扬 |
攒<->攢 |
欑/儹>攒 |
以上474个繁简”非对称”字例,全是自现有资料中搜集得到的(参见上文2.0节)。但现行繁简转译软件内的字表,尚未更新,有些己简化的字并未录入,例如:
迭/ 迭疊 |
已有简化字叠,二者各自对应:迭<->迭,疊<->叠 |
审/審讅 |
已有简化字谉,二者各自对应:审<->審, 讅<->谉 |
向/向嚮曏 |
曏与向对应可能有误; 曏,不久也(说文),应另列 |
5.0 一繁多简的字组
除”一简多繁”外,尚有”一繁多简”,笔者目前搜集到的共有如下15字组,也需要处理。“多简”的处理情形详如下表。
一繁多简字组表- 15。
读音 |
繁 简简 |
处理方式 |
附 注 |
ban3 |
阪 阪坂 |
二字分用 |
蒲坂地名,宜留用 |
chu4 |
怵 怵憷 |
取怵舍憷 |
怵<->怵, 憷->怵 |
gao3 |
槁 槁藁 |
二字分用 |
藁,草本植物 |
gun3 |
滾 滚磙 |
二字分用 |
滾磙字义稍异 |
He |
呵 呵嗬 |
取呵舍嗬 |
呵<->呵, 嗬->呵 |
hu2 |
糊 糊煳 |
二字分用 |
糊煳字义稍异 |
Jiang4 |
強 强犟 |
二字分用 |
犟强义有别 |
liu4 |
溜 溜熘 |
二字分用 |
溜熘字义有别 |
Long3 |
壟 垄垅 |
取垄舍垅 |
壟<->垄, 垅->壟 |
Meng3 |
猛 猛勐 |
二字分用 |
勐,用做地名 |
Pi |
劈 劈噼 |
二字分用 |
劈噼字义稍异 |
Yui4 |
退 退煺 |
二字分用 |
退煺字义有别 |
Yuan2 |
原 原塬 |
二字分用 |
塬,西北黄土高原 |
nian3 |
鯰
鲶鲇 |
取鲶捨鲇 |
鯰<->鲶, 鲇->鯰 |
zhu4 |
著 著着 |
繁体增着 |
著<->著, 着<->着 |
由上表可知,各组内简化字互为异体的有怵/怵憷、呵/呵嗬、壟/垄垅、鯰/鲶鲇4字组,各须取一舍一。因字义稍异的有槁/槁藁、強/强犟、溜/溜熘 …10 字组,须保留使用;它们不必经过转换,照原字形进入繁体。有一个字组是最常用的”著/着”,二者音义本有差异,自应分别使用,其中”着”一字正是繁体缺少而要补充的。
6.0 新的繁简转译程式
笔者依照前文所述的理念,拟定了”一对一”的<繁简转换>程式草案,供大家试用。
http://www.exponode.com/misc/ch_conversion.php
这程式主要依据前文2.0节,繁简对照2842字组及474非对称字组而设计的。试用後如有差误,惠请告知,以便随时更正。我测试过该程式的容量,在20万字以内可一次输入转换。
笔者所设计的繁简转换程式,是实验性的,意在提供大家试用後,提出批评及改正的意见。我当从善如流,不断的修正程式内的繁简对照表,以期获得大家的认同。
7.0 结语
1). 多年来繁简”非对称”对应问题,给人带来了不少困扰。本文试以新的”繁简对照表”及一个公式去解决此难题。那公式是:繁、简正体字之间作可逆对应,异体字则作单向对应。
笔者认为在目前繁、简并行的年代中,繁、简体应处于同一平台,各为正体,容许在简体语境中出现少数繁体字。频繁交流、约定俗成之後,就可把这些目前认为不合规范的字,归纳入于规范之中。也就是说,语文应用在先,规范修正在後,我国歷代的文字整理(”正”字)都是走同一过程。
2). 解决繁简”非对称”字问题,其实就是如何处理汉字的正、异体问题。笔者认为所谓传承的正体字,并非一成不变的。在目前繁简并行的语境中,应给”正体字”新的定义,使它符合如下条件:
a. 它是较为通行的
b. 易学易用的
c. 较为符合字理的
如果现行繁体异体字与简体同形,而又能符合上述条件,则是首选。例如,在上文 D 类字表中,繁体 擾/扰 对应了简体 ”扰”,因为”擾”较为通行,我依照惯例选用”擾”作为正体。其实在繁体语境中,也有不少人使用”扰”,如把”扰”当作繁体正体字,则繁、简同形,有利于未来汉字的统一。
8.0 本文附记
经过十多天上网讨论及个人思考结果,繁简转换的”对照字表”有些修订。本文最後的结论是:原则上不用软件的智能设计,在下列条件下,可望得到繁简体”一对一”的对应。
1. 在简体的语境中恢复10个传承字:穀(谷)、薑(姜)、髮(发)、後(后)、麺(面)、鬥(斗)、幹(干)、歷(历) 、裡(里)、 醜(丑),与原简体并用,使字义更加明确。
2. 一部分”非对称”字组用简单的词语对应,避去错译。例如,以”佣金”避免”傭金”,”咸丰”避去”鹹丰”,”仆倒”避去”僕倒”……。
按当年汉字简化政策,除简省字形外,还要减省字量,所以才有”一简多繁”的对应发生。依本文统计,繁简对应的2842字组中,”一对一”的有2368组;”一对多”的有474组,加上”一对三以上”的48组,共省了522字,占了18%,不能说不多。为着节省字量,笔者在拟案时,尽可能不去增加繁体字。
3. 笔者提出繁简转换程式,供大家试用,以考验繁简对照表是否正确无误。
http://www.exponode.com/misc/ch_conversion.php