简繁”非对称”字组的自动转译实验
1.0提要 2.0自动转译实验的方式及结果 3.0自动转译对照表的调整 4.0可删除的异体字拟案
5.0后记与结语 6.0 附表
1.0 提要
1.1
定义:本文所谓繁体,泛指台湾规范字,简体泛指大陆规范字。”非对称”的简繁对应也包括异体关系,笔者刻意不予区分,因为无论它们的关系如何,其解决的方式一样,须化”非对称”为”一对一”的对应。
1.2
文本:各家得出的”非对称”字组数量有相当差异,其原因除上述简繁关系与异体关系或合或分之外,还有就是各人所依据的文本资料不同。笔者是以大陆规范<现代汉语通用字表>7000字,以及台湾规范CNS11643常用字5401为基本。加上为求二者对应而采录的1700多个台湾次常用字,合计文本字数7376字组,共得“非对称“270字组(一简对二繁240,一对三以上30),字组数量曾依实际情况更新,并用简繁自动对译一一验证无误。
1.3 自动转译的实验:因为”非对称”字组中包括不少异体关系。要解决此项问题,使两岸文字成为”一对一”的对称,必须澈底解决异体字的纷歧,甚至需要两岸文字规范的统合。但这并非短期内能达到的目标。目前海峡两岸交往频繁,简繁字的转译全赖计算机自动转换。以短程目标而言,如果自动对译时没有误译,则即使存在”非对称”字组,也不至于影响文意的正确传达。基于这个理念,笔者作了全部270字组自动转译的实验(详文末附表),并假定完全没有词汇的智能设计。转译实验的结果显示:”繁转简”时,都没有误译,”非对称”字组皆可保持现状。”简转繁”时,大部分字组,也没有误译,只有18字组的字须作改变。
2.0 自动转译实验的方式及结果
2.1 实验的方式:就”一简对二繁”言,某一简体字(代号J )对应了二个繁体(代号F1,F2),设”>”表示简繁或简繁自动转译,则第一步:J > F1 > J ,第二步:F2 > J ,经过转译后,如果3个简体字”J”完全相同,则表示”繁转简”应该没有问题。而”一对多”的字组则照上述方式,续作”繁转简”的对译,即F3>J,F4>J,…。至于”简转繁”的对译有否误译,则除观察上述结果之外,还要考量日常用词问題。例如:郁>鬱>郁,郁>郁,转译后3 个简体字J (郁)完全相同,但郁是姓氏,就可能有:郁某人>鬱某人 的误译。(实验时完全不考虑软件的智能设计)。因此繁体”鬱”应加以处理,因”鬱”笔画太多,与其由大陆规范增添,不如由台湾规范取消,并认同简化字”郁”的现行字义,以郁代鬱。目前台湾书局销售简体书籍的不少,台湾民众认识简化字也相当多,相信个别字的取代应是可行。其实台湾现行规范也不必改订,只要”简繁转译”时,简化字”郁”保持原字形就可。
2.2 实验所得结果:在”非对称”270字组中,就一般应用言,”繁转简”几乎全无问题。这是因为”一对多”中的繁体对应的都是相同的简体字。例如:繁体”績”对应简体”绩”,勣为异体,但”勣”对应的简体也是”绩”。繁体词汇”成績、功勣”转译为”成绩、功绩”,文意没有改变。另一方面,在”简转繁”时,在270”非对称”字组中,虽然大部分没有问题,其理由与上述同。但却有18字组(占7%)须作一些更改,否则就会有错译出现。例如:卜卦>蔔卦,丁丑>丁醜,划船>劃船…。须更改的”非对称”字组,如表1. 所示。
表1. 非对称字组须改进的-18 (为免错译)
非对称字组 |
繁译简(无误) |
简译繁(误译) |
J |
F1 |
J |
F2>J |
建议: +(增) |
卜/蔔卜: |
卜挂>卜挂 |
卜挂>蔔掛 |
卜 |
蔔 |
卜 |
卜>卜 |
[陆规]+蔔 |
丑/醜丑: |
丁丑>丁丑 |
丁丑>丁醜 |
丑 |
醜 |
丑 |
丑>丑 |
[陆规] +醜 |
斗/鬥斗: |
五斗>五斗 |
五斗>五鬥 |
斗 |
鬥 |
斗 |
斗>斗 |
[陆规] +鬥or[门斗] |
发/發髮: |
梳頭髮>梳头发 |
梳头发>梳頭發 |
发 |
發 |
发 |
髮>发 |
[陆规]+髮or[发彡] |
范/範范: |
范某人>范某人 |
范某人>範某人 |
范 |
範 |
范 |
范>范 |
[台规]以范代範 |
复/複復: |
復興>复兴 |
复兴>複興 |
复 |
複 |
复 |
復>复 |
[陆规] +復 |
谷/穀谷: |
山之谷>山之谷 |
山之谷>山之穀 |
谷 |
穀 |
谷 |
谷>谷 |
[陆规]+穀 |
后/後后: |
皇后>皇后 |
皇后>皇後 |
后 |
後 |
后 |
后>后 |
[陆规]+後 |
划/劃划: |
划船>划船 |
划船>劃船 |
划 |
劃 |
划 |
划>划 |
[台规]以划代劃 |
坏/壞坏: |
陶坏>陶坏 |
陶坏>陶壞 |
坏 |
壞 |
坏 |
坏>坏 |
[台规]坏改作坯 |
几/幾几: |
茶几>茶几 |
茶几>茶幾, |
几 |
幾 |
几 |
几>几 |
[台规]以几代幾 |
姜/薑姜: |
姜某人>姜某人 |
姜某人>薑某人 |
姜 |
薑 |
姜 |
姜>姜 |
[陆规]+薑 |
里/裏里: |
6里遠>6里远 |
6里远>6裏遠 |
里 |
裏 |
里 |
里>里 |
[陆规]+裡or裹 |
历/曆歷: |
歷經>历经 |
历经>曆經 |
历 |
曆 |
历 |
歷>历 |
[陆规]+歷 |
么/麼, 幺/么 |
么喝>么喝 |
么喝>麼喝 |
么 |
麼 |
么 |
么>么 |
[台]么应改作幺 |
咸/鹹咸: |
咸豐>咸丰 |
咸丰>鹹豐 |
咸 |
鹹 |
咸 |
咸>咸 |
[陆规]+鹹 [卤咸] |
郁/鬱郁: |
憂鬱>忧郁 |
郁先生>鬱先生 |
郁 |
鬱 |
郁 |
郁>郁 |
[台規]以郁代鬱 |
干/幹榦干: |
干與>干与 |
干与>幹與 |
干 |
幹 |
干 |
干>干 |
[陆规]+幹 |
此外,为求文意表达准确,有6个字须作改进,如下表所示。
并/並併并:并vs并/並,副词
|
併(如併吞),动词,另列 |
并 |
並 |
并 |
併 |
并 |
[陆规]+併 |
局/局侷跼:局vs局/侷
|
跼,曲身,宜另列 |
局 |
局 |
局 |
侷 |
局 |
[陆规]+跼 |
蒙/蒙濛矇懞:蒙vs蒙/矇/懞 |
濛(如濛濛细雨),另列 |
蒙 |
蒙 |
蒙 |
濛 |
蒙 |
[陆规]+濛 |
台/台臺檯颱:台vs 臺檯 |
颱(颱风与台风有别) |
台 |
台 |
台 |
臺 |
台 |
+颱[风台] |
系/系係繫:系vs系/繫
|
係有”乃”义,宜另列 |
系 |
系 |
系 |
係 |
系 |
[陆规]+係 |
只/只隻衹:衹/只; [qi2]僧衣 |
只/隻对应, 衹另列 |
只 |
只 |
只 |
隻 |
只 |
[陆规]+衹 |
由上表可知,大陆规范须增加12字:蔔、鬥、醜、髮、復、穀、後、薑、裡、歷、鹹、幹。它们可恢复为繁体,有的亦可简作其它字形,如:
a. 鬥,亦可改作[门斗],以便书写。
b. 髮,亦可简作[发彡],新的形声字,[发]用作声符,[彡]用作形符,类如”须”的形符。
c. 後,常有”皇後”等的错译,简转繁对译时不妨直接以后代後 (即两岸同用”后”表後义)
d. 穀,可照壳的方式予以简化。
e. 鹹,形旁鹵可类推简化作卤,以省笔画。
f. 幹,亦可取”幹”的右旁。
台湾规范字要改的6字:範、劃、幾、鬱、坏、么
----
a. 繁体 範、劃、幾、鬱 笔画太多,应从简,即使用 范、划、几、郁,以与简体一一对应。
b. 繁体”坏”是”坯”的异体,又是”壞”的简体,二者形同而音义互异,故宜用坯代坏,坏专用作壞的简体。
c. 繁体”么”[yao]的简体是”幺”,而同形的”么”[mo]又作为麼的简体,形同而音义互异,故繁体”么”[yao]应改作”幺”,以与简体作对应。
3.0 自动转译对照表的调整(举例说明)
目前简繁自动转译在市场上有不同的软件,但所依据的是大家公认的一个简繁对照表。笔者在作自动转译实验时,发现这个对照表的一些字组,若能作合理的变更,对解决非对称问题,有所助益。所谓合理的变更,可举例说明之。例如,简体既有象声词咚,繁体鼕对应的应是咚,而非冬。又如
荐/薦荐,薦虽常用,其实是荐的异体,因此简体荐宜对应同一字形的荐,荐易写易认。须更正的”自动转译”的字组共31个字例,如下表所示。表中最后一栏注明更正的理由。理由共有六项:
a. 原译字为繁体字异体 b.新译字与简体字同形或对应 c.新译字可免二义性误译
d.改正原译字错误 e. 新译字结构简单 f. 新译字具有形声功能
表 2. 简繁转译时现译字的更正 (31)
号 |
非对称字 |
说 明 |
原译 |
新译 |
理由 |
1 |
痴/癡痴 |
癡,台规异体;痴,形声兼意,两岸共作规范 |
癡 |
痴 |
a,b,
e,f |
2 |
虫/蟲虫 |
虫义同蟲,虫另有虺(hui3)义 |
蟲 |
虫 |
b,e |
3 |
咚/咚鼕 |
象声不宜用冬, 鼕vs咚 |
冬 |
咚 |
b,d |
4 |
党/黨党 |
黨,本义为黝黑;党,本义地方组织,更近今义 |
黨 |
党 |
b,e |
5 |
炖/燉炖 |
炖义含燉(煮) |
燉 |
炖 |
b,e |
6 |
挂/掛挂 |
掛为挂或体 |
掛 |
挂 |
a,b. |
7 |
饥/饑飢 |
宜从简;饥/飢对应较佳 |
饑 |
飢 |
b,e |
8 |
汇/彙匯 |
汇可兼彙义,汇与匯对等对应 |
彙 |
匯 |
b,e,f |
9 |
荐/薦荐 |
薦,台湾规范的异体, 两岸共用荐为规范 |
薦 |
荐 |
a. b. e. |
10 |
据/據据 |
据除含據义外,尚有”拮据”义,含义较广 |
據 |
据 |
b,c, |
11 |
霉/黴霉 |
黴,异体,两岸同用霉为规范字 |
黴 |
霉 |
a. b. f |
12 |
捻/撚捻 |
捻,以指搓,捏; 说文作撚 |
撚 |
捻 |
b. e. f |
13 |
啮/齧嚙 |
齧,同啮 |
齧 |
嚙 |
b. e |
14 |
确/確确 |
确, 说文作确,徐铉:今俗作確,非是 |
確 |
确 |
b. f |
15 |
晒/曬晒 |
曬,台湾规范的异体 |
曬 |
晒 |
a. b. e. |
16 |
尸/屍尸 |
尸含屍义 |
屍 |
尸 |
b. e. |
17 |
叹/歎嘆 |
歎,或体 |
歎 |
嘆 |
a. b. |
18 |
体/體体 |
从简,體不用; 两岸共用体为规范 |
體 |
体 |
b. e. |
19 |
万/萬万 |
万,台湾规范次常用字,但亦常见 |
萬 |
万 |
b. e. |
20 |
污/汙污 |
污,或体,但污常用 |
汙 |
污 |
b. |
21 |
吁/籲吁 |
从简,籲不用 |
籲 |
吁 |
b. e. |
22 |
勋/勳勛 |
勳,台湾规范的异体 |
勳 |
勛 |
a. b. e. |
23 |
愿/願愿 |
愿义同願, 形符心较能表意 |
願 |
愿 |
b. e |
24 |
艳/豔艷 |
台湾规范艷为豔异体,但”艷”字理明白 |
豔 |
艷 |
b. |
25 |
药/藥葯 |
葯,台规次常用字,但药亦常见 |
藥 |
葯 |
b. |
26 |
岳/嶽岳 |
嶽,异体; 用岳可免岳飞译成嶽飞 |
嶽 |
岳 |
b. c. |
27 |
云/雲云 |
雲,累增,云兼雲義; 孔子云>孔子雲,错译 |
雲 |
云 |
b. c. |
28 |
涌/湧涌 |
涌为湧或体;取涌舍湧 |
湧 |
涌 |
b. e |
29 |
证/證証 |
在凭证/验证上,证證相通 |
證 |
証 |
b. e. |
30 |
冢/塚冢 |
塚,累增 |
塚 |
冢 |
b. e |
31 |
袅/嫋嬝裊 |
台规裊/嬝常用;嫋,次常用 |
嫋 |
裊 |
b.
e |
这样在二(多)个繁体中选用一个较佳的字,与简体配对,等于为传统汉字做了一番文字整理工作。原用字(如癡)目前字频可能较大,择优选用(痴)之后,由于网络的频繁转译,新译字(痴)渐渐取了优势,而为大家所乐用。这不仅解决了简繁的”非对称”问题,更有优化汉字的作用。痴(病于知)比癡,不仅更符合字理,而且结构简单,易于分析与编码。
4.0 可删除的异体字拟案
4.1 前文己说明,要澈底解决简繁”非对称”的问题,必须使它们”一对一”的对应,亦即在”多繁”中删除异体,或把”非异体”的字加入大陆规范中。如果甲乙二字的字义全合(犹如二个同心等径的圆),则为”迭合异体”;如果甲字的字义包括了乙字(大圆含着小圆),则为”包孕异体”;这二种情况都可取一舍一。很多情形是甲乙二字的字义有交叉但并不全等(二圆互交),就要二字并取。异体字的研究因涉及古书的训诂,是很费力而难精确的事。笔者浅陋,只举出一些字例作尝试。尚请方家给予指正
表3. 拟删除的异体字组93
非对称字说明 |
拟删字 |
非对称字说明 |
拟删字 |
杯/杯盃:盃或体 |
盃 |
尝/嘗嚐:嘗含嚐(试味)义 |
嚐 |
吃/吃喫:喫,或体 |
喫 |
锤/錘鎚:鎚为锤或体 |
鎚 |
棰/棰箠:箠为棰或体 |
箠 |
堤/堤隄:隄,或体 |
隄 |
唇/唇脣:脣,或体 |
脣 |
挂/掛挂:掛为挂或体 |
掛 |
焊/焊銲:銲通焊(接) |
銲 |
绩/績勣:勣,或体 |
勣 |
哗/嘩譁:譁,或体 |
譁 |
迹/跡蹟:蹟为跡的或体 |
蹟 |
鉴/鑒鑑:鑑义己为鉴/镜义取代 |
鑑 |
尽/盡儘:儘累增 |
儘 |
剿/剿勦:勦为剿或体 |
勦 |
浚/浚濬:从简, 濬不用 |
濬 |
坑/坑阬:阬,或体 |
阬 |
漓/漓灕:漓义含灕 ,灕罕用 |
灕 |
璃/璃琍:琍,异体 |
琍 |
帘/簾帘:簾,异体 |
簾 |
梁/梁樑:梁义含樑;梁兄>樑兄,错译 |
樑 |
炉/爐鑪:鑪,或体 |
鑪 |
菱/菱蔆:蔆为菱本字 |
蔆 |
霉/黴霉:黴,异体 |
黴 |
秘/秘祕:秘,或体 |
秘 |
娘/娘孃:孃,或体 |
孃 |
乃/乃迺:迺,或体 |
迺 |
盘/盤槃:槃,异体;繁体盤有形声功能 |
槃 |
炮/炮砲:砲,或体 |
砲 |
强/強彊:彊,或体 |
彊 |
戚/戚慼:戚可含慼义 |
慼 |
箬/箬篛:篛,或体 |
篛 |
剩/剩賸:賸,异体 |
賸 |
搜/搜蒐:蒐,异体 |
蒐 |
湿/溼濕:溼,或体 |
溼 |
蓑/蓑簑:簑,异体 |
簑 |
叹/歎嘆:歎,或体 |
歎 |
眺/眺覜:覜,异体 |
覜 |
藤/藤籐:籐,异体 |
籐 |
溪/溪谿:谿,异体 |
谿 |
嘻/嘻譆:譆为嘻异体(同指赞叹声) |
譆 |
弦/弦絃:絃,异体 |
絃 |
衔/銜啣:衔义含啣; 头衔>头啣;错译 |
啣 |
闲/閑閒:閒,异体 |
閒 |
筱/筱篠:集韵:筱或作篠
|
篠 |
恤/恤卹:卹,或体 |
卹 |
泄/泄洩:洩,或体 |
洩 |
烟/煙菸:菸,今字作煙 |
菸 |
岩/岩巖:岩,会意;巖,形声;
岩同巖 |
巖 |
肴/肴餚:餚,累增; 餚同肴
|
餚 |
焰/焰燄:燄异体 |
燄 |
迤/迤迆:迆,异体 |
迆 |
咱/咱喒:喒,异体 |
喒 |
棹/棹櫂:櫂为棹或体;棹义含櫂 |
櫂 |
占/占佔:佔,累增;占义含佔
|
佔 |
背/背揹:揹动词,背可兼揹义 |
揹 |
别/別彆:彆,弓末曲處;
别扭=彆扭 |
彆 |
出/出齣:出可兼齣义 |
齣 |
彩/彩綵:彩义含綵义(色彩,彩衣) |
綵 |
杆/杆桿:从简,桿不用;杆,声符合字音 |
桿 |
杠/杠槓:从简,槓不用? |
槓 |
克/克剋:剋,累增, 克兼剋义 |
剋 |
卷/卷捲:捲,累增,卷兼捲义 |
捲 |
累/累纍:累含纍义; 纍,台规次常用字 |
纍 |
卤/鹵滷:繁体鹵又作滷,滷异体 |
滷 |
念/念唸:念可兼唸义 |
唸 |
球/球毬:毬,今字作球 |
毬 |
虱/虱蝨:蝨,字亦作虱(或体)
|
蝨 |
席/席蓆:席含蓆义 |
蓆 |
熏/熏燻:熏含燻義 |
燻 |
效/效傚:傚,累增 |
傚 |
咽/咽嚥:咽义含嚥(yan4,吞)
|
嚥 |
扬/揚颺:扬含颺(飘扬)义 |
颺 |
照/照炤:照含炤(明,耀)义
|
炤 |
沾/沾霑:沾含霑义(浸湿,附着,沾光) |
霑 |
致/致緻:致含緻义(精细) |
緻 |
冢/塚冢:塚,同冢 |
塚 |
赞/贊讚:贊含讚义(称赞,一种文体) |
讚 |
殷/殷慇:殷含慇义 |
慇 |
筑/築筑:筑含築义(建造);
筑另作地名 |
築 |
注/注註:注含註义(批注,附记,登记) |
注 |
泛/泛氾汎:汎,氾或体; |
汎/氾 |
刨/刨鉋鑤:刨可兼动(刨)名(鉋)词 |
鑤 |
捆/捆梱綑:綑通捆, 捆,名词,捆动词 |
綑 |
袅/嫋嬝裊:裊/嬝常用;嫋,次常 |
嬝/嫋 |
苏/蘇甦囌:甦为异体 |
囌/甦 |
升/升昇陞:升含昇/陞義
|
昇/陞 |
愈/愈瘉癒:愈含瘉/癒义 |
瘉/癒 |
4.2 异体字研究不易(举例说明)
由<汉语大字典>查得 累/纍 的古今字义如次,每一义都引录古籍字句来说明(在此均省略)。
累:lei3 -1)堆积,2)连续,屡次,3)重迭,4)增加,5)拖累,6)合计,7)絫,计量单位,8)转行貌,9)通裸,10)姓
lei2-1)绳索, 亦作缧,2)拘捆,3)同交配期牡牛
lei4- 1)负担;2)伤害,3)嘱托,4)罪行,5)缺陷,6)忧患,7)疲劳,8)从,9)恐,10)指妻子与资产,11)亏欠,12)缠绕
lv4- 古匈奴官名
lie4-地名
纍:lei2-1)连缀,2)绳索,亦作缧,3)缠绕,4)拘捆,5)无罪而被迫致死,6)延及,7)联络貌,8)盛甲的器具,9)公牛,10)姓
lei3-同累;堆积,重迭
lei4-同累;拖累
而 <汉字形义分析字典>则着重今义解释,并表示纍是累的包孕异体,查得:累 [b纍] 字义----
a. lei4:疲劳
b. lei2:1)累赘 2)累累成串的
c. lei3:1)堆积 2)连续,多次 3)牵连
笔者相信”累”的原字形是”纍”,声符”畾”兼意,表示累赘、连绵;犹如雷的原字形是[雨/畾],雷声隆隆,连续重迭。但雷的原字形被淘汰,而累的原字形[纍]与累并存。在并存期中古人或用累或用纍,以致有<汉语大字典>那样纷歧的音义释解。因此,若从古今字义去判断,累/纍似应分列为二字,但若着重今义,则纍是累的包孕异体。
假定”书同文”的目标是5000个通用字,笔者主张,核定异体字不妨从宽,也就是应着重今义,使较多的异体淘汰。所谓淘汰是使它离开”通用字集”,回到汉字的”备用字库”,让专家学者在必要时访问它。台湾文字学家赵友培说:”字无生死,只有存废”,便是这个意思。偏爱繁体字的网友,大可放心吧。
5.0 后记与结语
5.1 本文”非对称”270字组与Ref-1原稿有差异的原因
其一是原稿中”非对称”字组,经香港胡百华先生引用后,增添了原稿未录的台湾次常用字,计17字组。其二是大陆通用字自1989出版之后可能有些修订,而此修订版已反映在自动转译的软件中。这些修订也使一部分”非对称”字组,成为”一对一” 的对称,亦即自动转译时,摆/擺、襬/襬、嗔/嗔、瞋/瞋、圭/圭、珪/珪、沈/沈、渖/瀋 …,参见下表(共23组,可用自动转译尝试,每组第3 字都有相当的简体对应) :
摆/擺襬 |
才/才纔 |
嗔/嗔瞋 |
圭/圭珪 |
筋/筋觔 |
淋/淋痳 |
悯/憫愍 |
你/你妳 |
碰/碰踫 |
匹/匹疋 |
钳/鉗拑 |
枪/槍鎗 |
熔/熔鎔 |
薯/薯藷 |
嵩/嵩崧 |
镶/鑲瓖 |
移/移迻 |
沄/沄澐 |
胄/胄冑 |
资/資貲 |
咨/咨諮 |
沈/沈渖 |
它/牠祂 |
|
5.2
待改进的18个“非对称“字组的分析:
兹将前文2.0 节 表1. 所列待改进的字组归纳之如次表:
卜/蔔卜: |
丑/醜丑: |
斗/鬥斗: |
发/發髮: |
范/範范: |
么/麼, 幺/么 |
复/複復: |
谷/穀谷: |
后/後后: |
划/劃划: |
坏/壞坏: |
几/幾几: |
姜/薑姜: |
里/裏里: |
历/曆歷: |
干/幹榦干 |
咸/鹹咸: |
郁/鬱郁: |
详细观察各组的简繁体字义,发现它们之间少有观念上的联系,大多只是“近音代替“。勉强的说,小“丑“ 与 “醜“ 陋相近,计“劃”与“划”算沾边,“歷“史 与 “曆“法 有些联系。躯“幹“ 与 树“榦“ 在主体的意义上相关,“複“ 写 与 “復“写 在动作上似乎相通。草木茂盛为“鬱“,文采美盛为“郁”,在繁盛的形象上相似;但 忧鬱 与“郁馥”给人的感觉却是相反。因此严格说来,18个字组中,只有“幹/榦“有包孕的异体关系。
然而我们不宜全然用传统字的语境(港台)去思考这些词义的差别,毕竟简化字已风行了半个多世纪,“近音代替”的字词涵义己经约定俗成。今天认为它们必须改进的原因,主要还是在对译时发生了歧义。假如我们认同在简化字语境下的词义,即:卜兼蔔义,斗兼鬥义,丑兼醜义,范兼範义,后兼後义,划兼劃义,几兼幾义,姜兼薑义,里兼裏义,谷兼穀义,咸兼鹹义,郁兼鬱义。亦即在“简转繁”对译时,仍保留它们原来的简体字形,是否可行呢?笔者认为在相当时间内,恐难为港台民众所接受,因此,仍建议大陆规范增加这些字 ,以使简繁能“一对一“对应。
5.3 结语
经过简繁自动转译的实验后,得到如下结果:
1. “繁转简“自动对译 ---即使存在“非对称“字组,亦极少有错译问题,笔者多年来的实践也证明了这一点。
2. “简转繁“自动对译 ---大部分没有问题,只有18个字组有误译的情况,有待改进 (详表1.)。
3. 有31个现译的字组若能作一些合理的变更,选择一个适当对应的繁体字,对解决“非对称“问题,有所助益 (详表2 ) 。
4. 异体问题的研究相当不易,笔者建议着重在今义的分析。为达到书同文(5000通用字)的目标,古义或罕用义暂可忽略。笔者拟议删除的 93个异体字(详表3),是否妥适,尚待方家给予审阅并指正。
5. 在”非对称”270字组中,本文已提出建议的共148 (=18+6+31+93) 组,尚余122组是待决的异体问题。
笔者生长在繁体字的语境中,迄今仍习惯使用繁体打字。在网站上发表的简体文章,完全是自动转译而成的。多年来实践的经验,得知”繁转简”的文本极少出问题。出问题的还是一些词汇的不当转译,例如繁体“字元”译作简体“字符”,有违笔者的原意。由此可知智能设计的功能有其限度,而简繁“非对称“问题的解决,根本之道还是自改进两岸文字规范本身着手。
Ref.1 李牧<两岸汉字字形的比较与分析〉,《汉字书同文》第6辑(pp.33-56),2005
Ref.2 胡百华<汉字简一繁多对应表>,香港語文建設通訊10/2008 - http://www.huayuqiao.org/
6.0 附表
附表1. 非对称字组自动转译实验(一简对二繁,120組,240字)
1). 表内 若简体字形 A=C=E,表示 “繁转简“ 没有问题。
2). 若简体A=繁体B或其对等字形(如锤/锤),则“简转繁“问题亦少。由此可知有些字组最好能更换简繁对应字,例如现译 啮/齧,宜改译为 啮/嚙。
字组 |
简J>繁F1> J |
繁F2 >简J |
|||
|
A |
B |
C |
D |
E |
庵/庵菴: |
庵 |
庵 |
庵 |
菴 |
庵 |
板/板闆: |
板 |
板 |
板 |
闆 |
板 |
杯/杯盃: |
杯 |
杯 |
杯 |
盃 |
杯 |
背/背揹: |
背 |
背 |
背 |
揹 |
背 |
表/表錶: |
表 |
表 |
表 |
錶 |
表 |
别/別彆: |
别 |
別 |
别 |
彆 |
别 |
卜/蔔卜: |
卜 |
蔔 |
卜 |
卜 |
卜 |
布/布佈: |
布 |
布 |
布 |
佈 |
布 |
采/采採: |
采 |
采 |
采 |
採 |
采 |
彩/彩綵: |
彩 |
彩 |
彩 |
綵 |
彩 |
铲/鏟剷: |
铲 |
鏟 |
铲 |
剷 |
铲 |
尝/嘗嚐: |
尝 |
嘗 |
尝 |
嚐 |
尝 |
厂/厂廠; |
厂 |
廠 |
厂 |
厂 |
厂 |
吃/吃喫: |
吃 |
吃 |
吃 |
喫 |
吃 |
痴/癡痴: |
痴 |
癡 |
痴 |
痴 |
痴 |
冲/沖衝: |
冲 |
沖 |
冲 |
衝 |
冲 |
虫/蟲虫: |
虫 |
蟲 |
虫 |
蟲 |
虫 |
丑/醜丑: |
丑 |
醜 |
丑 |
丑 |
丑 |
出/出齣: |
出 |
出 |
出 |
齣 |
出 |
锤/錘鎚: |
锤 |
錘 |
锤 |
鎚 |
锤 |
棰/棰箠: |
棰 |
棰 |
棰 |
箠 |
棰 |
唇/唇脣: |
唇 |
唇 |
唇 |
脣 |
唇 |
啖/啖啗: |
啖 |
啖 |
啖 |
啗 |
啖 |
当/當噹: |
当 |
當 |
当 |
噹 |
当 |
党/黨党: |
党 |
黨 |
党 |
党 |
党 |
荡/蕩盪: |
荡 |
蕩 |
荡 |
盪 |
荡 |
堤/堤隄: |
堤 |
堤 |
堤 |
隄 |
堤 |
抵/抵牴: |
抵 |
抵 |
抵 |
牴 |
抵 |
淀/澱淀: |
淀 |
澱 |
淀 |
淀 |
淀 |
雕/雕彫: |
雕 |
雕 |
雕 |
彫 |
雕 |
吊/吊弔: |
吊 |
吊 |
吊 |
弔 |
吊 |
咚/咚鼕: |
咚 |
咚 |
咚 |
鼕 |
冬 |
斗/鬥斗: |
斗 |
鬥 |
斗 |
斗 |
斗 |
炖/燉炖: |
炖 |
燉 |
炖 |
炖 |
炖 |
恶/惡噁: |
恶 |
惡 |
恶 |
噁 |
恶 |
儿/兒儿: |
儿 |
兒 |
儿 |
儿 |
儿 |
发/發髮: |
发 |
發 |
发 |
髮 |
发 |
翻/翻繙: |
翻 |
翻 |
翻 |
繙 |
翻 |
范/範范: |
范 |
範 |
范 |
范 |
范 |
仿/仿倣: |
仿 |
仿 |
仿 |
倣 |
仿 |
丰/豐丰: |
丰 |
豐 |
丰 |
丰 |
丰 |
佛/佛彿: |
佛 |
佛 |
佛 |
彿 |
佛 |
夫/夫伕: |
夫 |
夫 |
夫 |
伕 |
夫 |
复/複復: |
复 |
複 |
复 |
復 |
复 |
杆/杆桿: |
杆 |
杆 |
杆 |
桿 |
杆 |
杠/杠槓: |
杠 |
杠 |
杠 |
槓 |
杠 |
个/個箇: |
个 |
個 |
个 |
箇 |
个 |
构/構搆: |
构 |
構 |
构 |
搆 |
构 |
谷/穀谷 |
谷 |
穀 |
谷 |
谷 |
谷 |
雇/雇僱: |
雇 |
雇 |
雇 |
僱 |
雇 |
刮/刮颳: |
刮 |
刮 |
刮 |
颳 |
刮 |
挂/掛挂: |
挂 |
掛 |
挂 |
挂 |
挂 |
拐/拐枴: |
拐 |
拐 |
拐 |
枴 |
拐 |
柜/櫃柜: |
柜 |
櫃 |
柜 |
柜 |
柜 |
焊/焊銲: |
焊 |
焊 |
焊 |
銲 |
焊 |
合/合閤: |
合 |
合 |
合 |
閤 |
合 |
哄/哄鬨: |
哄 |
哄 |
哄 |
鬨 |
哄 |
后/後后: |
后 |
後 |
后 |
后 |
后 |
胡/胡鬍: |
胡 |
胡 |
胡 |
鬍 |
胡 |
划/劃划: |
划 |
劃 |
划 |
划 |
划 |
哗/嘩譁: |
哗 |
嘩 |
哗 |
譁 |
哗 |
坏/壞坏: |
坏 |
壞 |
坏 |
坏 |
坏 |
回/回迴: |
回 |
回 |
回 |
迴 |
回 |
毁/毀燬: |
毁 |
毀 |
毁 |
燬 |
毁 |
汇/彙匯: |
汇 |
彙 |
汇 |
匯 |
汇 |
获/獲穫: |
获 |
獲 |
获 |
穫 |
获 |
饥/饑飢: |
饥 |
饑 |
饥 |
飢 |
饥 |
几/幾几: |
几 |
幾 |
几 |
幾 |
几 |
绩/績勣: |
绩 |
績 |
绩 |
勣 |
绩 |
迹/跡蹟: |
迹 |
跡 |
迹 |
蹟 |
迹 |
家/家傢: |
家 |
家 |
家 |
傢 |
家 |
价/價价: |
价 |
價 |
价 |
价 |
价 |
奸/奸姦: |
奸 |
奸 |
奸 |
姦 |
奸 |
荐/薦荐: |
荐 |
薦 |
荐 |
荐 |
荐 |
鉴/鑒鑑: |
鉴 |
鑒 |
鉴 |
鑑 |
鉴 |
姜/薑姜: |
姜 |
薑 |
姜 |
姜 |
姜 |
剿/剿勦: |
剿 |
剿 |
剿 |
勦 |
剿 |
杰/傑杰: |
杰 |
傑 |
杰 |
杰 |
杰 |
尽/盡儘: |
尽 |
盡 |
尽 |
儘 |
尽 |
径/徑逕: |
径 |
徑 |
径 |
逕 |
径 |
巨/巨鉅: |
巨 |
巨 |
巨 |
鉅 |
巨 |
据/據据: |
据 |
據 |
据 |
据 |
据 |
卷/卷捲: |
卷 |
卷 |
卷 |
捲 |
卷 |
浚/浚濬: |
浚 |
浚 |
浚 |
濬 |
浚 |
克/克剋: |
克 |
克 |
克 |
剋 |
克 |
坑/坑阬: |
坑 |
坑 |
坑 |
阬 |
坑 |
扣/扣釦: |
扣 |
扣 |
扣 |
釦 |
扣 |
夸/誇夸: |
夸 |
誇 |
夸 |
誇 |
夸 |
馈/饋餽: |
馈 |
饋 |
馈 |
餽 |
馈 |
昆/昆崑: |
昆 |
昆 |
昆 |
崑 |
昆 |
困/困睏: |
困 |
困 |
困 |
睏 |
困 |
蜡/蠟蜡: |
蜡 |
蠟 |
蜡 |
蜡 |
蜡 |
腊/臘腊: |
腊 |
臘 |
腊 |
腊 |
腊 |
琅/琅瑯: |
琅 |
琅 |
琅 |
瑯 |
琅 |
累/累纍: |
累 |
累 |
累 |
纍 |
累 |
狸/狸貍: |
狸 |
狸 |
狸 |
貍 |
狸 |
璃/璃琍: |
璃 |
璃 |
璃 |
琍 |
璃 |
漓/漓灕: |
漓 |
漓 |
漓 |
灕 |
漓 |
里/裏里: |
里 |
裏 |
里 |
里 |
里 |
栗/栗慄: |
栗 |
栗 |
栗 |
慄 |
栗 |
历/曆歷: |
历 |
曆 |
历 |
歷 |
历 |
帘/簾帘: |
帘 |
簾 |
帘 |
帘 |
帘 |
炼/煉鍊: |
炼 |
煉 |
炼 |
鍊 |
炼 |
梁/梁樑: |
梁 |
梁 |
梁 |
樑 |
梁 |
磷/磷燐: |
磷 |
磷 |
磷 |
燐 |
磷 |
菱/菱蔆: |
菱 |
菱 |
菱 |
蔆 |
菱 |
溜/溜霤: |
溜 |
溜 |
溜 |
霤 |
溜 |
炉/爐鑪: |
炉 |
爐 |
炉 |
鑪 |
炉 |
卤/鹵滷: |
卤 |
鹵 |
卤 |
滷 |
卤 |
仑/侖崙: |
仑 |
侖 |
仑 |
崙 |
仑 |
罗/羅儸: |
罗 |
羅 |
罗 |
儸 |
罗 |
麻/麻痲: |
麻 |
麻 |
麻 |
痲 |
痲 |
霉/黴霉: |
霉 |
黴 |
霉 |
霉 |
霉 |
弥/彌瀰: |
弥 |
彌 |
弥 |
瀰 |
弥 |
秘/秘祕: |
秘 |
秘 |
秘 |
祕 |
秘 |
面/面麵: |
面 |
面 |
面 |
麵 |
面 |
蔑/蔑衊: |
蔑 |
蔑 |
蔑 |
衊 |
蔑 |
模/模糢: |
模 |
模 |
模 |
糢 |
模 |
乃/乃迺: |
乃 |
乃 |
乃 |
迺 |
乃 |
捻/撚捻: |
捻 |
撚 |
捻 |
捻 |
捻 |
念/念唸: |
念 |
念 |
念 |
唸 |
念 |
娘/娘孃: |
娘 |
娘 |
娘 |
孃 |
娘 |
啮/齧嚙: |
啮 |
齧 |
啮 |
嚙 |
啮 |
宁/寧甯: |
宁 |
寧 |
宁 |
甯 |
宁 |
暖/暖煖: |
暖 |
暖 |
暖 |
煖 |
暖 |
盘/盤槃: |
盘 |
盤 |
盘 |
槃 |
盘 |
彷/彷徬: |
彷 |
彷 |
彷 |
徬 |
彷 |
炮/炮砲: |
炮 |
炮 |
炮 |
砲 |
炮 |
佩/佩珮: |
佩 |
佩 |
佩 |
珮 |
佩 |
辟/辟闢: |
辟 |
辟 |
辟 |
闢 |
辟 |
扑/撲扑: |
扑 |
撲 |
扑 |
扑 |
扑 |
仆/仆僕: |
仆 |
仆 |
仆 |
僕 |
仆 |
朴/樸朴: |
朴 |
樸 |
朴 |
朴 |
朴 |
凄/淒悽: |
凄 |
淒 |
凄 |
悽 |
凄 |
戚/戚慼: |
戚 |
戚 |
戚 |
慼 |
戚 |
千/千韆: |
千 |
千 |
千 |
韆 |
千 |
签/簽籤: |
签 |
簽 |
签 |
籤 |
签 |
纤/纖縴: |
纤 |
纖 |
纤 |
縴 |
纤 |
强/強彊: |
强 |
強 |
强 |
彊 |
强 |
秋/秋鞦: |
秋 |
秋 |
秋 |
鞦 |
秋 |
球/球毬: |
球 |
球 |
球 |
毬 |
球 |
曲/曲麴: |
曲 |
曲 |
曲 |
麴 |
曲 |
蜷/蜷踡: |
蜷 |
蜷 |
蜷 |
踡 |
蜷 |
确/確确: |
确 |
確 |
确 |
确 |
确 |
箬/箬篛: |
箬 |
箬 |
箬 |
篛 |
箬 |
晒/曬晒: |
晒 |
曬 |
晒 |
晒 |
晒 |
膻/膻羶: |
膻 |
膻 |
膻 |
羶 |
膻 |
舍/舍捨: |
舍 |
舍 |
舍 |
捨 |
舍 |
剩/剩賸: |
剩 |
剩 |
剩 |
賸 |
剩 |
尸/屍尸: |
尸 |
屍 |
尸 |
尸 |
尸 |
虱/虱蝨: |
虱 |
虱 |
虱 |
蝨 |
虱 |
湿/溼濕: |
湿 |
濕 |
湿 |
溼 |
湿 |
适/適适: |
适 |
適 |
适 |
适 |
适 |
朮/朮術: |
朮 |
朮 |
朮 |
術 |
术 |
松/松鬆: |
松 |
松 |
松 |
鬆 |
松 |
搜/搜蒐: |
搜 |
搜 |
搜 |
蒐 |
搜 |
酸/酸痠: |
酸 |
酸 |
酸 |
痠 |
酸 |
蓑/蓑簑: |
蓑 |
蓑 |
蓑 |
簑 |
蓑 |
坛/壇罈: |
坛 |
壇 |
坛 |
罈 |
坛 |
叹/歎嘆: |
叹 |
歎 |
叹 |
嘆 |
叹 |
藤/藤籐: |
藤 |
藤 |
藤 |
籐 |
藤 |
体/體体: |
体 |
體 |
体 |
体 |
体 |
眺/眺覜: |
眺 |
眺 |
眺 |
覜 |
眺 |
听/聽听: |
听 |
聽 |
听 |
听 |
听 |
涂/塗涂: |
涂 |
塗 |
涂 |
涂 |
涂 |
团/團糰: |
团 |
團 |
团 |
糰 |
团 |
托/托託: |
托 |
托 |
托 |
託 |
托 |
挽/挽輓: |
挽 |
挽 |
挽 |
輓 |
挽 |
万/萬万: |
万 |
萬 |
万 |
万 |
万 |
喂/喂餵: |
喂 |
喂 |
喂 |
餵 |
喂 |
污/汙污: |
污 |
汙 |
污 |
污 |
污 |
溪/溪谿: |
溪 |
溪 |
溪 |
谿 |
溪 |
嘻/嘻譆: |
嘻 |
嘻 |
嘻 |
譆 |
嘻 |
席/席蓆: |
席 |
席 |
席 |
蓆 |
席 |
咸/鹹咸: |
咸 |
鹹 |
咸 |
咸 |
咸 |
衔/銜啣: |
衔 |
銜 |
衔 |
啣 |
衔 |
弦/弦絃: |
弦 |
弦 |
弦 |
絃 |
弦 |
闲/閑閒: |
闲 |
閑 |
闲 |
閒 |
闲 |
向/向嚮: |
向 |
向 |
向 |
嚮 |
向 |
筱/筱篠: |
筱 |
筱 |
筱 |
篠 |
筱 |
效/效傚: |
效 |
效 |
效 |
傚 |
效 |
泄/泄洩: |
泄 |
泄 |
泄 |
洩 |
泄 |
欣/欣訢: |
欣 |
欣 |
欣 |
訢 |
欣 |
幸/幸倖: |
幸 |
幸 |
幸 |
倖 |
幸 |
凶/凶兇: |
凶 |
凶 |
凶 |
兇 |
凶 |
修/修脩: |
修 |
修 |
修 |
脩 |
修 |
吁/籲吁: |
吁 |
籲 |
吁 |
吁 |
吁 |
须/須鬚: |
须 |
須 |
须 |
鬚 |
须 |
恤/恤卹: |
恤 |
恤 |
恤 |
卹 |
恤 |
旋/旋鏇: |
旋 |
旋 |
旋 |
鏇 |
旋 |
勋/勳勛: |
勋 |
勳 |
勋 |
勛 |
勋 |
熏/熏燻: |
熏 |
熏 |
熏 |
燻 |
熏 |
埙/塤壎: |
埙 |
塤 |
埙 |
壎 |
埙 |
腌/醃腌: |
腌 |
醃 |
腌 |
腌 |
腌 |
烟/煙菸: |
烟 |
煙 |
烟 |
菸 |
烟 |
檐/簷檐: |
檐 |
簷 |
檐 |
檐 |
檐 |
岩/岩巖: |
岩 |
岩 |
岩 |
巖 |
岩 |
咽/咽嚥: |
咽 |
咽 |
咽 |
嚥 |
咽 |
焰/焰燄: |
焰 |
焰 |
焰 |
燄 |
焰 |
艳/豔艷: |
艳 |
豔 |
艳 |
艷 |
艳 |
扬/揚颺: |
扬 |
揚 |
扬 |
颺 |
扬 |
么/麼么 |
么 |
麼 |
么 |
么 |
么 |
肴/肴餚: |
肴 |
肴 |
肴 |
餚 |
肴 |
药/藥葯: |
药 |
藥 |
药 |
葯 |
药 |
叶/葉叶: |
叶 |
葉 |
叶 |
叶 |
叶 |
迤/迤迆: |
迤 |
迤 |
迤 |
迆 |
迤 |
佑/佑祐: |
佑 |
佑 |
佑 |
祐 |
佑 |
殷/殷慇: |
殷 |
殷 |
殷 |
慇 |
殷 |
佣/傭佣: |
佣 |
傭 |
佣 |
傭 |
佣 |
涌/湧涌: |
涌 |
湧 |
涌 |
涌 |
涌 |
游/遊游: |
游 |
遊 |
游 |
游 |
游 |
郁/鬱郁: |
郁 |
鬱 |
郁 |
郁 |
郁 |
欲/欲慾: |
欲 |
欲 |
欲 |
慾 |
欲 |
御/禦御: |
御 |
禦 |
御 |
御 |
御 |
愿/願愿: |
愿 |
願 |
愿 |
愿 |
愿 |
岳/嶽岳: |
岳 |
嶽 |
岳 |
岳 |
岳 |
云/雲云: |
云 |
雲 |
云 |
云 |
云 |
芸/芸蕓: |
芸 |
芸 |
芸 |
蕓 |
芸 |
咱/咱喒: |
咱 |
咱 |
咱 |
喒 |
咱 |
赞/贊讚: |
赞 |
贊 |
赞 |
讚 |
赞 |
脏/髒臟: |
脏 |
髒 |
脏 |
臟 |
脏 |
噪/噪譟: |
噪 |
噪 |
噪 |
譟 |
噪 |
扎/紮扎: |
扎 |
紮 |
扎 |
扎 |
扎 |
榨/榨搾: |
榨 |
榨 |
榨 |
搾 |
榨 |
沾/沾霑: |
沾 |
沾 |
沾 |
霑 |
沾 |
占/占佔: |
占 |
占 |
占 |
佔 |
占 |
照/照炤: |
照 |
照 |
照 |
炤 |
照 |
棹/棹櫂: |
棹 |
棹 |
棹 |
櫂 |
棹 |
症/症癥: |
症 |
症 |
症 |
癥 |
症 |
证/證証: |
证 |
證 |
证 |
証 |
证 |
致/致緻: |
致 |
致 |
致 |
緻 |
致 |
制/制製: |
制 |
制 |
制 |
製 |
制 |
志/志誌: |
志 |
志 |
志 |
誌 |
志 |
钟/鍾鐘: |
钟 |
鍾 |
钟 |
鐘 |
钟 |
冢/塚冢: |
冢 |
塚 |
冢 |
塚 |
冢 |
种/種种: |
种 |
種 |
种 |
种 |
种 |
周/周週: |
周 |
周 |
周 |
週 |
周 |
朱/朱硃: |
朱 |
朱 |
朱 |
硃 |
朱 |
筑/築筑: |
筑 |
築 |
筑 |
筑 |
筑 |
注/注註: |
注 |
注 |
注 |
註 |
注 |
准/准準: |
准 |
准 |
准 |
準 |
准 |
璇/璇璿 |
璇 |
璿 |
璇 |
璇 |
璇 |
附表2. 自动转译实验 (一对三字以上,14組,30字)
表內4個J的字形相同,表示“繁轉簡“沒有問題
非對稱字組 |
簡J |
繁F1 |
簡J |
繁F2 |
簡J |
繁F3 |
簡J |
刨/刨鉋鑤: |
刨 |
刨 |
刨 |
鉋 |
刨 |
鑤 |
刨 |
并/並併并: |
并 |
並 |
并 |
併 |
并 |
并 |
并 |
泛/泛氾汎: |
泛 |
泛 |
泛 |
氾 |
泛 |
汎 |
泛 |
干/幹干榦: |
干 |
幹 |
干 |
干 |
干 |
榦 |
干 |
捆/捆梱綑: |
捆 |
捆 |
捆 |
梱 |
捆 |
綑 |
捆 |
局/局侷跼: |
局 |
局 |
局 |
侷 |
局 |
跼 |
局 |
蒙/蒙濛矇懞 |
蒙 |
蒙 |
蒙 |
濛 |
蒙 |
懞矇 |
蒙 |
袅/嫋嬝裊: |
袅 |
嫋 |
袅 |
嬝 |
袅 |
裊 |
袅 |
升/升昇陞: |
升 |
升 |
升 |
昇 |
升 |
陞 |
升 |
苏/蘇甦囌: |
苏 |
蘇 |
苏 |
甦 |
苏 |
囌 |
苏 |
台/台臺檯颱: |
台 |
台 |
台 |
臺 |
台 |
檯颱 |
台 |
系/系係繫: |
系 |
系 |
系 |
係 |
系 |
繫 |
系 |
愈/愈瘉癒: |
愈 |
愈 |
愈 |
瘉 |
愈 |
癒 |
愈 |
只/只隻衹: |
只 |
只 |
只 |
隻 |
只 |
衹 |
只 |