再谈简繁”非对称”字组的对应问题
1.0 引言
近日网上流传一篇<德国媒体预测中国未来30年>的文章,其中有关汉字字体方面的预测:
”2028年中国大陆进行简化字修改方案试运行,将简化的不科学,不成功的简化字取消,所有简体字应保持与繁体字一一对应,并且结构合理,表意明确。同时在港澳台地区推行新简体字。”
上述所谓”新简体字”的描述是:所有简体字应保持与繁体字一一对应”这个重点,个人觉得很有必要。在单一语境内(只在大陆内部行文),通常不觉得简繁对应”非对称”问题的严重性。但在简繁并行的地区(如海外)常有因简繁”非对称”对应而错译的困恼。看来大陆文教当局开始重视这个问题,而研订解决方案了,这是个好消息。笔者过去曾多次谈到这个问题,本文再就个人想法,提出一个方案,供大家参考。
2.0 简繁”非对称”字组的统计
首先,在两岸规范字范围内,究竟有多少”非对称”字组?这就要以计算机软件加以统计,才不致遗漏,其步骤是:
1. 列出两岸 简、繁规范字
2. 以<微软>设计的简繁对译程序,列出转译的繁(简)体字
3. 以程序自动求出:1.字形不同字组, 2.简一繁多字组,如次表。
规范字 |
字數 |
字形不同 |
简一繁多 |
a.台湾通用字 |
13,060 |
2,724 |
378 |
b.大陆通用字 |
7,000 |
2,346 |
18 |
c.大陆通用字 |
8,300 |
2,504 |
38 |
b+c |
------ |
----- |
46 |
a+b+c |
------ |
----- |
378 |
从台湾规范(a)求出的”一对多” 字组378,含盖了从大陆规范(b+c)求出的46字组。详细内容见下文各类字组的分析
3.0 一对多字组 A类
的分析
1. A類 --- 两个繁体字中的一个与简体同,简繁体己是”一对一”的对应,共113组。
例如
于↹於
丰↹豐
厂 |
厂廠 |
么 |
么麼 |
于 |
于於 |
万 |
万萬 |
丰 |
丰豐 |
扎 |
扎紮 |
与 |
与與 |
气 |
气氣 |
占 |
占佔 |
扑 |
扑撲 |
圣 |
圣聖 |
仿 |
仿倣 |
吊 |
吊弔 |
夸 |
夸誇 |
朴 |
朴樸 |
污 |
污汙 |
虫 |
虫蟲 |
优 |
优優 |
价 |
|
冱 |
冱沍 |
庄 |
庄莊 |
异 |
异異 |
忏 |
忏懺 |
机 |
机機 |
网 |
网網 |
呆 |
呆獃 |
听 |
听聽 |
坏 |
坏壞 |
杆 |
杆桿 |
杠 |
杠槓 |
体 |
体體 |
吨 |
吨噸 |
怀 |
怀懷 |
扰 |
扰擾 |
弦 |
弦絃 |
杰 |
杰傑 |
泄 |
泄洩 |
肴 |
肴餚 |
芸 |
芸蕓 |
虱 |
虱蝨 |
侄 |
侄姪 |
岭 |
岭嶺 |
怜 |
怜憐 |
极 |
极極 |
沓 |
沓遝 |
泞 |
泞濘 |
炖 |
炖燉 |
虮 |
虮蟣 |
挂 |
挂掛 |
迭 |
迭疊 |
迤 |
迤迆 |
昵 |
昵暱 |
柜 |
柜櫃 |
洼 |
洼窪 |
洁 |
洁潔 |
种 |
种種 |
胜 |
胜勝 |
苹 |
苹蘋 |
恒 |
恒恆 |
冢 |
冢塚 |
凌 |
凌淩 |
浚 |
浚濬 |
涌 |
涌湧 |
狸 |
狸貍 |
秘 |
秘祕 |
党 |
党黨 |
凄 |
凄淒 |
栖 |
栖棲 |
涂 |
涂塗 |
茧 |
茧繭 |
蚕 |
蚕蠶 |
蚝 |
蚝蠔 |
赶 |
赶趕 |
适 |
适適 |
庵 |
庵菴 |
琅 |
琅瑯 |
眺 |
眺覜 |
勖 |
勖勗 |
惊 |
惊驚 |
据 |
据據 |
淀 |
淀澱 |
痒 |
痒癢 |
硅 |
硅矽 |
离 |
离離 |
筑 |
筑築 |
腌 |
腌醃 |
菱 |
菱蔆 |
棱 |
棱稜 |
确 |
确確 |
羡 |
羡羨 |
腊 |
腊臘 |
舄 |
舄潟 |
跖 |
跖蹠 |
剿 |
剿勦 |
棰 |
棰箠 |
痹 |
痹痺 |
筱 |
筱篠 |
触 |
触觸 |
愿 |
愿願 |
榨 |
榨搾 |
漓 |
漓灕 |
蓑 |
蓑簑 |
蜷 |
蜷踡 |
蜡 |
蜡蠟 |
踊 |
踊踴 |
蔑 |
蔑衊 |
蝎 |
蝎蠍 |
檐 |
檐簷 |
篱 |
篱籬 |
膻 |
膻羶 |
藤 |
藤籐 |
莜 |
莜蓧 |
帘 |
帘簾 |
4.0. “一對多”字組 B類 的分析
繁體中的一字與簡體對應,其它一(多)字,作異字處理。
在”繁多”的字组中,如果有异体字存在,就可把它剔除,以使简繁达到”一对一”的关系。那些异体字先转为简体、再转回繁体时,字型改为正体。
例如:捣---搗擣,其中[擣]是[搗]的异体,可把它剔除,
捣/搗 就可一一对应。
繁体文章若出现”擣”字,转简时,作”捣”;若再转回繁体时,作”搗”,即:
捣 ↹ 搗 擣 → 捣
又如
宁/寧甯 宁 ↹ 寧(正) 甯(异) → 宁
在简繁互相转换中,简体文章的字形不变;繁体文章经一再转换后,异体化为正体,不会复元为原样,文意也不会变更。重点是二者必须近于全等异体。否则文意就不同了。
這類字組共204個,下表第二欄,左為正,右為異:
簡體 |
正,異 |
乃 |
乃迺 |
千 |
千韆 |
尸 |
尸屍 |
仆 |
仆僕 |
夫 |
夫伕 |
冬 |
冬鼕 |
出 |
出齣 |
奶 |
奶嬭 |
布 |
布佈 |
吃 |
吃喫 |
扣 |
扣釦 |
托 |
托託 |
曲 |
曲麴 |
考 |
考攷 |
佛 |
佛彿 |
佑 |
佑祐 |
克 |
克剋 |
困 |
困睏 |
坑 |
坑阬 |
址 |
址阯 |
彷 |
彷徬 |
志 |
志誌 |
佩 |
佩珮 |
刮 |
刮颳 |
制 |
制製 |
卷 |
卷捲 |
周 |
周週 |
幸 |
幸倖 |
征 |
征徵 |
念 |
念唸 |
昆 |
昆崑 |
杯 |
杯盃 |
板 |
板闆 |
松 |
松鬆 |
欣 |
欣訢 |
注 |
注註 |
沾 |
沾霑 |
舍 |
舍捨 |
表 |
表錶 |
咽 |
咽嚥 |
哄 |
哄鬨 |
恤 |
恤卹 |
炮 |
炮砲 |
秋 |
秋鞦 |
背 |
背揹 |
致 |
致緻 |
厘 |
厘釐 |
俯 |
俯頫 |
修 |
修脩 |
准 |
准準 |
唇 |
唇脣 |
娘 |
娘孃 |
家 |
家傢 |
席 |
席蓆 |
挽 |
挽輓 |
效 |
效傚 |
核 |
核覈 |
栗 |
栗慄 |
殷 |
殷慇 |
症 |
症癥 |
偷 |
偷媮 |
啖 |
啖啗 |
彩 |
彩綵 |
旋 |
旋鏇 |
梁 |
梁樑 |
欲 |
欲慾 |
淫 |
淫婬 |
球 |
球毬 |
累 |
累纍 |
剩 |
剩賸 |
喂 |
喂餵 |
堤 |
堤隄 |
棹 |
棹櫂 |
焰 |
焰燄 |
雇 |
雇僱 |
搜 |
搜蒐 |
暖 |
暖煖 |
溜 |
溜霤 |
溪 |
溪谿 |
照 |
照炤 |
辟 |
辟闢 |
旗 |
旗旂 |
演 |
演縯 |
管 |
管琯 |
酸 |
酸痠 |
墉 |
墉鄘 |
嘻 |
嘻譆 |
模 |
模糢 |
澄 |
澄澂 |
璃 |
璃琍 |
箬 |
箬篛 |
噪 |
噪譟 |
燕 |
燕鷰 |
雕 |
雕彫 |
磷 |
磷燐 |
翻 |
翻繙 |
鬃 |
鬃騣 |
耀 |
耀燿 |
别 |
別彆 |
强 |
強彊 |
脏 |
臟髒 |
宁 |
寧甯 |
个 |
個箇 |
仑 |
侖崙 |
伞 |
傘繖 |
兹 |
茲玆 |
冲 |
沖衝 |
勋 |
勳勛 |
医 |
醫毉 |
卤 |
鹵滷 |
参 |
參葠 |
叹 |
嘆歎 |
哗 |
嘩譁 |
团 |
團糰 |
垆 |
壚罏 |
埙 |
塤壎 |
墙 |
牆墻 |
夹 |
夾裌 |
妆 |
妝粧 |
娴 |
嫻嫺 |
审 |
審讅 |
尝 |
嘗嚐 |
尽 |
盡儘 |
弥 |
彌瀰 |
径 |
徑逕 |
慑 |
懾慴 |
懒 |
懶嬾 |
扬 |
揚颺 |
挡 |
擋攩 |
捣 |
搗擣 |
敛 |
斂歛 |
橹 |
櫓艣 |
欢 |
歡懽 |
湿 |
濕溼 |
炉 |
爐鑪 |
炼 |
煉鍊 |
烟 |
煙菸 |
牦 |
犛氂 |
砖 |
磚塼 |
硗 |
磽墝 |
碱 |
堿鹼 |
窥 |
窺闚 |
笺 |
箋牋 |
签 |
簽籤 |
绁 |
絏紲 |
绦 |
絛縚 |
绩 |
績勣 |
罂 |
罌甖 |
罗 |
羅儸 |
荡 |
蕩盪 |
荫 |
蔭廕 |
药 |
藥葯 |
获 |
獲穫 |
蚁 |
蟻螘 |
衔 |
銜啣 |
规 |
規槼 |
证 |
證証 |
赆 |
贐賮 |
赞 |
贊讚 |
辉 |
輝煇 |
迹 |
跡蹟 |
针 |
針鍼 |
铁 |
鐵銕 |
铲 |
鏟剷 |
铺 |
鋪舖 |
锄 |
鋤耡 |
锤 |
錘鎚 |
闲 |
閑閒 |
须 |
須鬚 |
颓 |
頹穨 |
馈 |
饋餽 |
驱 |
驅敺 |
驳 |
駁駮 |
鲠 |
鯁骾 |
升 |
升昇陞 |
台 |
台臺颱檯 |
向 |
向曏嚮 |
合 |
合郃閤 |
刨 |
刨鉋鑤 |
局 |
局侷跼 |
系 |
系係繫 |
岩 |
岩喦巖 |
拐 |
拐枴柺 |
抵 |
抵牴觝 |
泛 |
泛氾汎 |
采 |
採采埰 |
构 |
構构搆 |
咱 |
咱偺喒 |
胡 |
胡衚鬍 |
瓮 |
甕瓮罋 |
宴 |
宴醼讌 |
捆 |
捆梱綑 |
戚 |
戚慼鏚 |
焊 |
焊釬銲 |
愈 |
愈瘉癒 |
蒙 |
蒙濛懞矇 |
熏 |
熏燻薰 |
当 |
當儅噹 |
攒 |
攢儹欑 |
毁 |
毀燬譭 |
盘 |
盤槃磐 |
绒 |
絨毧羢 |
苏 |
蘇甦囌 |
鉴 |
鑒鋻鑑 |
前表我选用的正体,除它的字形尽可能与简体相近、有利于日后整合之外。还有别的一些考量。例如:
仆 |
仆僕 |
选仆,可免”前僕(仆)后继”的误译 |
佛 |
佛彿 |
选佛,可免”彿(佛)教”的误译 |
制 |
制製 |
选制,可免 製(制)度 的误译 |
松 |
松鬆 |
选松,可免 鬆(松)树 的误译 |
准 |
准準 |
选准,可免 準(准)许 的误译 |
栗 |
栗慄 |
选栗,可免 慄(栗)木 的误译 |
辟 |
辟闢 |
选辟,可免 复闢(辟) 的误译 |
5.0 <微软>对译设计须修改的说明
1. 订正少数误译的字组
在”简一繁多”的字组中,曾发现<微软>的对译设计有失误或不周之处,(即软件内”对照表”有误),例如:繁转简:扡-- >扦 ;扦-- >扦 ,因而形成了一个”一对多”字组:扦/扡扦。
但查<汉典>:
扡:1.(tuo)同拖;2.(chi3)顺木纹剖开;3.(yi3)迁移
扦:(qian),竹、木制成的一种针状器具
二者音义都不同,显然 扡/扦 的对应是错的。
2. 改用简明的繁体字作对应
个人认为在对应的多个繁体中,宜选用字型较为简单的一个,例如:
目前 <微软>对译:札↹劄,但繁体亦有札字,且亦通用,宜改为 札↹札, 劄→札
又如 <微软>对译:晒↹曬,但繁体亦有晒字,且更常用,宜改为 晒↹晒, 曬→晒
次表是类似可以从化简的字组,共23个 :
简一 |
繁多 |
改选的繁体 |
谥 |
謚諡 |
諡>謚 |
札 |
札劄 |
劄>札 |
吁 |
吁籲訏 |
籲>吁;訏>吁 |
郁 |
郁鬱 |
鬱>郁 |
洒 |
洒灑 |
灑>洒 |
晒 |
晒曬 |
曬>晒 |
荐 |
荐薦 |
薦>荐 |
捻 |
捻撚 |
撚>捻 |
痴 |
痴癡 |
癡>痴 |
霉 |
霉黴 |
黴>霉 |
璇 |
璇璿 |
璿>璇 |
襁 |
繈襁 |
繈>襁 |
啮 |
嚙齧 |
齧>嚙 |
棂 |
櫺欞 |
欞>櫺 |
艳 |
艷豔 |
豔>艷 |
袅 |
裊嫋嬝 |
嫋>裊;嬝>袅 |
钥 |
鈅鑰籥 |
鑰>鈅;籥分立 |
钻 |
鉆鑽 |
鑽>鉆 |
锈 |
銹鏽 |
鏽>銹 |
镋 |
鎲钂 |
钂>鎲 |
饥 |
飢饑 |
饑>飢 |
鳌 |
鰲鼇 |
鼇>鰲 |
鹇 |
鷴鷳 |
鷳>鷴 |
3. 使用”词对应”可避錯
目前微软对译:卜↹蔔 ; 就可能有”蔔(卜)卦” 的错译
若该组對應
改为:卜↹卜 , 萝卜↹ 蘿蔔> (词对应),就可避免錯譯。
本文使用”詞對應”的有下列5組:
简一 |
繁多 |
简繁字与词的对应 |
卜 |
卜蔔 |
卜↹卜;萝卜↹蘿蔔 |
丑 |
丑醜 |
丑↹醜;辛丑 |
佣 |
佣傭 |
佣↹傭;佣金 |
咸 |
咸鹹 |
咸↹鹹;咸豐↹咸丰 |
御 |
御禦 |
御↹禦;御用 |
6.0 简(繁)体规范须增加必要的繁(简)体字
上文说明使用词对应,可以避免错译。但是词对应不是万灵单,有些字组,仍不能藉此来解决错译的问题。
例如:斗 /斗鬥,在繁体语境中,斗、鬥 不同义,简繁转换时:
斗↹鬥 , 五斗米(譯成)五鬥米,即使可用词对应(五鬥米→五斗米)改正過來,但若是七、十…斗米呢,你不可能用无数的词对应来改错,唯一的办法是
斗、鬥
二字各自分立。
又如:发/發髮,发↹發 ,可能有 頭發、或 髮生 的错译, 發或髮 的组词有数十种,你如何能使用词对译去改错呢,这就是为什么简体规范要增加传承字”髮”的理由。
有些字组,可從另一角度來讨论,例如:征/征徵,在繁体语境中,征召、象征 用[徵],征伐、长征 用征,二者并非等同;但简化字[征]概括了上述诸义,己有60 多年的历史,约定而俗成。为减少用字量,不妨以征兼代”徵” 的原义。”徵”则独立不转译,因之唐代名相”魏徵”仍可保留在简、繁体的文本中。
同理,古人”南宫适”,因只有一個,亦可以”词对应”的方式保留,不致误译作”南宫適”。
以下29个”一对多”字组,大都有错译的可能,繁体字须各自分立,例如:
目前转译软件 儿↹兒,快点儿>
快點兒,带儿的尾音变成重读,故 儿、兒 应分立,大陆规范宜纳入”兒”字。
又如目前转译软件 干↹幹、斗↹鬥、后↹後、谷↹穀、姜↹薑、发↹髮……,皆有錯譯的可能,这些繁体字,难以”词对应”方式解决,均宜纳入大陆规范内,详如次表:(31)
儿 |
儿兒 |
儿兒分立 |
几 |
几幾 |
分立 |
干 |
干幹乾榦 |
干幹乾分立;榦>幹 |
云 |
云雲 |
分立 |
凶 |
凶兇 |
凶兇分立 |
斗 |
斗鬥 |
斗鬥分立 |
只 |
只衹隻 |
只隻分列;衹>只 |
伙 |
伙夥 |
分立 |
后 |
后後 |
分立 |
回 |
回迴 |
分立 |
奸 |
奸姦 |
分立 |
并 |
并並併 |
并↹並;併分立 |
朱 |
朱硃 |
分立 |
折 |
折摺 |
分立 |
谷 |
谷穀 |
分立 |
里 |
里裏裡 |
里↹里;裡分立;裏>裡 |
姜 |
姜薑 |
分立 |
范 |
范範 |
分立 |
面 |
面麵 |
分立 |
复 |
复復複 |
复↹複;復分立 |
游 |
游遊 |
分立 |
端 |
端耑 |
分立 |
历 |
曆厤歷 |
历↹曆;歷分立;厤>曆 |
发 |
發髮 |
分立 |
坛 |
壇罈 |
分立 |
恶 |
惡噁 |
分立 |
汇 |
彙匯 |
分立 |
纤 |
縴纖 |
纤↹纖;縴分立 |
巨 |
巨鉅 |
巨↹巨;钜↹鉅 |
余 |
余餘 |
余↹余;馀↹餘 |
钟 |
鍾鐘 |
钟↹鐘;锺↹鍾 |
7.0 本文总结
1. 我在本文提出“简繁一对多”对应问题,意在说明我处理这问题的基本理念及方式。因为文章千变万化,软件防错的设计很难万全,因此简、繁体必须一一对应。才能澈底解决问题。
“一对多”发生的原因有二:一为台湾规范中容纳了一部分流行的异体,一为简体规范为节省字量而对应了多个繁体。因此处理简、繁对应问题时,就必须一并处理异体问题。
2.面对上述378”一对多”字组,我们要做的功课是:
a). 各组繁体字中有无全等的异体?如有,剔除它,以便该字组作”一对一”的对应。
b). 现有<微软>简繁对译的设计,有无可改进之处?个人认为:除极少数字的误译外,还有一些可改善之处,例如:艳/艷豔,現行 艳 转译为 豔,艷当作异体处理,倘若改为
艳/艷 对应,使简繁体字型类似,岂非更佳?而且艳是个容易了解的会意字。笔者认为寻求简繁体”一对一”的正确对译,是迈向汉字”书同文”的起步。
3. 解决”一对多”问题,有三个途径:a).改善简、繁对译软件,b).繁体规范中增加一些简化字,c).简体规范中增加少数传承字。在”繁多”字组中,尽可能选用结构简单的、或字形接近简化字的作正体,以利于日后简、繁体的统合。
处理本问题的公式如下,(不论字或词的对应,均可利用):
甲(简)/乙(繁1)丙(繁2): 甲↹乙 ; 丙→甲 or 丙 (分立,不转换)
例如:苏/蘇甦囌: 苏↹蘇 ; 甦→苏 ; 囌(分立,不转换)
4.简化字推行多年后,发生了字义的延伸,(亦即一字兼具多义),在处理时也要酌加考量。如果仍照传统字典去解释现行简化字的字义,就会失去简化字在汉字发展史上的正面意义,那就是
简省字形结构 并减少流通字量。
另一方面简化字为着节省字量,有时过犹不及。例如:熏/熏燻薰:在繁体语境中,元熏、燻火、薰芳,是用不同的字,简化字一字兼三义,是否兼职太多?,如何取舍,见仁见智,也是可以讨论的事。
5.个人认为拟案应着重现代语义,例如:在简体语境中,[辟]兼含了 开辟、复辟之义,而且在现代语文中,[辟]只是组词的”词素”,本身并不单独使用,则以”开辟”取代”开闢”,有何不可?
又如字组 才/才纔,虽然在古代汉语,才/纔 字义并非全等,但在”刚纔”一词中,纔也只是个词素,以”刚才”取代”刚纔”, 把”纔”当作异体,对于现代人来说,是理所必然。而在转译古书时,纔仍会保留在简体译本中。
6.本着这个理念,年前笔者曾有个相似的拟案,详如网页:http://chinese.exponode.com/6_7.htm
虽然 取样范围及拟定的字例,前案与本文有些不同,但处理的方式类似,可供作参考。
附件1 新简要增的传承字
新简要增的传承字26个,其中14个优先,如次表。
新增 |
分立 |
优序 |
幹 |
干 |
1 |
鬥 |
斗 |
1 |
隻 |
只 |
1 |
後 |
后 |
1 |
姦 |
奸 |
1 |
穀 |
谷 |
1 |
麵 |
面 |
1 |
遊 |
游 |
1 |
歷 |
历 |
1 |
髮 |
发 |
1 |
彙 |
汇 |
1 |
縴 |
纤 |
1 |
雲 |
云 |
2 |
摺 |
折 |
2 |
幾 |
几 |
2 |
兒 |
儿 |
2 |
兇 |
凶 |
2 |
硃 |
朱 |
2 |
薑 |
姜 |
2 |
復 |
复 |
2 |
迴 |
回 |
2 |
併 |
并 |
2 |
裡 |
里 |
2 |
範 |
范 |
2 |
罈 |
坛 |
2 |
附件2 新繁采用的简化字
共58个:其中19字与避免错译有关,如后、後分立,以免”皇後”等的錯譯;39字乃使用字形較简單的繁體,如 鑽 > 鉆;癡>痴 詳下表。
采简 |
沿用 |
优序 |
儿 |
兒 |
1 |
几 |
幾 |
1 |
卜 |
蔔 |
1 |
尸 |
屍 |
1 |
干 |
幹 |
1 |
云 |
雲 |
1 |
斗 |
鬥 |
1 |
伙 |
夥 |
1 |
划 |
劃 |
1 |
后 |
後 |
1 |
谷 |
穀 |
1 |
里 |
裏 |
1 |
岳 |
嶽 |
1 |
姜 |
薑 |
1 |
范 |
範 |
1 |
郁 |
鬱 |
1 |
游 |
遊 |
1 |
匯 |
彙 |
1 |
臟 |
髒 |
1 |
扎 |
紮 |
2 |
札 |
劄 |
2 |
吁 |
籲 |
2 |
洒 |
灑 |
2 |
晒 |
曬 |
2 |
荐 |
薦 |
2 |
飢 |
饑 |
2 |
捻 |
撚 |
2 |
鈅 |
鑰 |
2 |
痴 |
癡 |
2 |
鉆 |
鑽 |
2 |
霉 |
黴 |
2 |
璇 |
璿 |
2 |
銹 |
鏽 |
2 |
襁 |
繈 |
2 |
謚 |
諡 |
2 |
嚙 |
齧 |
2 |
鎲 |
钂 |
2 |
羶 |
膻 |
2 |
櫺 |
欞 |
2 |
鰲 |
鼇 |
2 |
艷 |
豔 |
2 |
屓 |
屭 |
2 |
擕 |
攜 |
2 |
産 |
產 |
2 |
竪 |
豎 |
2 |
綉 |
繡 |
2 |
緼 |
縕 |
2 |
賍 |
贓 |
2 |
贋 |
贗 |
2 |
輼 |
轀 |
2 |
醖 |
醞 |
2 |
鉄 |
鐵 |
2 |
鎸 |
鐫 |
2 |
閙 |
鬧 |
2 |
顔 |
顏 |
2 |
鮎 |
鯰 |
2 |
鰐 |
鱷 |
2 |
鰛 |
鰮 |
2 |
參考–台灣標準字來源
一. 台湾CNS-11643 所含”标准字体”的来源
1. 1982年9月教育部公布<常用国字标准字体表>共收4808字。本表主要参考师大国文研究所之 ”常用字表”(2408)、教育部之”国民学校常用字汇表”(4708)等15种数据,合并统计其频率,再参酌各方意见修订而成。本字表以楷书为准,字形有数种而音义无别者,取一字为正体,余体若通行,则附注如下,例如:”才”为正体,”纔”字附见[注]。选取原则:(1)取其最通行者,例如:取慷不取[忄亢];(2)取其合于初形本义者,例如:取腳不取脚;(3)取其笔划较简、使用较广者,例如:取炮不取[石马交];(4)字有多体,其义古通今异者予以并收(間/閒),古别今同者亦同。
2. 1982年12月教育部公布<次常用国字标准字体表>共收6330字。选字的原则:(1)凡十三经、四史、楚辞、文选、淮南子、老子、庄子、荀子、韩非子、吕氏春秋、管子等;(2)以中文大辞典为根据,再参酌其它辞书,凡某字之词头次数出现超过二次以上者;(3) 现代学术专业或地方性用字,经讨论决定者。
[注]:除4.0 附表所列的”或体”字外,台湾标准书册内还注明的”或体”字:姪/侄、夠/够、墳/坟、亙/亘、憑/凭、撐/撑、據/据、擔/担、攜/携、敘/叙、沈/沉、況/况、溫/温、澄/澂、災/灾、爐/罏、瓊/琼、疊/叠、禮/礼、繡/绣*、缽/钵*、罵/骂*、腳/脚、膽/胆、著/着、蒞/莅、裡/裏、褲/绔*、豬/猪、贗/赝* 蹤/踪、逾/踰、針/鍼、鏽/锈* 鐵/铁*、雞/鸡*、體/体、黏/粘、洌/冽( *原注是繁体偏旁) 可知”或体”字形,有些与简化字相同。
二. 台湾规范字CNS-11643的公布
1. 1986年10月行政院科委会、教育部、中央标准局等合编之<通用汉字标准交换码>CNS11643,共收编规范字13,051字。乃以教育部之常用字汇(4,808)、次常用字汇(6,330)为根据,再由现行之主要中文系统中过滤选择使用频率较高之1,907 字合编而成。异体字部分,原则上不另编码,只选择最常用的异体字:勳(勳)、梁(樑)、荐(薦)、痴(癡)、艷(豔)、晒(曬) 6个字。字形方面,概依<教育部標準字體表>製作,逐字查考,统一点画。编码顺序,以”先笔划后部首”的方式排列。其中常用字5,401部分,乃由常用字汇4,808,及国小教科书之常用字587字及异体字6字合编而成。将该规范字集13,051,扣除常用字5,401后,所余的7,650字,则为次常用字集;内含上述之次常用字标准字体6,330个。
2. 1988年6月 <通用汉字标准交换码>CNS11643,增补6,148罕用字,连原有13,051,合计共 19199字;但罕用字并不予以编码。
a. 字形有数种而音义无别者,取一字为正体,余体若通行,则附注之,如:”才”的附体”纔”。
b. 字有多体,其义古通今异者予以并收(如:間/閒);古别今同者亦予并收(如:証/證)。
因为台湾标准字含有不少异体,增补后”简一繁多”的情况还是会存在,但其时大陆规范字对应的是台规甲字或甲字的异体,繁简转择时当不致发生歧义。