漢字部首新編的研究與實驗
bs\bsf 7/89 10/02 9/14
提要:本文是「首尾選部檢字法」的第一篇論文。筆者試在這篇論文中提出一個部首的定性及定量方法,并建議以 175 個部首排檢常用及次常用字(約
20,000 繁簡字)。漢字是圖形文字,適於見形分部,故提出比較部位權重,以定部首的方法;漢字又以形聲為其主要特色,傳統的依照意符的選部原則,宜作為歸部另一依据。
目錄:
1.0 引 言
2.0 摘 要
3.0 本 文
1. 漢字的基本結構 2. 漢字分部的檢討 3. 新編部首分部的原則
4. 部首字形的變化 5. 新編部首在字中的位置 6. 首尾選部檢字法則
7. 新舊分部不同之處 8. 新編部首一覽表 9. 部首編碼說明
10.
同義異部字 11. 結論
4.0 附 錄
1. 新舊部首數目的比較 2 部首意義的分類 3. 部首的英文名稱(含義)
1.0 引言
漢字字典的檢字法,歸納起來約有:
1. 照字形排列的部首檢字法
2. 照讀音排列的注音檢字法
3. 各式各樣的號碼檢字法
迄今為止仍是以部首檢字法最為流行。
東漢許慎所作的<說文解字>收集了9,353 字,首創 540 個部首,開始以形歸類的方法;後世較著的字典,如晉呂忱的<字林>,南朝顧野王的<玉篇>,宋司馬光的<類篇>,都是遵照許慎的慣例編輯。直至明末梅膺祚作<字彙>,把<說文>
540 部首,省併為 214 部;又把部首的"据形系聯"的編輯方式,改為依筆劃為序。清初的<康熙字典>,以至於民國以後的許多大小字典,也大都襲用梅氏的部首編例。
梅氏的部首檢字法,雖然改進了若干前人的缺點,但正如大家所經驗的,今日部首檢字法,仍缺少一些基本的檢索法則,可資遵循。部首的位置有時還是難以判定。例如“問”字,照字形結構應編入 門 部,但照意符言,則可編入 口 部。對初學的人來說"穎"字應在
頁 部,但卻編入 禾 部。至於 "承" 在 手 部,"贏" 在 貝 部,都是先須具備一些文字學的常識,才可以了解的。可以說中國人從小到大,都是在摸索中學習檢字;甚至還常借助字典上的
<難檢字表>,或注音符號檢字。筆者有見及此,乃有新編部首的研究與實驗,希能由統計及歸納法,找出一個漢字分部的準則。
文字符號乃約定俗成的產物,為求實用,任何有關這方面的研究,都必須在傳統的基礎上創新。因此新編部首 175 部,仍是大部分由梅氏 214 部,加以省併而得。但是筆者藉由電腦分析統計常用及次常用字,歸納出一個部首位置較為確定的法則,并以此種法則,把約
16,000 個漢字(包括繁体、簡体),一一加以分部實驗,以証實此種分部法則的簡易可行。
編部實驗的字集範圍,包括 1986 年在台北出版的<通用漢字標準交換碼>內,常用字5,401個,次常用字 7,650 個(繁体),及 1988 年由北京公布的
<現代漢語通字表> 內7,000 個字 (繁或簡体)。無論繁、簡体,均採用相同的 175 個標準部首。由於漢字具有相似的形聲結構,而且選部的原則相同,相信即使把字例擴充至
3 - 5 萬個字,所需增加的部首數目亦屬有限。
漢字歸部本有據形、據義二種。說文以小篆著作,分為540部,每部均有“凡某之屬皆從某”的敘述,顯然是據義歸部。隸變之後,用楷書書寫的漢字已無法直接表義,也就無法徹底據義歸部了,據形歸部的出現是必然的事實。例如《龍龕》中“辨、辦、辮、瓣”等字不再依《說文》入
“刀、力、糸、瓜” 等部,而改入“辛”部。而《字彙·凡例》更是明確提出了 “論其形不論其義” 的歸部原則。雖然《康熙》 編者看出了據形和據義歸部之間的矛盾因素,並且想對它進行調和,但結果還是在據義和據形之間做了折衷。二十世紀以來的很多字典實際上都是在據義與據形之間徘徊,差別只是程度的問題。例如新《辭海》改良較多,偏重於據形;《大字典》照顧傳統,偏重於據義。現在的問題重點是:歸部偏重於據義的字典使用時要求讀者具有一定的文字學知識,普通讀者用不慣;而歸部偏重於據形的字典,很多字的歸部不合傳統,專業人士不喜歡。因此目前這兩種傾向都無法讓人滿意,最好的解決辦法是通過研究和分析,在二者之間找到最佳平衡點。
本首尾部首檢字法是以"據形為主、據義其次"的方式,來解決前述矛盾。也就是說,當字形結構的上下、左右不平衡時,可依主要的部位據形歸部;而字形結構
的上下、左右圴衡而無從判別主要部位時,則據義歸部。
2.0 摘要
理想的部首檢字法必須具備如下三個條件:
A. 部首在漢字中的位置,要有一定的準則可資遵循,以便尋檢。
B. 部首數目宜予以精省,以便記憶。
C. 部首除按筆劃排列外,同筆劃的部首宜再作較合理的順序編排。
新編部首的位置,不是在字頭,便是在字尾;部首巳精省為
175 個; 同筆劃的部首依照首劃 橫(H)、直(I)、撇(P)、點(T)、彎(W),即"札"字序排列;並順著英文字母 H I P T W
的次序,以便電腦排序。
以下是本新編部首檢字法的摘要。
1. 部首須在一字的字頭或字尾選取,不可在字的中間尋找:
例 穀 -- 取字尾 殳,不取字中 禾,禾 是該字的意符,必要時可作次選部首。
贏 -- 取字頭 亠,不取
貝, 貝 是意符,必要時可作次選部首,以資參考。
2. 字頭或字尾只有一種部首時,則逕行取之,別無選擇:
例 菲 -- 艹 ("非"不作為部首) 嗣
-- 口 耐 -- 寸 ("而"不作為部首)
3. 頭尾都是部首時,則比其權重,亦即就頭尾部首占全字的位勢比較之,取其權重較大者為部首;(若為形聲字,通常可假定意符的權重與聲符相當):
例 擂 -- 取 手 不取 田 (字頭 手 占全字的1/2,而字尾 田 只占1/4)
聞
-- 取 門 不取 耳 (門 含 耳,其權重較耳為大)
騰 -- 取 月 不取 馬
絮 -- 取 糸 不取 女 (理仝上)
雁 -- 取 厂 不取 隹 迫 -- 取 辶 不取 白 (理仝上)
4. 若首尾部首之權重相當,且有明顯的意符易于辨認者,則取之為部首;否則取字頭為部首;必要時另外再取字尾為參考部首,以利初學者檢字:
例 思 -- 取字尾 心 為部首,(本字意符 心 易辨認,單選即可)
暮 -- 取意符 日 為部首,必要時復選 艸為參考。
辜 -- 取意符 辛 為部首,必要時取 十為次選部首
5. 字頭字尾無複筆部首可取時,則取該字的首劃為部首:
例 州
-- 取 丶 于 -- 取 一 刁 -- 取 乙(彎)
正選部首下記述漢字的注音及解釋,參考部首下則註明該字的索引。如下例:
辜 (正選辛部) -- 注音,解釋
(次選十部)
-- 註明"見辛部",及該字在字典上的頁次。
辜字的意符 "辛" 與聲符"古"權重相當,而次選部首
"十" 只占"古"的一半,其權重自不如 "辛" ,則照前述選部法則第 3 項,辜字應以辛部為正選。
若以 [=] 表權重"相當",以 [>] 表權重"大于",則:
毫 (意符毛,聲符高省) 毛
= 高省 毛 > 亠 正選
毛,次選 亠
賽 (意符貝,聲符賽上) 貝 = 賽上 貝
> 宀 正選 貝,參考 宀
鴻
(會意字,意為江鳥) 鳥 = 江 鳥 > 氵 正選 鳥,次選 氵
要之,只要稍知漢字的結構,選部應無困難;尤其本新式分部法,部首只在字頭或字尾中選取,對于難以判別的字,又有參考部首可查;相信無論初學漢字或熟習漢語者,都一樣感到方便。下表為新編部首簡表:
新編部首簡表
--以首劃 橫H 直I 撇P 點T 彎W 為序 (合計175個,著色的為繁體用部首)
1H 2H 2I 2P 2T 2W 一 丨 丿丶 乙 十 厂 匚 卜 冂 八 人/入 勹 匕 儿 几 亠 冫 冖 凵 卩 刀 力 厶 |
3H 3I 3P 3T 3W 又 廴 工 士 土 廾 大 尢 寸 弋 口 囗 巾 山 彳 彡 夕 夂 丬/爿 广 门 宀 彐/尸 |
4H 4I 4P 已 弓 女 小 子 马 巛 王 韦 木 犬 歹 车 戈 瓦 止 攵 日/曰 贝 见 气 片 牛 |
4T 4W
5H 5I 手 毛 斤 爪 父 月/肉 欠 风 殳 文 方 火 斗 户/戶 心 水 爿 示 石 龙 业 目 田 |
5P 5T 5W 6H 6I 6P 罒 皿 生 矢 禾 白 瓜 鸟 疒 立 穴 疋 皮 癶 矛 耒/耒 耳 襾 页 至 虍/虎 虫 (肉) 缶 舌 |
6T 6W 7H 7I 竹 臼 血 舟 色 衣 羊 米 聿 艮 艸/艹 羽 糸/纟 麦 走 赤 車 豆 酉 豕 卤 貝 見 |
7P 7T 8H 9H 里 足 邑/阝 身 辵/辶 釆 谷 豸 角 言 辛 雨 齿 黾 隹 阜/阝 金 鱼 門 革 頁 骨 香 |
10 11 12 13+ 鬼 食 風 音 首 韋 鬲 髟 馬 鬥 黃 麥 鹵 鳥 魚 麻 鹿 鼎
黑 鼓 黽 鼠
鼻 齒 龍 |
3.0 漢字首尾選部檢字法說明(本文)
3.1 漢字的基本結構
3.1.1 基本筆劃
漢字是由筆劃構成的,運筆書寫的方式雖有多種,(如所謂永字八法),但基本筆劃只有
5 個 ---
一 橫 (音 Heng) 以 H 表之
丨 直 (音 zhI
) 以 I 表之
丿 撇 (音 Pie
) 以 P 表之
丶 點 (音 Dian) 以 T 表之
乙 彎 (音 Wan ) 以 W 表之
以上五種基本筆劃常在起筆時(首劃)出現,均可作為部首之一。
筆劃中的勾,乃書寫時運筆的趨勢,不當作基本筆劃之一,例如"寸"中的左豎勾,指向左上方,以便下一筆點[丶]落筆;"氏"中的右豎勾指向右上方,便於下一筆橫[一]落筆;
其他如 "才 句 衣 " 各字的豎勾,都是指向次一筆。
筆劃中的"挑",實際上是"橫"的變寫,例如土 作偏旁時末筆橫變作挑;子的偏旁作 孑。
筆劃的"捺"與 "點"相似,故"水"的
末筆變寫為"丶"。因之,勾、挑、捺 都不算是基本筆劃:勾屬於直,挑屬於橫,捺屬於點。
3.1.2 字元與字元間的聯結
由筆劃組成字元---漢字的單元,再由字元組成漢字。(筆者不用
"字根"或 "獨体"之類的名詞,因為這些名稱可能涉及古代字形的變化;筆者研究的對象為現代標準字形結構,字元即是從這些標準字形中分析出的。筆者也不用"偏旁"的詞兒,因為它太籠統了。)
部首可認為是結合頻率高的字元或一組字元,部首大部分代表漢字中的"意符"。
組字時,二字元間的聯結,約有如下數式---
二元分離 例 杜 : 木 土 各自獨立,字元間有明顯的界限
二元相接 天 : 一 大 相接,但仍可看出二元的分界
二元相含 因 : 囗 大 相含,字元 囗 含字元 大
二元相夾 巫 : 工 人 人 相夾,各字元的筆劃不相交
二元相交 夷 : 大 弓 相交,二元之筆劃互疊
相夾及相交的字元,其筆劃先後交互書寫,以起筆之先後為字元的筆序。如上例,"巫"的字元筆序為工
人 人,可取字頭"工"為部首。 "夷"的字元筆序為 大 弓,可取字頭 "大" 為正選部首。因相交的字元較難分辨部首,故亦取夷
的首劃 "一" 為次選部首.
因絕大部分漢字,各字元間都有明顯的界限,而且字元排列組字時,具有一定的模式,故若部首的位置能加以確定(如限定在字頭或字尾),則尋找部首(字元或字元組),應無困難。
3.1.3 漢字的結構模式:基本構式約有如下數種(以下述字例為代表):
構式字例- [日] [明] [昌] [唱] [封]
[盟] [晶] [斑] [莫] [韻] [迫] [旬] [床] [同] [凶] [囚] [叵]
較復雜的漢字,則由上述模式組合而成。
而構式 – [唱] [封]
[盟] [晶] [迫] [旬] [床] [同] [凶] [囚] [叵],均可逕由字形結構,尋出它們的部
部首為 - 口 寸 皿 日 辶 勹 广 冂 凵 囗 匚
又構式 – [明] [昌]
[斑] [莫] [韻] 及其它對稱的組合模式,其部首的位置不能只自字形結構中看出,須考量意符等因素,才可選定。
3.1.4 漢字的特色---形聲字
据前人分析,漢字的創制有象形、指事、會意、形聲、假借、轉注六種,實際上假借是以同字類聲去標明新義,轉注近似同義字間的相互通注,嚴格說來,二者都是文字的引申應用,并非創造;指事是簡單的邏輯推理,近于會意;而漢字字形演變迄今尚具象形之徵者,可說少之又少。因此,絕大部分漢字可以會意與形聲來解釋,而形聲最為重要,据統計形聲字占了全部漢字字數
85% 以上。(這只是粗略的分析,有關六書的詳論,不在本文範圍之內。)
所謂形聲字,即一字是由意符及聲符結合而成的。
例 : 謂、渭、蝟、喟、煟 各字均以"胃"為聲符。
而 : 言、氵、虫、口、火 則為此等字的意符。
形聲是漢字的一大特色,漢字能隨社會進展而生生不息者,實有賴于形聲的發明。舉例來說,近代化學元素名稱如氧、溴、鐳,便是以意符
气、水、金,配合相當的聲符,替它們命名旳。
3.2 漢字分部的檢討
如上所述,形聲字既占了漢字的大部分,又是有邏輯可尋,則把一串同意符的字放在一塊,各成部首,豈不是順理成章的事!一般來說,這不失為一種有系統的編排;但是由于漢字的結構複雜,聲符的位置變化多,而檢字的人并不一定具有文字學的常識,因此若過于拘泥此項理則,有時會感到部首難尋,而增加檢字的困難。
例 : 問、聞,舊字典歸入
口、耳 部,因它們是意符
騰、勝、滕、謄,舊法各編入 馬、力、水、言 各部,只因它們是意符。
嬴、蠃、贏、羸,各字的聲符 為 ,故把夾在中間的意符 女、虫、貝、羊
當作部首。
如上述諸例,由于漢字意符及聲符間結合的多樣變化,全部依照意符來檢字,并不實用。但在另一方面,如意符、聲符明顯的分列左右或上下者,則以意符為基礎來編部首,當較符合漢字的特色。
例 : 政、故、敝、敖、救、教、敗、敏、敘、敕、赦、斂、敞 …
聲符在左,意符"攵"在右,則編入"攵"部,自較為合理。
又例 : 塞、寨、搴、寋、褰、謇、賽、騫,聲符在上,意符在下,故宜編入:
土、木、手、卩、衣、言、貝、馬 各部
又為易于檢索計,亦可考慮另行編入"宀"部,作為次選,以資參考。
語文學習是"認同辨異"的過程,一面辨識不同字的差異;一面把不同字的相通部分聯在一起,以便聯想記憶。故把同意符的字編在一塊,仍值得採用。但分部時宜优先考慮字形結構。
如上例:問、聞等宜併入"門"部;騰、滕、謄宜編入"月"部,而嬴、鸁等宜歸入"亠"部,這是新編部首與舊字典編法最大不同之處。
3.3 新編部首分部的原則
漢字是由"字元"(漢字的基本單元)組成的,依漢字的字形結構,取字頭或字尾的字元(組)為部首。字元(組)在一字的左方、上方、左上方、右上方或外匡者,均先行書寫,謂之字頭;在右方、下方、左下方、右下方或下外匡者最後書寫,謂之字尾。
例 晴、審、廣、匍、因 : 取字頭的字元 日、宀、广、勹、囗 為部首
彩、豎、道、斡、凶
: 取字尾的字元 彡、豆、辶、斗、凵
為部首
因此,部首必須在字頭或字尾尋找;若字頭及字尾均無適當部首可取者,則取該字的首劃為部首。
例 且:取首筆 "丨" 為部首
互:取首筆 "一" 為部首
以上為漢字新編分部的原則。筆者以此項原則,驗証現有字典的分部,絕大多數漢字以新法分部,與舊法相合,改訂的只有少數字。這項原則,使部首的位置較為確定,而便于檢索。
3.4 部首字形的變化
為配合漢字的方形結構,有 13 個部首,因其位置在字頭或字尾的不同而有變化。(其中只有刀/刂 為同筆劃,其他 12 組首尾部首的筆劃均不同)
---
|
字頭 舉例 |
字尾 舉例 |
|
字頭 舉例 |
字尾 舉例 |
1 |
讠(言) 謂 |
言 誓 |
8 |
钅(金) 鉑 |
金 鑒 |
2 |
刀 刃 |
刂 到 |
9 |
纟(糸) 細 |
糸 繁 |
3 |
氵 泊 |
水 泉 |
10 |
月 腸 |
肉 臠 |
4 |
忄 怕 |
心
⺗ 思 恭 |
11 |
礻 祈 |
示 禁 |
5 |
扌 拍 |
手 拿 |
12 |
火 焰 |
灬 烈 |
6 |
犭 狗 |
犬 吠 |
13 |
衤 衫 |
衣 裝 |
7 |
饣(食) 飯 |
食 饗 |
|
|
|
3.5 新編部首在字裡的位置
經筆者就上述常用字及次常用字字集
(合計16,000 個),逐字編部并統計,共得部首 175 個,部首固定在(或絕大部分在)字頭者稱為常駐字頭部首。
常駐字頭部首56 個---
左方 27 :亻* 冫 爿 尢 彳 方 爪歹 片 矛 矢 至 耒 血 舟
舌 鹵 走 赤 釆 身 豸 阜 骨 麥 鼠 鼻 |
上方 16 :人* 亠 冖 宀 士 耂 爪* 父 穴 业 网/罒 襾 竹 艸 雨 麻 髟
|
左上 5 :厂 广 尸 戶 疒 |
右上 3 :勹 弋 气 |
外方 5 :冂 匚 囗 門 鬥
* 左或上方,都在字頭 |
常駐字尾部首(絕大部分位於字尾者) 22 個
---
右方 14 : 卩 寸* 彡 瓦* 斗 見 戈 欠 殳 斤攵
頁 色 邑 |
下方 5 : 儿 寸* 廾 瓦* 皿 黽 鼎 |
左下 2 : 廴 辶 |
外方 1 : 凵 * 右或下方,都在字尾 |
部首雖有首尾二個位置,但部首有變形因而容易辨認者
12 個
左或右方: 刀/刂 犭/犬 |
左或下方: 讠/言 扌/手 饣/食 忄/心 氵/水 纟/糸 礻/示 火/灬 钅/金 衤/衣 |
3.6 首尾選部檢字法則
1. 部首須在一字的字頭或字尾選取,不可在字的中間尋找:
例 徽 -- 取 彳 不取 糸,雖然 糸 是該字的意符
潁 -- 取 頁 不取 水,因 水 在字的中間,不取之為部首
應取含蓋範圍較大的字元為部首:
例 突 -- 字頭取 穴 不取 宀 麼 -- 字頭取 麻 不取 广
豁
-- 字尾取 谷 不取 口 辜 -- 字尾取 辛 不取 十
2. 字頭或字尾只有一種部首時,則逕行取之,別無選擇:
例
殖 -- 歹
孰 -- 亠
形 --彡
毓 --𠂉(人)
3. 頭尾都是部首時,則比其權重,亦即就頭尾部首占全字的位勢比較之,取其權重較大者為部首(若為形聲字,通常可假定意符的權重與聲符相當):
例 暫 -- 字首為 "車",字尾為"日",取 日 不取車,因 “日” 所占之位勢較大
同理 邵 -- 字首為 "刀",字尾為"阝",取 阝不取 刀
又 : 諄 -- 取 言 不取 子 滕 -- 取 月 不取 水
魘 -- 取 鬼 不取 厂
架
-- 取 木 不取 力 聞 -- 取 門 不取 耳 迫 -- 取 辶 不取 白
4. 若首尾部首之權重較難判,但已知該字的意符,則取意符為部首:
例 慕 -- 心 為意符,取字尾 心 為部首, 另亦取字頭 艸 為次選
密
-- 山 為意符,取字尾 山 為部首,次選字頭 宀 (必要時)
若首尾部首之權重相當,又無從判別其意符為何,則取字頭為第一部首;必要時另取字尾為次選:
例 員 -- 取 口 為部首,另取 貝 為次選
5. 若字頭字尾均無復筆部首,則取首劃為部首:
例
之 -- 丶 且 --丨
井 -- 一
丑 -- 乙
丘 --丿
上述復選部首的字在字典上的編排:正選部首下記述漢字的注音及解釋,次選部首下則註明該字的索引,如下例:
暮 (正選日部) -- 注音,解釋 (次選艸部) -- 注明"見日部"及頁次
頭尾都有部首,且二者權重相當時,取意符為部首。照意符編排的好處是對于常查字典的人,以及稍知漢字結構的人比較熟習;而且由漢字字形結構去推斷部首,也比較合理,例如:
暮 : (意符) -- 日 (聲符) -- 莫
意符"日"與聲符"莫"權重相當,而次選部首"艸"只占"莫"的一部分,其權重自不如"日",則照前述選部法則第
3 項,暮字應以日部為正選。又例:
挪
(意符手,聲符那) "手"與"那"相當, "手"權重大于"阝",選手部
泉 (會意字)
水為主意符,取之為正選部首
以下是一些有助正確選部的說明事項:
A. 若漢字的字形結構對稱,難以決定部首時,則取常駐的字頭或字尾部首:
例 現 : 見為常駐的字尾部首,取 見 為部首
二者都是常駐的部首時,以取字首者為优先:
例 紂 : 取 糸
B. 前已說明,認識形聲字對於判別部首很有幫助,下列常見聲符都在字頭,容易與部首(意符)混淆,不妨把它記住(部首多在字尾):
聲 符 |
字
例 |
聲 符 |
字
例 |
尚 |
堂
常 掌 棠 當 賞 嘗 裳 党 |
宓 |
密
蜜 |
寒上 |
寒
塞 寨 搴 寋 褰 謇 蹇 賽 騫 |
春上 |
奏
春 泰 舂 秦 |
巒上 |
變
彎 巒 鸞 孌 戀 欒 攣 蠻 臠 鑾 |
卷上 |
卷
券 豢 眷 |
與 |
譽
舉(字尾非部首,取字頭[臼]為部首) |
學上: |
學
覺 鱟 嚳 黌 嶨 澩 |
榮上 |
勞
鶯 煢* 塋 熒 滎 犖 瑩 營 縈 榮 *煢的字尾非部首,以字頭[火]為部首 |
高省 |
亮* 毫 膏 豪 *亮:取亠 為部首 |
C. 少數漢字字元間有相夾或相交之關係者,其分部之例如下
:
未:一木相交,木在字尾 本:木一相交,木在字頭 朿: 木冖互交,木在字頭
(以上選"木"為部首)
夾:大人人相夾,大在字頭 失: 𠂉大相交,大在字尾 夷: 大弓相交,大在字頭 (以上選"大"為部首)
冉:冂土相交,冂在字頭 (可選 “冂” 為正選部首,首劃“丨” 為次選)
因交夾的字元不易看出,故又選首劃為次選部首;例 夷:正選 大,次選 一