通用字的基元设想与统计

1.0 引言
汉字作为华人文化讯息的载体,具有优缺点;优点不谈,缺点主要有二 ---
1.)
构形复杂:笔者对此曾有所分析,请参见 ---
http://www.pkucn.com/redirect.php?tid=270073&goto=lastpost#lastpost
2.)
序性不足:不像英文字母那样可按字母排序。
如果汉字能找到构形的最小单位(简称基元),就可能按一定的方式排序。即把传统的笔划序,改为基元(笔群)序。基元相当于英文字母,只是排序方式有二维与一维之别。
问题是如何拆分才能找到基元?而且这基元须是大家所共认的,其数量不宜太多。笔者认为寻找基元没有快捷方式,须从一个样本的实验着手。
假定样本是简繁通用字7300,拟定不同的拆分原则,经过3次拆分实验,得到如下结果:

折分实验

拆分原则

所得结果

 

1次

交重不拆,不取笔划

字元521

;           咸;       再;      

2次

交不拆,重拆,取笔划

字元418

           (戊一口); (一冉);   

3次

交重拆,取笔划

基元300

(千2十十土);(戊一口); (一); (了一)

 

上表第1次拆分所得的字元521个,可用作字形结构型式(构式)的统计。第3 次的拆分最为澈底,共得到字元 293个,可认为是通用字的最小单元(基元)。因这基元尚未得到大家的认同,只能算是笔者个人的设想。尤其因交重的拆分方式,因人而异,会得到不同的结果。下节将说明笔者如何拆分,请大家讨论指正;抛砖引玉,希望得到一个共认的通用字基元表。

 

2.0 交重拆分的说明
1.
交与重的区别:例如 - 字元”大人人”各不相交,叫做重;夹 - 字元”大䒑”相交,叫做交。
2.
相交拆分的方式:
  以”里”为例,有的拆成 田、土,竖笔丨重复;有的依笔序先后拆成 曰土,容许[]的竖笔穿插于[]内。我选用后者,因为它能保持”里”的笔数在拆分前后不变。同理 ---  
重:千(2)     土的竖笔须贯穿3个字元
垂:千(2)十十土  土的竖笔须贯穿千2
黑:    土的竖笔须穿插于” ”内
熏:千(2) 土灬  土的竖笔须贯穿3个字元
要之,相交的字元须照字元的笔序拆分,而且其中一个字元的一个笔划,可容许贯穿其它字元。

3.
相重的字元,以起笔之先后为序---
    夾:大人人, 起笔为大
    咸:戊一口  起笔为戊

 

3.0 基元的编码
依基元的笔划及首、末笔的性质编码:
例如 毛,首笔为丿(P),末笔为乚(Z),共4笔,编码为 4pz。其它基元亦同样编码,并依基元的笔数及首、末笔的性质,排列如次表(300)

基元依笔数及笔划性质作 ”札” 字序排列:H []I []P [丿]T [/]Z []

 

/

H

I 

P

,T

Z

 

1

丿

乚乙

12

2h

𠂇

 

七匚

10

2i

 7

2p

(2) 𠂉

𠂆

九儿 几勹

16

2t

 

 

 5

2z

了凵 丩卩

17

3h

于廾 

23

3i

 

9

3p

饣彳

𠂎

12

3t

 

广

忄氵辶

11

3z

纟马 

18

4h

廿

瓦长

22

4i

 

 

11

4p

𠂔

𧘇

20

4t

 

 

心火 为灬

 

 7

4z

𠃜

 7

5h

𠀎

 

𡗗

 

13

5i

且凸四田皿 目业罒

 

 

13

5p

 

 

 9

5t

 

 

 

 2

5z

𢀖

 

 

 7

6h

耳西

 

 

 7

6i

 

 5

6p

 

𠂭 𧰨

𦈢

11

6t

 

 

 

 

 4

6z

 

 

 

 

 2

7h

 

 6

7i

 

 

 

 2

7p

 

 

 

 4

7t

 

 

 

 2

8+

 

 

 6

300

65

54

37

93

51

300

 

所谓基元,应是拆分后的最小单元;观察上表,尚有基元可分而未分者,其原因如次:
a.
拆分后的字元,只能与本身匹配,拆分反而增加基元数量 --- 非…。
b. 拆分后的字元,其中一个虽可与其它字元匹配,却另产生1个新字元,不能节省基元数量--
  
𢀖 成…。
例如皮> 又,[]可与其它字元匹配,而 [] 则不在上述基元表内,是个”非通配”的新字元,拆分所得,只是以[] [],故不如不拆。
c.
本基元表是初拟,尚待改善;且基元数300,仍嫌多,最好能在286(=26x11)之内。

基元的笔划数自18+,分布如次表,基元的平均笔划约3.8

基元笔划

up

合计

基元数

12

55

73

67

44

29

14

6

300

 

 

4.0  基元的组成
基元的组成包括:1.成字162(兼部首88 )2.部首45 3.组件93;详下列1,2,3各表。
基元中成字及部首约占2/3,组件只占1/3

1.
成字162

广

廿

西

 

 

 

 

 

 

 

2. 部首45

丿

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. 组件93 (=(2)

𠃌

𠂇

𠂉

𠂎

𠂔

𧘇

𠃜

𠀎

𡗗

𢀖

𠂭

𧰨

𦈢

 

 

 

 

 

 

 

 

5.0 基元(293)的组字量
组字量表示基元的组字效率,下表依组字量的大小排列,以口为最多。

1715

935

761

603

549

544

530

丿 522

474

467

382

353

349

329

329

328

325

320

320

317

314

305

294

293

𠂉 287

271

255

255

242

237

236

236

229

220

广 216

189

189

177

176

170

169

169

165

159

158

155

154

𠃌 153

147

147

146

144

144

139

137

137

134

134

131

130

128

125

121

118

118

116

115

114

110

109

108

102

98

98

94

𠂇 88

85

84

83

82

81

80

79

78

78

廿 78

78

77

76

75

75

𧘇 74

73

72

70

68

68

67

65

63

62

62

62

𧰨 62

61

60

59

59

59

58

58

58

56

55

54

54

51

50

50

49

47

46

46

46

46

46

44

44

44

43

43

43

42

42

41

40

37

36

36

𠀎 36

36

35

34

34

34

𠂆 33

33

33

33

32

32

31

31

31

31

31

30

30

29

28

27

27

26

26

25

25

24

24

24

𡗗 24

24

24

24

24

23

23

23

22

22

22

21

21

21

21

20

20

20

20

20

20

18

18

18

𢀖 17

16

16

16

西 16

16

15

15

61

15

15

15

15

14

14

13

13

13

13

13

𠃜 13

13

13

13

13

12

12

12

12

12

12

12

12

12

12

12

11

11

11

11

11

10

10

10

10

10

9

𠂎

 9

9

9

9

9

8

8

8

8

7

7

7

6

6

6

 6

6

6

5

5

5

5

5

4

4

4

4

4

4

4

 4

4

4

4

4

4

𠂭 4

𦈢 4

3

3

3

𠂔 3

3

3

3

3

3

3

2

2

2

2

2

2

1

1

1

1

1

1

 

严格说来这不是所组的字量,而是组字的基元量。二者有区别,例如,車的基元量98,实际组字96,因 中多了2个基元。
: (96) 輿
基元组字量只有1个字者有 乜、、卌、凸、糹、 6字,本样本中从 纟旁的字有 158个,从 糹的字只有”儸”1字。从卌的只有舞字,繁体[]字以简体[]字取代,可知若样本全部采用繁体,则组字量的统计将有所不同。

 

6.0  基元的键盘配置
1.
下表乃基元在英文键盘上的配置,主要乃依基元的读音(声或韵)而拟定的,用意只在映射它们之间的联系,作为探索汉字构形内涵的工具,并不作为一般输入法之用。

基元(300)

1

丿

𠃌

12

2

𠂆

12

3

 

 

10

4

 

 

 

 

 

7

5

𧰨

12

a

12

b

 

11

c

 

 

10

d

 

 

 

 

8

e

 

 

 

 

8

f

 

11

g

广

12

h

 

 

 

 

 

 

 

5

i

𧘇

12

j

𢀖

12

k

 

 

 

 

 

 

 

5

l

12

m

𠃜

12

n

 

11

o

廿

𠂇

 

 

 

9

p

 

 

 

 

 

 

 

5

q

2

 

 

 

9

r

𠂉

 

 

 

 

 

7

s

12

t

 

 

 

 

 

 

 

 

4

u

𠀎

 

 

 

 

8

v

 

 

 

 

 

7

w

 

11

x

西

𦈢

12

y

 

11

z

𠂔

 

11

 

2. 基元300的编

利用标准键盘编码,数字键 15 及英文字母 A-Z键来代表基元。

数字键1-4代表基元的笔数,例如基元 彡,3笔,编为3PPP。数字键5代表动物类基元,例如基元 虍,编为5IHZI/H/Z表基元的首//末笔的笔划性质。字母A-Z键所代表的基元,大都表示基元的读音,例如基元 白,编为BPIH

基元300编码

1H

1I

1I

1P 丿

1T

1U

 

1Z

 

1Z

1Z

1Z

1Z

1Z

𠃌

12

2HH

2HP

2IH

2II

2IP

2IP 

2PI 

2PI 

2PP 

2PP 𠂆

2ZI

2ZZ

12

3HHH

3PPP

3PII

3PIZ 

3ZZZ

3TTT

3TTH

3PZU

3HPI 

3IZH 

 

 

10

4IZH

4IZH

4IZH 

4IZH 

4PIT 

4IIT 

4PIZ 

 

 

 

 

 

 

5PZH

5PZZ 

5HPT

5IHZ

5TTI

5HPT

5PZP

5ZZH

5PZU 𧰨

5ITZ 

5IZT

5PTP

12

AHPU

APU

ATT 

AZIZ

APU 

APTT 𠂭

APHH

AHZP

AHIT

APPU

APTT

APPU

12

BIZT

BHHI 

BPIH

BPZ 

BTTZ

BIT 

BHPT

BZP 

BTTT  

BTT 

BHIT

 

11

CHIT

CHHU 𡗗

CHIP

CPPI

CZIH

CHIZ

CHPT

CPHU

CHP 

CHPT 

 

 

10

DZP 

DII 

DHPT

DHI 

DPIH 

DZHH 

DIZH 

 

 

 

 

 

7

EHIH

EZI 

EZZ 

EZI 

EPZ 

EPZ 

EPZ 

EHPI

 

 

 

 

8

FTHP

FHZ 

FZHH

FZZH

FHZH 

FZPT

FZTU

FPZU 

FHHU

FHIT

FIHH

 

11

GHIH

GZHZ

GHHI

GHIH

GHIU

GZHU

GHIZ

GHIZ

GHZT

GHZP 

GIZZ 

GTHP 广

12

HTTU

HTTT

HTZP

HPTI

HTHT

 

 

 

 

 

 

 

5

ITZT

ITZT

IPIU𧘇

IHIU 

IPIU 

IPZI

IPZU

ITTU 

IHZZ

IZHT 

IZHZ

IZHZ

12

JPUH

JPHI

JIZI

JPPI

JHHI

JIZZ

JHHT

JHIH

JHII

JPZ 

JPZU

JZTH 𢀖

12

KIZH

KZH 

KHII

KHZ 

KZHT

 

 

 

 

 

 

 

5

LZP 

LTHH

LHIP

LZI  

LPZT

LIZH

LHHU

LPIT

LHZT 

LTZU

LTZU

LZU 

12

MTIZ

MIZ 

MZHZ

MIZH

MZIP 𠃜

MPHZ

MPIP 𠂎

MPIT 

MHPH

MTTT

MTZ 

MZZ 

12

NZPH

NPHI

NHZI

NZP 

NZPH 

NZZT

NZZH

NZZT

NZT 

NIHT 

NZT 

 

11

OHI 

OHP 𠂇

OHIH 廿

OHIH

OHII

OHII

OHPI

OHPI

OHPI

 

 

 

9

PPHZ

PTTI

PZIP

PZPU

PIHU

 

 

 

 

 

 

 

5

QPHZ

QHIH 

QHZ 

QIZH

QPH  2

QPIH

QPZU

QPIH

QTHI 

 

 

 

9

RIZH

RIZH

RPU 

RPH  𠂉

RPI 

RPU 

RPUH 

 

 

 

 

 

7

SIZI

SIZ 

SZII

SZIP 

SIZU

SITT

STTT

SHPH

SZHP

SIZU 史

SPIZ 氏

SPIP 身

12

THIH

TPHI 手

TIHH 凸

TIZH 田

TTH 

 

 

 

 

 

 

 

5

UHIH

UHIH 士

UHHI 丰

UHHI 

UHHH 龶

UHHH 𠀎 

UHIU 木

UIZH 目

 

 

 

 

8

VPZH

VIZT 

VHHI 于

VZTI 予

VHIT 雨

VHZ 

VHIT 戉

 

 

 

 

 

7

WPHT

WHHH 王

WTHZ 亡

WHZP 万

WIZH 囗

WZZ 

WHHI 韦

WHHU 未

WTPT 为

WHPT 戊

WIHZ 

 

11

XTZT

XTTI 忄

XITT ⺗

XITT 小

XITP 

XPZT 夕

XPZU

XHIH 西

XHIH 覀

XPHZ 𦈢

XZZP 乡

XZHI 卂

12

YZU 

YHPZ 尢

YHIH 酉

YITT 以

YHZT 弋

YIZP 曳

YIIH 业

YZIZ 也

YPII 印

YPPZ 㐆

YTZ 

 

11

ZPHI

ZZIH 子

ZZIH 孑

ZIHH 止

ZPIH 自

ZPHI 

ZPZP 𠂔

ZPTT 兆

ZPIH 隹

ZTPI 州

ZHPU 丈

 

11

 

汉字笔划的型式虽多,基元表中只有如下5类基本笔划:
1.
一 类:抽笔属之。抽的运笔方向与 “一”大同小异。在7303字的统计中,只有 ”刁、叼” 有此单独的笔,故以”一”取代之。
2.
丨 类:亅、均属之。因为竖钩本身只是一种笔势,指向下一笔。本文统计时,没有发现有单独的右勾。所有右勾均存在于多笔划的字元之中。
3.
丿类:包括所有的撇:平撇、斜撇,竖撇。
4.
丶类:ㄟ笔属之,这是因为在汉字的结构中,二者常可互换。
5
:乙()类:形式虽多,但只有如下6 式:乛 乚 乙 作为基元。

7.0
由基元检字并择要探讨
这是基元组字的具体情况,显示每个基元所组的字,究竟是那些?例如 ----
: (1026) 一 刁 下 上 兀 干 亍 互 天 屯 歹 与 气 丙 丕 刊 卡 卮 叼 司…
: (44) 丁 亍 仃 叮 打 汀 宁 行 玎 盯 町 疔 泞 耵 亭 衍 訂 酊 桁…
: (1529) 口 中 兄 加 占 古 右 召 叮 叩 叨 叼 司 叵 叫 另 只 叱 台…

现在就<基元组字表>中几个重要的基元加以讨论如次。


7.1 
基元[]的分析
共有1733个,组了1529字,占样本总字数的21%,意即每5 个通用字中就有1个含[]的字。基元数与字数之差204(=1733-1529),表示有约200字是由2个以上的[]组成的。
口司食,民以食为天,汉字[]多,似乎显示中国文化相当注重实际生活。

首先得把含口的字整理一下,可分为部首及偏旁2大类,列之如次:
a. 部首[口] 275
口 叮 叭 叽 叨 叼 叻 叱 卟 吓 吁 吐 吋 吟 吶 吸 呋 呔 吵 呎 吨 吧 吲 吣 听
吡 呀 呸 咀 咋 呼 咄 味 咏 呱 咁 呷 呻 和 咳 咦 咪 哏 哂 唑 哦 哽 哺 哧 哩
啡 啄 唾 喁 嘿 咝 叫 呜 哑 哝 唤 吆 唯 啸 呗 叹 吗 咙 哌 吹 吠 吽 咱 咩 鸣
吻 咆 啕 咂 哐 呕 呃 喱 嘁 嘛 呖 嗵 哒 咽 呓 吃 吭 吮 吩 吱 呤 咚 咔 呢 咛
咣 哄 咭 哆 咤 哚 咴 哞 哎 唬 哮 唉 哨 啤 唪 唼 啶 唸 唳 唱 啃 喧 啼 喝 喳
喂 喈 喤 喘 喟 喵 喑 喙 哇 嗖 嗟 嗥 嗔 嗪 嗉 嗅 嗤 嘣 嘈 啖 噍 啜 噬 噱 嚅
嚯 呛 嗞 啴 喽 嘤 哓 嘱 哕 噹 噁 喋 哔 囌 啰 嗫 嘘 唝 啧 唢 噜 唛 啮 喃 噢
嗯 咬 喹 唏 唷 啐 嘧 喀 喔 噶 嗄 谿 嗓 嗲 嗌 嗑 嗦 嗡 嗜 嘎 嘌 嘐 噀 噌 噫
噤 哙 唠 唆 嘹 嗳 噗 嚄 喷 噻 噙 嚓 嚎 嚏 咿 咐 呶 呦 啪 咻 咧 呲 唧 哳 哪
啣 啦 啉 啵 喇 啾 啷 嗍 嗽 嘶 哟 吼 嘚 喉 喻 喫 嗨 嘞 囀 嗷 嗾 嘟 嘬 嘴 哗
嘲 嚼 嚥 另 否 吞 售 启 骂 呆 哉 唇 吝 嚚 啻 器 兽 营 喾 嚣 咨 哲 嚮 轡 问

b. 部首[言] 135
言 訂 訄 計 訃 訑 訏 討 訕 訓 訌 記 訐 託 訥 訪 訝 訣 詛 註 詐 詘 詎 評 訴
証 詆 詖 該 誠 誅 詳 誄 誣 誧 課 諛 誰 誹 諑 諫 諶 謙 議 訊 諱 諷 詢 誆 謳
試 誡 誕 譴 讕 診 訖 訟 許 設 識 謐 詵 詮
詿




c..
其它部首60



   

 

上文把从 豆、革、黾…的字 列在 ”部首”之下,只是方便行事;实际上它们的功能不同,例如 ---
[
] 在”豇 豐” 中作 部首,在”剅 逗”中作 声符,在”厨 酆” 中是组件。
[
] 在”鼋 鼍” 中作部首,在 “绳 蝇” 中作声符。
[
] ”臌” 中是声符。
[
] “缂” 中是声符,在 “霸 鳓”中作组件。

 

d. []聲符/組件1085

沿   
   


   

   


   
   

   

   
   
   

   

   


   
   
   







蹿
















   



調











   






稿
   



槿


   



   


















𦣞


   








           
            

 

基元[]大略可分为2方面来分析:
a.
字形上的 --- []在字中的位置有的在上( 吊…),在下( 召…),在中( 同…),有的与其它字符
  相交 ( 橐…)
b.
功能上的--- 如上文所述,有的作部首( 言…),有的做声旁或组件 ( 占…)

值得探讨的有二点:
1.
一个基元的组字量太多,难于寻检。例如简体 讠是一个基元,繁体言却须拆成 [亠二口]3个,而[]是个重要的部首,[]是否可以不拆,以与简体 讠对应?如果不拆,就不符 ”基元是基本结构单位”的定义。我想引进”复基元”的观念,把一些因故不拆的所有基元,如[]及前文所述的 非、印、卵…纳入在 ”复基元” 名下,未知是否妥适,尚请网友提供意见。本文所提的基元设想,原就是一个实验性的拟案,有待大家的建议与指正。

2.
我在作 <汉字字形构式统计> 时,曾发现2个或3个并列的字元,可当作一个构形来处理,例如,“龠”的构式是 ,其中3个”口”是1个构形(),不是左中右3个构形(,如把3口简作3点,其构式不变。因此“龠”的字元可简作 ⺍。 包围形结构 冂、匚…,在构式中的作用也是1个构形, 故”區”简作”区”,把 简为㐅,并不影响构式的形态,在字理上也说得通:
  龠,古乐器,似笛,从品从侖,口表笛孔,侖表按序排列。若笛孔用”点”来表示,一样可行。
  區,踦區,藏匿也,从品在匚中;品,众也(说文)。區内藏多品,引申为区域、区别(段注)
區内”品”简作”㐅”,可以说是汉字从具象向抽象的转移,是文字符号化的表征,应是正面的发展。

 

7.2  基元[]组字详表(922rev.)
本节对于基元相交的字加了注记。
1.
以部首排列的字
: (99) 鱿

: (77) 莺鸠 鸿

(一冂氺): (58)

2.
以偏旁排列的字
A.
基元[]的界面是相交 ---
(一史): 使   (一口⺕亅)
巿(一巾)
(一凵乚): (14)
(一氺丶)(8)
(一曲日) (8)
(一⺕龰:   
(一曰 )    
(一曰 ):
(亠口一𧘇:衰    

B.
基元[]的界面是离触 ---
/: (10)
/: (17)    
: (16)
(一彑): (2)
: (24)   
: (6) 屿
/: (16)    
: (8)
/: (8)    
/: (22)
/鬲:(18)           
: (10)
/: (27) 蹅亘/宣:(17)    
/㝵:(23)       
亶:( 8)
/ : (12)    
/ : (15)    
: (4)   
/: (18)     耀
: (19)
: (14) 趼钘   
/ : (22)        
: (20)        
: (2)
: (27)
: (11)   
/: (19)    
/厨:(15)
/: (21)     涿
/毫:(10)    
/: (16)       
(十目一) (12)
: (13)
/: (18)   
: (4)
/: (10)    
: (11)
: (2)
(一丰): (2)
: (6)
(屮一虫): (4)   
: (9)   
寅:(2)
/: (15)      
: (7)
/: (22)   
: (6)
㝉:(4)
: (15) 輿


a. 很多基元(士、土、王…)都可再拆。若把 土、士、王…再行拆分,势必增加更多的基元[]。这显然是不适当的,因此,基本笔划的折分,确须加以某些条件的限制。
我拟在<拆分原则>内加上一条:”部首(201)笔划在4笔以下者,单笔划不予拆出”。依此原则,干(一十)、己()、犬(大丶)、无(一尢)、歹(一夕)、牛(丿)、气(𠂉一⺄ 都不拆,须增加7 个基元。

b. 观察上节所列基元[]表,与[]相交的部件() 巿、求、屯、惠、專、疌、曹…。其中 叀、(一曰)(一⺕龰),也许以不拆分为宜,而这又须增加2个基元。

c.
这是两难的局面,须作不同方式的尝试,方可在基元总数与基本笔划含字数之间,取得平衡的考量,因为二者有”此消彼长”的矛盾关系。也许只有通过不断的实验、修正,才能得到合理的基元总数,以及从实践中归纳出的拆分规则。

d.
另一方面,字元 (部件)要怎样拆分,与汉字的形变相关,例如”鸟”本可不拆,但有省形的鸟()用在枭、凫上,如果鸟不拆,便需、鸟2个基元。”鱼”如果没有简繁之别 (鱼、魚),鱼也就不必拆分了。由此可知,简、繁体的统合,大大有利于通用字基元数量的省约。

 

7. 3 基元 [] 的探讨
基元[]的组字量,共有104个,列之如次。
: (104) ---
    蹿    
   
   
       
         

含基元[]的字以基元排列:计有 76 类,意即含基元[]的字,可出现在如下76类的基元中。
例如:
- 口、丨组成,可在基元 口、丨 中找到。
- 阝、一、口、冂、䒑、丨 组成,可在基元 阝、一、口、冂、䒑、丨 中找到。
要之,任何字都可由它所组成的基元中找到。

丨:(见上)
: (47) 蹿

: (6)
: (25)
: (12)
: (12)
: (12)
广: (11)
: (14)
: (16)
: (12)
: (12)
: (5)
: (7)
: (6)
: (8)

以下尚有60 个相关的基元与[]相关,省略不帖出。

 

汉字号称是”拼形”文字,是否就该有”拼形的字母”(基元)存在?(我不用”字根”这词儿,因为”字根”似与义相关,而”基元”只与形有关)。如果有”基元”存在,它是那些?这是我现在要探索的。基元数量确实不宜太多,应约在300左右。
如果有公认的”基元”存在,我们可用它来排序,组字…,我所谓”组字”是把基元依序作横式排列,例如:  - 亠、二、口、耂、日
目前的部首排序,只涉及部首这部分,偏旁还要依笔划来排,并未包括字形。如果有公认的”基元”存在,我们就可作”全字形”排序,(包括形旁、声旁),就不必经由部首、笔划二个层次了。
如果有公认的”基元”存在,我们写字时,心中默记的,就不是笔划,而可能是按照基元的次序来写了。
目前汉字的基础教学,还没有”基元”这个观念。中国人一向不注重分析逻辑,例如好些偏旁的名称都叫不出来,好多基元也没有UNICODE,连彼此沟通都有困难。
因此这是开创性的探讨,亟需大家的共同努力。

 

7.4 基元 [丿] 的探讨
1.
基本笔划 [丿]共可组546
以它组成的”偏旁”来统计,共有28组,详列之如次表:

: (25)
: (38) * *   
*
   

: (26)
: (24)
: (5)
: (2)
: (3)
: (9)
: (13)    
: (20)         窿   
: (23)            
: (124)
稿       
          禿        
      
         
: (10)
告:(15)    
: (17)      
: (6)
: (13)
: (29)            
       
: (32)
: (6)
: (14)
: (5)
: (24)            
: (22)
: (6)      
: (10)        
: (3)    
單丿:(5)

2.
检讨
a.
下列3字是从[],常被误作从[] ---
- 从耳呈声。  呈,平也,从口壬声 (说文)
- 聆也。从耳㥁,壬声(说文);聽的基元- 心。
- 说文在壬部。

b.
观察上表,从禾(丿木) 的字共有124个,它可作为部首( )、或声符( 科…)、或组件( 黍…)。若[]不拆,须增基元1个,但基本笔划[丿]的组字数可从546减至 422个。


c.
基本笔划中只有[][丿]有组字量较多的问题。点、拆的组字量都不多 ---
   [ , ] --- 299  
   [㇆
, ] --- 196
   ,,] --- 121
因此,有关此类基本笔划的分析,我就不再作了。

 

7.5   部首的拆分
为使拆分后所成的单笔划不超量,拆分原则加上如下2项:

1.
拆分后所成的基元,不可全是笔划。即所有2笔划的通用字都是基元
2.
200个规范部首中,4笔以下的部首,不可拆出单一笔划
因此 部首 干、彳、丬、己、巳、气、耂、歹、犬、户 ,在原则上,均不再分解。又部首 白、耒、自、足、雨,亦不拆分。
3.
若拆成的基元不是单笔划,部首仍可拆分,例如 (十又)、比(匕匕)、攴(⺊又)、父(八乂)…。
4.
部首(200)的拆分详如下表所示。

 

1.

丿

2.

3.-

/

广

/

/

4.

-十又

/

-匕匕

- 卜又

-八㐅

-几㐅

-几又

-亠㐅

-

- 𠂇

5.-二小

-丿

- 𠂉

-

- 宀八

- 乛龰

- 予丿

6.

-耂匕

-丆贝

-一厶土

-冂人人

- 𠂉十凵

- 千口

-

- 丿皿

-丿

-刀巴

-亠㐅

-𧘇

-

-

/

- ㇆冫㇆冫

- 幺小

7.-

-土龰

-

- 一口䒑

-厂一

-𧰨

-⺊囗㐅

- 曰土

- 口巴

/(彡龰)

-丿米

-八人口

-刀电

-刀⺆土

-立十

8.-

-十日十

齿-止凵人

-口电

阜丿㠯

-刀田一

-

9.-廿口十

-非一

-

-丿木日

-

-

-立日

-䒑自

10.- 镸彡

-一口冂䒑丨

- 亠口冂口

11.-田八

- 广木木

鹿- 匕匕

12.-目爿片

-土灬

-丿木人氺

13.-士口䒑十又

-

-丿目田一

-口口口冂卄

 

5. 检讨
a.
部首[]所属的字,只有”无”1字,因为在通用字中”无”均作为声符:妩 芜,分别归入部首 广 中。其实 “无” 并无必要列部,”无”本字可列入[]部,亦可拆成[一尢]<汉语大字典> 把无部等同[],是个正确的做法。

b. 200
部首中,把[]拼于[] 内,也非恰当的作法,二者不仅字形不同,含义也迥异;土(五行)、士(士大夫),在中国历史文化中各占有重要地位。上表把它们分开,土、士是两个不同的基元。

c.
回顾一下汉字部首的发展史,自许慎首创 540 个部首,开始以形归类的方法;后世较著的字书,如晋吕忱的<字林>,南朝顾野王的<玉篇>,宋司马光的<类篇>,都是遵照许慎的惯例编辑。直至明末梅膺祚作<字汇>,把<说文> 540 部,省并为 214 部;又把部首的"据形系联"的编辑方式,改为依笔划为序。清初的<康熙字典>,以至于民国以后的许多大小字典,也大都袭用梅氏的部首编例,只是部首数目有所精减而已。

这一段历史告诉我们,部首的发展是经过长久时间的沈积,而约定俗成的。因此笔者相信如有公认的中文字母(基元),也必须经过时间的考验而约定俗成的。基元虽与拆分原则有关,但不必拘泥于此。基元在最初状态也只是一张人为的字表,字表内容则可随实用经验而逐渐修正。

 

7.6 基本笔划[]的分析
1.
综合:(共组字292)
[
]: 鱿 涿

2.
详柝:可分为1 个部首()25个偏旁如下表:
: (32)
/ (13)    
/: (16)    
: (8)
: (16)
: (18)
郎:(9)
: (6)
: (12)    
主:(12)
: (6) 涿
: (14) 鱿    
: (4)
: (13)
: (17)    
: (6)
: (13)   
: (17)
囪:(7)
术:(7)   
: (6)
: (15)
: (6)    
: (14)    
: (6)

 

7.6   [言字] 的一般分析
在汉字中,[]是个很重要的字/部首,依功能分,言作为部首(含本字)165, 作为声旁或组件25个。分解之后可得基元160种。本节讨论[]的一般分析,下节将讨论[]的基元分析。

1.言作部首(165)
詿 調

2.
言作声符或部件(25)


3.
言部首的所属偏旁共有164个,列之如次:






 

7.7. 言偏旁(164)的基元详析

汉字原于是图画,研究语文学习心理的人,对汉字的观察,认为字的 首、尾 两部分给人的印象较为深刻,而字的中间部位最为模糊。因此汉字的首尾二个部件,常为一般 "字形输入法" 所采用。基于同一理由,我把[]所属偏旁的基元分析之后,依首尾位置排列,共有基元85个,共组164字。

1. 基元等于偏旁(45)
   同一基元的字附于此,其位置或在首[F],或在尾[L]
:  訊
:  誹
:  訕
:  訓
:  訂
:  訏
:  訣
:  訝
:  訶
:  詎
:  詐
:  訑
:  記
:  誧
:  讳
:  訃
:  詖
:  訄
:  該
:  誄
:  訐
:  誠
:  誰    F-譙
:  詳    F-議
:  討    L-謝
:  訪    L-謗
:  託    L-詫
:  詛    L-誼
:  訌    F-誣    L-試
:  計    F-詁读  L-許

B.
基元在首 (67)
:  譬
:  謔   
:  詿
:  詒
:  詆
:  詘  
:  譏
:  話  
:  訇
:  語
:  諮
:  誡   
:  誚
:  訴
:  誓      
:  諑
:  訟
: 
:  謇   
:  諞  
:  誦  
𠀎: 
:  諢
ツ”
:  諳
𠂉: 
:  謂
:  誊   
:  諍
:  詰
𠃌: 
:  諾
丿:  誅
:  詔
:  諄   

C. 基元在尾
(21)
:  讞
:  謐
:  諗  
:  诌  
: 
:  讴
:  課
:  設
:  謎
:  註
 
D...基元在首尾
2位置 (31)
:  誇     L-误
:  談     L-詼
:      L: 謹  
:  訾     L-証
:  詣   L-訛
:  諤     L-詬詻譎 調
:  謁     L-詢
:  譾    L-證
:  診    L-諛

 

8.0 基元拟案与560规范部件[GF]比较
1.
主要差异之点
a.
分析依据的样本不同:基元拟案乃依据<简繁统合体>原案7303字; [GF] 则为GB-13000.1字符集内的20902字。
b.
交重字形拆分或不拆分的不同:在一定条件下,拟案可拆分,[GF] 则交重不拆;这是二者最大不同之处。因交重不拆,GF即使把字形类似的部件归并,也有393组。而此393组却不能当作基元,因为不少归组的部件,实际上是几个不同的基元,如:日/曰、人/入、土/士、文//夂、衣//𧘇、水/氺…。
c.
认同使用的范围不同: [GF] 只把少部分部件变形 ( / ) 认同使用;拟案则扩大了合理的认同范围,如:朩/木、⺜/曰、⺊/卜、⺕/彐、⺼/月…。

2.
基元拟案与规范部件[GF]比较表
[GF]
虽列出560个部件,但其中有G列以外的专用部件(*标示)大都来自罕用字,把它剔除之后,可用作比较的规范部件共有509个。二者比较结果的统计如次:
  a. 可直接用作 ”基元” 289
  b. 要拆分才能取得基元的 147
  c. 要合成才能成为基元的 17
  d. 可认同使用的 56
以上合计509个部件,兹逐一与拟案比较之如次。

 

A. 直接用作 ”基元” ( 289)
GF
序號     GF部件     擬案基元
1
        口        口
2
        一        一
3
        八        八
4
        丷        丷
5
        木        木
8
        日        日
9
        曰        曰
12
        人        人
13
        入        入
14
        土        土
15
        士        士
16
        ⺾        ⺾
17
        亻        亻
18
        氵        氵
19
        月        月
24
        灬        灬
25
        金        金
26
        钅        钅
27
        十        十
28
        田        田
29
        纟        纟
30
        糹        糹
33
        幺        幺
36
        夂        夂
38
        贝        贝
40
        七        七
43
        匕        匕
45
               
46        又        又
48
        亠        亠
49
        大        大
50
        止        止
52
        龰        龰
55
        扌        扌
56
        女        女
58
        宀        宀
59
        丶        丶
60
        丿        丿
62
        讠        讠
63
        冖        冖
64
        虫        虫
65
        火        火
66
        冂        冂
69
        䒑        䒑
70
        山        山
71
        厶        厶
72
        王        王
74
        勹        勹
75
        心        心
76
               
77
        小        小
79
        阝        阝
80
        立        立
82
               
83               
85        衤        衤
86
        𧘇        𧘇
87
        忄        忄
89
        竹        竹
91
        目        目
92
        辶        辶
93
        几        几
94
        石        石
95
        寸        寸
96
        囗        囗
97
        车        车
98
        車        車
99
        刂        刂
101
        リ        リ
102
               
103
               
104
               
105
               
106
        𠂉        𠂉
107
        广        广
108
               
109
               
110
               
113
               
114
               
115
        𠂇        𠂇
116
               
118
               
119
               
120
               
121
               
122
               
123
               
125
               
127
               
128
               
132
               
133
               
134
               
135
               
136
               
137
               
140
               
141
               
143
               
146
               
149
               
150
               
151
               
152
               
154               
158
               
159
               
161
               
162
               
163
               
164
               
166
               
168
               
169
               
170
               
171
               
174
               
175
               
176
               
177
               
180
               
181
               
182
               
183
        ㇄        ㇄
185
        𧰨        𧰨
187
               
188
               
189
               
190               
192
               
193
               
195
               
205
        西        西
206
               
208
               
209
               
210
               
211
               
213               
215
               
218
               
220
               
221
               
222
               
223
               
224
               
225
               
226
               
227
               
228               
229
               
234
               
235               
236
               
239
               
240
               
241
               
242
               
243               
245
               
246               
248
               
252
               
253               
254
               
255
               
256
               
257               
259
               
261
               
263
               
264
               
265
               
267
               
268
        廿        廿
269
        𠀎        𠀎
270
               
273
               
275
               
276
               
277
               
283               
287
               
288
               
291
               
292
        r        r
293
               
294
               
296
               
297
               
300
               
302
               
303
               
304
               
305
               
307        𡗗        𡗗
308
               
310
               
314
               
317               
318
        𣥂        𣥂
329
               
330
               
331
               
336
               
338
        𠃌        𠃌
339
               
340
               
341               
346               
347
               
349
               
350
               
355               
356               
359
               
361
               
362
               
363
               
365
               
372
               
373
               
374
               
375
           
376
          
377         
378
            
381
               
385
               
386        𠃜        𠃜
387
               
388
               
395
               
396
               
399
               
403               
405               
407
               
408
               
409
               
412
               
416
               
417
               
419
               
420
               
421
               
422
        𠂭        𠂭
425
               
426
               
431               
433
               
434
               
438
               
439
               
442        𠃓        𠃓
443
               
449
               
455               
457
               
458
               
463
               
471
               
477               
486               
487
               
489               
491        𦈢        𦈢
496
               
498               
502
        𠂔        𠂔
503
               
504
               
507
                三
509
               
515        飛        飛
516
        专        专
517
        丈        丈
518
        丏        丏
519
               
521        龜        龜
522
        ㄟ        ㄟ
525
        丐        丐
526
        史        史
527
        丱        丱
540
               
551        乜        乜
553
        书        书

 

B. 规范部件要拆分才能取得基元 (147)
对于交重部件可否拆分,是个见仁见智的话题,笔者主张在一定条件下,汉字可以而且必须拆分,才能求得汉字的最低层结构。这是因为汉字本身是迭床架屋式的属性,拆分有字理可寻。举例来说,古代铜钱中心具有方孔,常须用绳子来贯穿成 ”串”,[]拆分成 口、口、丨,正可显示”串钱”的动作程序。[]是个指事字,如果不把它拆成 口、丨,如何能说明它的含义?

又如 [],居也。从田从土(说文),因此把[]拆成 田、土,正是造字的原意。但为着避免[]中的竖笔重复,也为着避免”断开竖笔”分部的现象,我把[]拆成 曰、土。土的竖笔穿入”曰”中而连结成”里”。这是相交部件的特性,部件中会有一个笔划,把相关部件贯穿成字。

其实交重拆分的要点在于笔序,只须照笔序写下熟悉的部件就可。例如 [],写下了”千”的首2笔,
接着写 “曰、土”,千2、曰、土 就是拆开的部件。这3个部件是以”土”的竖笔,串在一起的。
同理,熏,照笔序写下它的部件是:千2、土,也是以”土”的竖笔,串连成字。

另有一种情形就是部件的笔划不是连续的,例如,東:照笔序写 一、日、小(似形),而 [一小] 可组成 ”木” ,于是“木、日”便成为 ”東” 的部件,这样做不仅精省了部件数目,也使 ”東” 字具有”日上树梢”的寓意。

再如 [],照笔序写 一、口、彐、亅,如果现成部件表中有 [2]这个部件,[]拆分后的部件便是:[2]、口、彐 3个,如果没有[2],就是上述的4个。( 例如,有人把 ”寸” 分为 [2][]二部件,就可以 [2] 当作基元,用在”事”字的拆分上。)

 

下表是把”规范部件”与拟案”基元”的对照。
序号        GF部件        基元
31
               
34
               
35
                𠂉
39
               
61
               
73
               
81
                丿
84
                𧘇
117
               
124
                𠃌  
138
               
139
                广
148
               
155
                丿
157
                𠃌  
172
               
173
               
184                𧰨
186
                𧰨
197
               
198        u       
199
        m       
200
               
201
        m       
202
               
203        [肀冂]       
204
        m       
219
               
231
                丿
232
                廿
237
               
244
                丿
250
               
251
        𠕁       
262
               
271
                丿
272
                𠂉
274
               
278
                丿
279
        𠫔       
280
               
282
               
284
               
285
                𠂇
286
               
295
        u       
298
        d       
299
                廿
301
               
309
                九、
311
               
313
               
315
               
316
               
319
               
323
                丿
324
               
326
               
332
        d       
334        d       
335               
337               
342        ur        𠂉
343
               
348
        u        丿
352
               
354
               
357
               
358
        𠂤        丿
364
                丿
366
               
368               
369
               
370
        i       
371
               
379
                2
380
                丿
382
               
383
               
384               
391                丷丨
392
               
393               
394
               
397
               
400
               
401               
402
               
406
        d       
410
        r       
411
        m        丿
413
               
415
               
423
               
424
                2
427
        u       
429
               
430
        d       
432        i       
440
               
445
        r       
447
        u        丿
448
               
450
               
453
               
454
               
456        3        𧘇
459
                廿
460
                丿
461
                丿
462                2
464
               
465
               
466
               
467
               
468
               
469               
470
        u       
474
        巿       
476
        u       
478
        𦣞       
480
               
483
               
484
        r       
485
                𧰨
488
               
492
               
494
               
495
        d        广
500
        m       
506
               
513
        []        𠃌
514
               
520
                𠂉
528
        u       
529
               
531
        d        丿
534
               
538
        i       
539
        do       
543
               
544
                丿
546
        r       
552
               
557
        d        廿
558
               

 

C. 要合成才能成为基元(17)
这需要说明一下,[规范部件]中有些部件拆得很细,例如, 的右旁,实际应用时, 不必拆分;因为拆分后,不会减少基元数目。同理,“隹”[规范部件]拆出右旁,[拟案]则直接用隹作基元。

下表英文字母的意义:l(left)=左偏旁,r(right)=右偏旁,u(up)上偏旁,d(down)=下偏旁,m=中间
例如,氺lr 左右两旁的
32
                <纟
47
        r        <
51
        d        <
88
        隹r        <隹
111
        马u        <马
112
        馬u        <馬
160
        可r        <可
165
        欠u        <欠
233
                <
290
        氺lr        <氺
367
        亥d        <亥
446
                <乌
452
        ス        <𢀖
472
        印l        <印
490
        氶lr        <乛水

 

D. 可认同使用(56)
6
        朩        ~木
7
        朮        ~木
10
        ⺜        ~曰
11
        冑d        ~月
20
        青d        ~月
21
        ⺼        ~月
22
        炙u        ~月
23
        亙m        ~月
37
        夊        ~夂
41
        切l        ~七
42
        它d        ~匕
44
        化r        ~匕
57
        ⺈        ~刀
67
        ⺆        ~冂
68
        奂m        ~冖
78
        ⺌        ~小
90
        ⺮        ~竹
100
        班m        ~リ
126
        已        ~己
129
        改l        ~己
130
        改l        ~巳
131
        顾ld        ~
142
        ⺊        ~卜
144
        ⺶        ~羊
145
                ~羊
147
        ⺀        ~冫
153
        判ld        ~
167
        今d        ~乛
178
        犀m        ~氺
194
        幵l        ~干
196
        匸        ~匚
207
        襾        ~覀
212
        归r        ~彐
214
        ⺕        ~彐
216
        邦l        ~丰
247
        报ru        ~卩
249
        册        ~冂卄
260
        虛d        ~业
266
        ⺇        ~几
289
                ~手
312
        內        ~冂人
325
                ~臼
327
        亞        ~一业
344
        電d        ~曰乚
360
        兂        ~旡
389
        ㇏        ~ㄟ
390
        敢f        ~乛
404
        囬i        ~
435
        带u        ~卅
436
                ~卅
451
        ユ        ~
499
        鼎d        ~爿片
505
        乑        ~𧰨
508
        卝        ~⺾
532
        別ld        ~力
548
        壺d        ~业

 

3. 大家难免要问:由上述 GF部件” 所形成的”基元”,比原拟案的基元,究竟增加了多少?前者依据GB-13000.1字符集中的20902字,后者分析的样本只有7300简繁统合体。统计结果令人难以置信。原拟案基元修正后为300 个,以GF取样后只增加了19 ---
   𠃓   
这表示319 (=300+19) 基元,可用于2万个简、繁体。

另一方面,原样本一部分字 (或部首) 是就简、繁体择优选用的,例如:
a.
捨繁笔取简笔:捨龜取龟,捨黽取黾;捨 r、長、門 馬,取 马。
b.捨草体取楷体:捨专取專,捨东取東;捨 𠃓,取書 昜。
c.
捨临取臨,捨齊取齐,捨關[]取关,捨咼[]取呙。
也就是说,若我当初选用了7300简、繁兼备的通用字作样本,则 7千字与 2 万字样本所得基元之差只有1个基元 ()

这个统计告诉我们,寻求汉字(异体外)的基元,要点不在于样本字数的大小,而在于交重的部件必须作合理的拆分。

 

本项统计工作最大困恼之处,在于好些基元没有unicode,以致无法在屏幕上正常显示。
我己把560 规范部件与拟案作了比较,很盼望网友提供意见。因为300 个基元需要大家认可,不是一个人说了算。

 

10.0 基元统计有何实用价值?
目前想到的有如下几点:
1. [
基元]造型不像一般输入法 (仓颉、五笔、四角号码) 那样,只取汉字的零星碎片,而是完整的结构组件 [基元] 是汉字的基础部件,可称为中文字母,是汉字的主要属性之一。
2. [
基元] 的主要功能是给汉字排序[基元]编码不用于汉字输入,因为它的输入效率不高。
3. [
基元]可用于探讨汉字的基本结构,作为优化汉字结构的参考;不少可认同使用的结构组件,例如彐() / ()、电 / d、襾 / 覀…,可以归并为一形,减少不必要的字形差异。
4.
在整理讹字和异体时,在字型结构上,基元可作为衡量异同的标准。
5.
利用基元编码,可用于直接检索汉字;不必经过部首、笔划二层次的查字。
6.
利用基元编码可望(以下引某网友的话) “以今字检古字、以正体检异体、以部件检复杂字…”。

11.0  讨论及补充

1. 重发300基元的编码(Rev.)若无法显示,则以成字及符号表示。

例:与2 2划,介-2 2 

1h

1i

1i1

1p

丿

1t

1t1

1z

1z1

1z2

1z3

1z4

𠃌

1z5

2hh

2hi

2hi1

2hp

2hp1

2hp2

𠂇

2hz

2hz1

2hz2

2hz3

2

2ih

2ii

2ii1

2ip

2ip1

-2

2it

2iz

2ph

2

2ph1

𠂉 2

2pi

2pi1

-2

2pi2

2

2pp

-2

2pp1

2pt

2pt1

2pt2

2pt3

2pz

2pz1

2pz2

2pz3

  -2

2pz4

2th

2tt

2tt1

2tz

2tz1

2zh

  2

2zi

2zi1

2zi2

2zi3

2zi4

2zp

2zp1

2zp2

2zp3

2zt

2zt1

2zt2

2zt3

2zz

2zz1

2zz2

  2

3hh

3hh1

3hh2

3hh3

3hh4

3hh5

  -3

3hi

3hi1

3hi2

3hi3

3hi4

3hi5

3hi6

  -3

3hi7

  3

3hi8

  3

3hp

3hp1

3hp2

  3

3ht

3ht1

3ht2

3ht3

3hz

3ih

3ih1

3ih2

-3

3ii

3ii1

3ip

  -3

3it

3it1

  -3

3it2

  -3

3ph

  3

3pi

3pi1

3pi2

3pp

3pp1

3pp2

𠂎

3pt

3pt1

3pt2

3pt3

3

3pz1

-3

3th

3ti

3tp

广

3tt

3tt1

3tt2

3tt3

3tt4

3tz

3tz1

3tz2

3zh

3zh1

3zh2

3zh3

3zh4

3zh5

3zh6

3zi

3zi1

3zp

3zp1

3zp2

-3

3zt

3zz

3zz1

3zz2

3zz3

3zz4

4hh1

廿

4hh2

4hh3

4hi

4hi1

4hi2

4hi3

4hi4

4hp

4hp1

4ht

4ht1

4ht2

4ht3

4ht4

4ht5

4ht6

4ht7

4ht8

  -4

4hz

4hz1

4hz2

4ih

4ih1

4ih2

4it

4it1

4it2

4it3

4it4

  -4

4it5

4iz

4iz1

  4

4ph

4ph1

4pi

4pi1

4pi2

4pp

𠂔

4pt

4pt1

4pt2

4pt3

4pt4

  -4

4pt5

  -4

4pt6

  -4

4pt7

𧘇

4pz

4pz1

4pz2

4pz3

4pz4

  4

4pz5

  4

4tp

4tp1

4tt

4tt1

4tt2

4tt3

4tt4

4zh

4zi

4zp

4zp1

  4

4zp2

𠃜

4zt

4zz

5hh

5hh1

5hh2

5hi

5hi1

5hi2

𠀎

5ht

5ht1

5ht2

5ht3

5ht4

5ht5

𡗗

5ht6

  -5

5ih

5ih1

5ih2

5ih3

5ih4

5ih5

5ih6

5ih7

5ih8

  5

5ih9

5it

5it1

5iz

  5

5ph

5ph1

5ph2

5ph3

  5

5pi

5pi1

5pi2

5pt

5pt1

5th

5tt

5zh

5

5zh1

𢀖

5zt

5zt1

5zt2

5

5zt3

5zz

6hh

6hh1

西

6hh2

  6

6hh3

6hi

6ht

6ht1

6ih

  m

6ih1

  6

6ip

6it

6iz

6ph

6ph1

6pi

6pi1

6

6pt

6pt1

6

6pt2

6

6pt3

𠂭

6pt4

𧰨

6pz

6pz1

𦈢

6ti

6ti1

6tt

6tt1

6zt

6zt1

7hh

7hi

7ht

7ht1

7ht2

7hz

7it

7iz

7

7pp

7pp1

7pt

7pt1

7ti

  鹿7

7tt

8ht

8ht1

  (-)

8ph

8ph1

8ph2

9hh

 

如果你有PUA码,300基元都可显示,看下表可知。

F/L

H

I 

P

,T

Z

 

1

丨亅

丿

乚乙

12

2h

𠂇

 

七匚

10

2i

 7

2p

(2) 𠂉

𠂆

九儿 几勹

16

2t

 

 

 5

2z

了凵 丩卩

17

3h

于廾 

23

3i

 

9

3p

饣彳

𠂎

12

3t

 

广

⺍之 忄氵辶

11

3z

纟马 

18

4h

廿

瓦长

22

4i

 

 

11

4p

𠂔

𧘇

20

4t

 

 

心火 为灬

 

 7

4z

𠃜

 7

5h

𠀎

 

𡗗

 

13

5i

且凸四田皿 目业罒

 

 

13

5p

 

 

 9

5t

 

 

 

 2

5z

𢀖

 

 

 7

6h

耳西

 

 

 7

6i

 

 5

6p

 

𠂭 𧰨

𦈢

11

6t

 

 

 

 

 4

6z

 

 

 

 

 2

7h

 

 6

7i

 

 

 

 2

7p

 

 

 

 4

7t

 

 

 

 2

8+

 

 

 6

300

65

54

37

93

51

300

 

新增的19个基元编码:首、次码同前,尾码一律用英文字母[a],以示与300基本码有别。此外,

9笔以上的基元,其首码一律以[9] 表之:  

(2za)𠃓(3za) (4ha)、专(4hb)(4ia)(4pa)、书(4za)) (5ha)、冎(5ia)、丱(5za)

(6pa)、龍r(7ha)、長(8ha)、門( 8ia)、馬(9ha)、黽( 9ia)、龜( 9pa)、為(9ta)、飛(9za) 

 

基元筆劃

up

字數300

12

55

73

67

44

29

14

6

 

 

11.0 最终统计

1. 基元315  (=2 ; =r )

𠃌

丿

𠂉

𠂇

𠂆

廿

𠂎

广

𧘇

西

𧰨

𦈢

𡗗

𠂔

𠃜

𠂭

𠀎

𢀖

 

 

 

 

 

 

2. 基元的组字量(依字量序)

1737

966

642

567

561

555

490

479

393

391

389

丿385

344

343

340

330

322

319

317

310

𠂉297

292

281

273

267

260

252

251

236

233

225

223

196

196

195

190

185

184

181

178

175

173

173

172

162

162

159

155

155

150

149

142

141

141

139

138

138

137

137

136

135

133

129

128

125

123

118

118

114

广114

112

109

109

108

104

101

99

99

97

91

90

90

𠂇89

87

87

86

84

廿83

82

82

82

80

80

78

77

77

𧘇77

76

76

74

72

72

70

69

66

66

65

65

𧰨64

62

62

61

61

60

60

60

57

55

54

54

52

51

50

48

48

48

47

47

47

47

46

46

46

45

45

42

42

41

39

39

38

37

𠀎37

𠂆37

36

36

36

35

35

34

33

33

33

33

32

32

32

32

31

31

28

28

28

27

26

26

26

26

26

25

25

25

25

25

24

24

24

24

24

24

24

𡗗24

23

23

22

22

21

21

21

21

21

20

20

20

20

20

19

19

18

𠃌18

17

16

16

16

西16

16

𢀖16

15

15

15

15

15

15

15

15

14

14

14

13

13

13

13

13

𠃜13

12

12

12

12

12

12

12

12

12

12

12

12

12

11

11

11

11

11

11

11

10

10

10

10

9

9

9

𠂎9

8

8

8

7

7

7

6

6

6

6

6

5

5

5

5

5

5

5

5

𠂭5

4

4

4

4

4

4

4

4

4

4

4

4

4

4

𦈢4

3

3

3

3

3

3

3

3

𠂔3

2

2

2

2

2

2

2

2

2

1

1

1

1

1

1

1

1

1

58

 

 

 

 

 

如果简繁体可择优选用,则下列14个基元可省略:𠂭,,,,,,,,,,,,,

 

3. 基元的组成

a. 成字 [w] 170



廿

西

广

 

 

 

 

 

 

 

 

 

 

b. 部首 [s] 50

 

 

 

 

 

 

 

 

 

 

c. 组件 [g] 95

丿

𠀎

𠂆

𠂇

𠂉

𠂎

𠂔

𠂭

𠃌

𠃜

𡗗

𢀖

𦈢

𧘇

𧰨