汉字同音的统计与探讨                                       zn\zpz     3/12 rev.

提要:

通用汉字的音节,若不计声调的变化,有 400组,考虑声调变化的音节,理论上应有1600个,依本文样本的统计得知,实则只有1201,所缺的399 个音节,可能与所属的声母有某种关联。通用字 7376 中,同音读10个以下的,约占半数。汉字同音多,是未能演化成拼音文字的主要原因之一。依统计,通用字的读音,约 1/3是去声调。

 

目录 1. 一般统计                          2. 详细统计                         3. 同音字评析

         附图: 1. 通用字声调分布图    2. 通用字同音分布图      (2)

         附表:  汉字同音(含字数12031)的统计

 

1.0  一般统计

样本:共 7376字,包括大陆规范的通用字(7000),台湾规范的常用字(5401)及次常用字(1719)

1.1 声调的统计

    汉字音节,若不计声调的变化,只有 400组;若计及声调的变化,则通用字共1201,如下表所示:

/

阳平 

上声

去声

合计

音读数

4/315  

245

300  

337 

1201 

含字数

6/1838

1960 

1227 

2345 

7376 

字数 %

24

27   

17   

32  

100 

 

    由此可知,通用字的读音,约 1/3 (32 %) 是去声调.

     理论上 400组音标,应有 1600音读;实际上只有 1201,其差 399表示缺调的音节,详下文2.2节。

 

 通用字(7376)各声调含字数为:阴平(含轻声) 1844 阳平 1960 上声 1227 去声 2345字;声调以去声为最多。

 

1.2   同音读的综合统计:

                

每组同音字

组数(音节)

累计音节

字数     

字数比例%

累计字数%

1

224

224

224

3.0

3.0%

2

175

399

350

4.7

7,7%

3

123

522

369

5.0

12.7%

4

104

626

416

5.6

18.3%

5

97

723

485

6.6

24.5%

6

73

796

438

5.9

30.8%

7

62

858

434

5.9

36.7%

8

52

910

416

5.6

42.3%

9

40

950  (79%)

360

4.9

47.2%

10

51

1001 (83%)

510

6.9

54.1%

11

29

/ (下略)

319

4.3

/ (下略)

12

28

/

336

4.6

/

13

17

/

221

3.0

/

14

25

/

350

4.7

/

15

19

/

285

3.9

/

16

12

/

192

2.6

/

17

15

/

255

3.5

/

18

13

/

234

3.2

/

19

4

/

76

1.0

/

20

4

/

80

1.1

/

21

4

/

84

1.1

/

22

6

/

132

1.8

/

23

3

/

69

0.9

/

24

3

/

72

1.0

/

25

2

/

50

0.7

/

27

1

/

27

0.4

/

28

1

/

28

0.4

/

29

2

/

58

0.8

/

33

2

/

66

0.9

/

34

1

/

34

0.5

/

35

1

/

35

0.5

/

40

2

/

80

1.1

/

41

1

/

41

0.6

/

45

1

/

45

0.6

/

46

2

/

92

1.2

/

50

1

/

50

0.7

/

63

1

/

63

0.9

/

合计

1201音节

 

7376字数

 

100%

 

 

 

  由上表及上图可知:

同音字组在1(9-10)之间时:   

1. 总字数约占半数 (47-54%),相当于上图黄色折线下面积。

2. 音节数约占8 (79-83%),相当于上图红色折线下面积。

 

1.3沈先生(Shenj)的统计:

北大退休教授沈炯先生提供了类似的统计,他的统计如次表:

每组同音字

音节数

总字数  /  比例%

1

256

256

3.28%

2

167

334

 

3

155

465

..

4

114

456

..

5

104

520

..

6

76

456

..

7

64

448

..

8

53

424

..

9

60

540

..

10

39

390

..

11

38

418

..

12

28

336

..

13

30

390

..

14

16

224

..

15

16

240

..

16

18

288

..

17

7

119

..

18

14

252

..

19

7

133

..

20

5

100

..

21

3

63

..

22

4

88

..

23

5

115

..

24

3

72

..

25

3

75

..

27

2

54

..

28

2

56

..

33

1

33

..

35

3

105

..

38

1

38

..

40

2

80

..

44

2

88

..

46

1

46

..

52

2

104

96.72%

合计

1301音节

7806

100.00%

区分四声及轻声

一字多音重复计数

 

.上图黄色折线表字数,红色折线表音节。

 

因为二者的样本来源及取样总字数不同,各组同音的字量自然会有些差异,但大体说来,其结论是相似的:

1. 通用字单音读的字数(没有同音的)只占约 (3.0-3.3) %;换言之,97%的汉字都有同音现象。

2. 同音读的字量,以每组同音字数5-10 者为最多,约占取样总字数30-35%

3. 同音字组在1(9-10)之间时:

a. 总字数约占半数 (47-54%),相当于上图黄色线下面积。

b..音节数约占8 (79-83%) 相当于上图红色线下面积。

 

要之,在 7000 通用字范围内,平均有6 个同音字。大约8 成的音節,共有 1 10 个字同音。

同音较多(含字数120-31)的音标,其统计详如文末附表.

 

 

2.0 详细分析及统计

   以下统计的声调符号:  1=阴平  2=阳平  3=上声  4=去声

2.1  同音字最多的音标

1. 不计声调,同音最多的音标为: yi[120]; 其次为 ji[114] yu[104] fu[89] 计及声调,同音最多的音读为:yi4/[64],其次为 xi1/西[51]bi4/[45]li4/[46]yu4/[45] fu2/[40]; 以下为此等同音读的全部字例

 

yi4 64  亿 羿

    驿

 

  故事Yi漪姨胰疫--

  漪姨倚椅,悒悒,疑异疫,宜诣医。医意宜以蚁胰医姨,医以亿弋弋亿蚁,亿蚁殪,蚁胰溢。医以亿蚁溢胰医姨,姨疫以医。姨怡怡,以夷衣贻医;医衣夷衣,亦怡怡。噫,医以蚁胰医姨疫,亦异矣;姨以夷衣贻医,亦益异已矣。

 

xi1 51 西

    

 

bi4 45

 

li4 46  

 

yu4 45  

 

fu2 40   

    

 

  2. 不计声调,读 shi 音的通用字有 70 ,其中常用字 47 --

shi1 湿 湿   shi2   shi3 使

shi4

 

    故事Shi:施氏食狮史 --

石室诗士施氏,嗜狮,誓食十狮。氏时时适市视狮,十时,适十狮适市。是时,适施氏适市。氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮尸,食时,始识是十狮尸,实十石狮,试释是事。

 

  3. 不计声调,同音ji 113字。

 

故事Ji 饥鸡集机记 ---

唧唧鸡,鸡唧唧,几鸡挤挤集机脊。机极疾,鸡饥极,鸡冀已技击及鲫。机既济蓟畿,鸡计疾机激几鲫。  

机疾极,鲫极痵,急急挤集矶际。继即鲫迹极寂寂,继即几鸡既饥即唧唧。               

 

2.2   缺调(即没有这个音节)的统计

1. 阳声字(尾音带 n/ng)缺调的统计 --

    在声母 b, d, g, j, k, s, sh, z 之下,带 n/ng 的字,没有阳平调,其音读数计70

    而在声母 l, m, n 之下,大都缺阴平调;其音读数计36

    阳声字缺上声的音读计36,主要声母为:c, h, n, s

. 阳声字缺去声的音读计36,主要声母为:c, n, r, s

 

 2. 阴声字(尾音不含n/ng)缺调的统计 --

      缺阴平的音读37,主要声母为:n, r, m

      缺阳平的音读87,主要声母为:s, n, c, d, g, k, z, r

      缺上声的音读64,主要声母为:d, s, c, h, n, l, p

      缺去声的音读30,主要声母为:d, z

 

 3. 阴声字与阳声字缺调与主要声母相关比较如次表-- [ ]内表阴阳二者相同的声母:

  声调 

缺阴平

       缺阳平           

      缺上声        

   缺去声

 阳声字

[m, n] l

[d, g, k, s, z] b, j, sh 

 [chns]      

 cnrs

 阴声字

[m, n] r

[d, g, k, s, z] c, l, r, n

 [chns] dlp

 dz

  

3.0  评析

1. 汉字不考虑声调变化的音标数为 400,考虑声调变化的音节则有1201(此数因取样不同而异)。所缺的 399 声调,由上述统计知,可能与缺调所属的声母有某种关联,须作进一步研究。 

   2. 7376字中,没有同音的字,只有 224,约占总字数 3%;其它双、三、四同音的,所占的比例,也只各约 5-6%,如下表: 

同音别

无同音

二字同音

三字同音

四字同音

     合计字数

224

350    

369    

416

占总字数%

3.0    

4.7    

5.0    

5.6

 

3. 为区别同音,达到表意功能,汉语乃缀字成词,词汇因之大量增加。严格说来,除若干单字词外,汉字只代表词()素及音节,这给我们如下一些启示:

      a. 学会了单字,只学会汉语的一半。汉字的教学似宜[][]并重。

      b. 比较中西文字的字量时,不能只作'字对字'的比较。一本简明的(concise)英汉字典,通常包含 8-9 万英文字();而这些英文字可能只须用 3-4千常用汉字,便可一一对应的把它翻译出来。但绝大部分的中译,是汉语的''而非单字。汉字表达的大多只是词中的词素。

      c. 因汉字代表音节,繁衍出不少多音节”的异体词,例如:彷佛/仿佛/髣佛,倒霉/倒霉,古董/骨董,啰唆/啰嗦,/局促,疙瘩/咯嗒…。 d

      d. 多音节词汇不断发展的结果,在未来,汉字是否可能以拼音文字取代?由于汉字先天性的形声功能,此功能由于古今音变,目前虽已减弱;但与拼音文字比较,汉字具有形象化的表意特色,在可预见的未来,它是无法用拼音文字取代的。

  

        4.0 附件

  附件1  通用字(7376)同音(含字数12031)统计

   表中:1,2,3,4代表阴平,阳平,,去四声   

      

音标

字数 

各调代表字及字数

 

音标

字数

各调代表字及字数

yi      120

1//16

2//27 

3//13 

4//64

chi  42

1//14

2//11 

3// 7

4//10

Ji      113

1//36

2//29 

3//11 

4//37

bo   41

1// 9 

2//26 

3// 2 

4// 4

yu     105

1// 6 

2//35

3//18 

4//46

 yin  41

1//14

2//12 

3// 9 

4// 6

fu      89

1//11

2//40 

3//14 

4//24

di   40

1// 4 

2//12 

3//10 

4//14

zhi    87

1//18

2//14 

3//16 

4//39

jia   39

1//18

2// 9 

3// 7 

4// 5

li       84

1// 1 

2//22 

3//15 

4//46

xie  39

1// 5 

2// 9 

3// 2 

4//23

xi      83

1/西/49

2//10

3// 8 

4//16

Ying 39

1//13 

2//17 

3// 5 

4// 4

qi      77

1//17

2//34 

3//11

4//15

jin  38

1//11

    

3// 9 

4//18

 Jian   73

1//22   

    

3//23 

4//28

 zi   38

1//22

    

3//11 

4// 5

 yan    70

1//15 

2//16 

3//17 

4//22

 yao  37

1// 7 

2//19 

3// 5 

4// 6

 shi   70

1//16 

2//14

3// 7 

4//33

 ke   36

1//17 

2// 3 

3// 4 

4//12

 wei   61

1//13

2//15 

3//16 

4//17

 Yuan 36

1// 7

2//22 

3// 1 

4// 6

 bi     59

1// 2 

2// 2 

3// 9 

4//46

 xun  36

1// 9

2//15

   

4//12

 wu    59

1//10 

2//13

3//15

4//21

 si   35

1//16   

   

3// 1 

4//18

 ju     56

1//17 

2// 6 

3// 9 

4//24

 Xiao 35

1//20 

2// 2

3// 4 

4// 9

 Xian  56

1//13 

2//17 

3//12

4//14

 qu   35

1//13

2//14 

3// 4

4// 4

 zhu   53

1//16 

2//10

3// 8

4//19

 xu   35

1//13 

2// 1 

3// 6 

4//15

 lu     48

1// 2 

2//14 

3// 8 

4//24

he   34

1// 2 

2//25

4// 7

 shu   48

1//17 

2// 7 

3// 9 

4//15

 mo   34

1// 1 

2//12 

3// 1 

4//20

 Qian  46

1//21

2//10 

3// 5 

4//10

 Shan 34

1//18

    

3// 2 

4/ 14

 you   46

1// 7 

2//17 

3// 9 

4//13

 e    33

1/  2 

2/ 11

4/ 20

 gu     45

1//15

    

3//19

4//11

 Zhen 33

1/ 18    

    

3/  7

4/  8

Jing  45

1//17    

    

3//11 

4//17

 Ling 32

1/  1

2/ 26 

3/  2

4/  3

 jie     44

1//10 

2//22 

3// 2 

4//10

 Huan 32

1/  2 

2/ 13

3/  2 

4/ 15

 pi      44

1//12 

2//16 

3// 7

4// 9

 mi   32

1/  2 

2/ 13 

3/  6 

4/ 11

 hui    43

1//12 

2// 5

3// 4

4//22

 tan  32

1/  6 

2/ 14 

3/  6 

4/  6

 hu      43

1// 8 

2//18

3// 4 

4//13

 chu  31

1/  3

2/ 11 

3/  5 

4/ 12

 Jiao   43

1//19   

3//13 

   4//11

 fei  31

1/  9

2/  3 

3/  8 

4/ 11

 Chan  31

1/  3

2/ 16 

3/  8 

4/  4

 ge   31

1/ 12

2/ 12 

3/  2 

4/  5

 

 

附件2汉字21843(unihan属性62)同音统计

組別

音節

字數

1

148

148

2

103

206

3

67

201

4

78

312

5

61

305

6

46

276

7

59

413

8

50

400

9

45

405

10

57

570

11

41

451

12

38

456

13

31

403

14

27

378

15

31

465

16

24

384

17

28

476

18

29

522

19

23

437

20

23

460

21

23

483

22

20

440

23

20

460

24

18

432

25

16

400

26

18

468

27

15

405

28

10

280

29

12

348

30

16

480

31

9

279

32

15

480

33

7

231

34

12

408

35

6

210

36

7

252

37

9

333

38

5

190

39

2

78

40

10

400

41

8

328

42

8

336

43

3

129

44

3

132

45

7

315

46

6

276

47

4

188

48

4

192

49

3

147

50

1

50

51

2

102

52

6

312

53

2

106

54

2

108

55

1

55

56

2

112

57

2

114

58

5

290

59

1

59

60

3

180

62

2

124

63

5

315

65

2

130

66

2

132

67

1

67

68

1

68

70

1

70

73

1

73

74

2

148

75

2

150

77

1

77

79

2

158

80

1

80

82

2

164

84

1

84

86

1

86

87

1

87

88

2

176

95

1

95

98

1

98

100

1

100

107

3

321

124

1

124

133

1

133

134

1

134

166

1

166

227

1

227

 

 

附图:红-音节数   -总字数

 

 

 

附件3 通用字7376unihan21843字之同音比较

 

单音字数

最多的同音字数

音节数

总字数

A  7376通用字

223

64-(1)

1202

7376

B  21843汉字

148

227-(1)

1373

21843

 

详如下表:

组别

音节

总字数

每组字数

A1202

 B1373

A7376

B21843

1

223

148

223

148

2

180

103

360

206

3

121

67

363

201

4

104

78

416

312

5

96

61

480

305

6

74

46

444

276

7

60

59

420

413

8

54

50

432

400

9

41

45

369

405

10

51

57

510

570

11

27

41

297

451

12

28

38

336

456

13

17

31

221

403

14

23

27

322

378

15

20

31

300

465

16

13

24

208

384

17

17

28

289

476

18

11

29

198

522

19

4

23

76

437

20

4

23

80

460

21

3

23

63

483

22

6

20

132

440

23

4

20

92

460

24

3

18

72

432

25

1

16

25

400

26

/

18

/

468

27

2

15

54

405

28

1

10

28

280

29

2

12

58

348

30

/

16

/

480

31

/

9

/

279

32

/

15

/

480

33

2

7

66

231

34

1

12

34

408

35

1

6

35

210

36

/

7

/

252

37

/

9

/

333

38

/

5

/

190

39

/

2

/

78

40

2

10

80

400

41

1

8

41

328

42

/

8

/

336

43

/

3

/

129

44

/

3

/

132

45

1

7

45

315

46

2

6

92

276

47

/

4

/

188

48

/

4

/

192

49

/

3

/

147

50

/

1

/

50

51

1

2

51

102

52

/

6

/

312

53

/

2

/

106

54

/

2

/

108

55

/

1

/

55

56

/

2

/

112

57

/

2

/

114

58

/

5

/

290

59

/

1

/

59

60

/

3

/

180

62

/

2

/

124

63

/

5

/

315

/

1

/

64

/

65

/

2

/

130

66

/

2

/

132

67

/

1

/

67

68

/

1

/

68

70

/

1

/

70

73

/

1

/

73

74

/

2

/

148

75

/

2

/

150

77

/

1

/

77

79

/

2

/

158

80

/

1

/

80

82

/

2

/

164

84

/

1

/

84

86

/

1

/

86

87

/

1

/

87

88

/

2

/

176

95

/

1

/

95

98

/

1

/

98

100

/

1

/

100

107

/

3

/

321

124

/

1

/

124

133

/

1

/

133

134

/

1

/

134

166

/

1

/

166

227

/

1

/

227