ch2011slide01

25
じんもんこんシンポジウム 2011 1 「山吹」をめぐる和歌語彙の空間 山元啓史 東京工業大学大学院社会理工学研究科 カリフォルニア大学サンディエゴ校環太平洋大学院大学 December 10th 2011

Upload: hilo-yamamoto

Post on 11-Jul-2015

390 views

Category:

Travel


0 download

TRANSCRIPT

Page 1: Ch2011slide01

じんもんこんシンポジウム 2011 1

「山吹」をめぐる和歌語彙の空間

山 元 啓 史東京工業大学大学院社会理工学研究科

カリフォルニア大学サンディエゴ校環太平洋大学院大学

December 10th 2011

Page 2: Ch2011slide01

じんもんこんシンポジウム 2011 2

本論の主旨(1)

歌ことばの特徴は何か?

専門家に聞いてみる

「○○の特徴は何か?」

答えられない or

歌ことば辞典に記述なし

Page 3: Ch2011slide01

じんもんこんシンポジウム 2011 3

本論の主旨(2)

専門家が指摘しない語の意味、

その理由は?

↓1. そういうものは重要でない。2. 常識であって記述するほどのものではない。3. そういうものを本当に知らない。4. 言われればそうだが、思いつかなかった。

Page 4: Ch2011slide01

じんもんこんシンポジウム 2011 4

本論の主旨(3)

専門家でも指摘できない語

計算手続きで指摘する

辞書開発に役立てる

(関係の記述)

Page 5: Ch2011slide01

じんもんこんシンポジウム 2011 5

「山吹」をめぐって

八代集での「山吹」の出現頻度

勅撰集名 頻度古今集 6後撰集 4拾遺集 6後拾遺集 6金葉集 5詞花集 3千載集 7新古今集 7

計 44

Page 6: Ch2011slide01

じんもんこんシンポジウム 2011 6

厚見王、万葉集1435

蝦鳴く

甘南備河に

かげ見えて

今か咲くらむ 

山吹の花

Page 7: Ch2011slide01

じんもんこんシンポジウム 2011 7

厚見王、万葉集1435

蝦鳴く

甘南備河に

かげ見えて

今か咲くらむ 

山吹の花

Page 8: Ch2011slide01

じんもんこんシンポジウム 2011 8

芭蕉

古池や

蛙飛びこむ

水の音

Page 9: Ch2011slide01

じんもんこんシンポジウム 2011 9

芭蕉

山吹や

蛙飛びこむ

水の音

Page 10: Ch2011slide01

じんもんこんシンポジウム 2011 10

歌川広重「山吹に蛙」

Page 11: Ch2011slide01

じんもんこんシンポジウム 2011 11

本論の目的

計算手続きによる

「山吹」をめぐる

語彙の空間の検討

Page 12: Ch2011slide01

じんもんこんシンポジウム 2011 12

インターネットのネットワーク構造

M. E. J. Newman 2003 The Structure and Function of Complex Networks SIAM Review p. 170

Page 13: Ch2011slide01

じんもんこんシンポジウム 2011 13

古今集の春歌と秋歌の空間

� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

� � � �4

� �7� 10� � 6

�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7

. �/ 70 1 82 % 6

3 %10

45 . 34 624 761824

988: ; 137. < 6 8

!13

7= 10 > ? @ A B %5C 10 D13

E 20

F G27

H I10

J 30K .611H L 10M ' 5

N %9

6 O � P6

12

8

Q RS 12

T UV W10

X Y �23 Z [

10

\ ]10

^ _47 ` a b

10

c '7

d e7f 10g � 10

h i j � %8

31k l 27

m no6

O p %5

14

q6 r s t a - u %5

10

v Uw6

x6

Z y z { Z5

4 | U 5 } ~ %5V R �7

�9 � ~ a )9

� �4

c ) 2 -4

4

� D \ �7

�8 17 � B %

9

� b5

62

6

�36

� � �10� � 7

5

�36 � �8

11

10

6

7

8

� 6 4

4

5

� �8

7

5

L � 4

5� � ~ %4 � p % 4

30

64

27

31

�31� �28

H � � ~ %11 � � � \9

� � �12

14

8

� 89

4

5 55u � p % 7

  % 7 ¡ ¢5

£ p %7¤ � 9 ¥ ¦9

L U9

10

18

6

144 § �5

¨ a © %5¡ � P 7ª % 7

Z« ¬ 16

16

5

­ ® 10

10

89

23

6

1942

¯ 88° % 5

9

± � ² 6

10

9 ³ ´10

7

� µ ¶ %7

· ¸ 4

4

3

18

¹ � %7

30

50

� p %7

6

9 º6» 7

� ¼ P 6

5

½ � 7

¾ ¿ À ~ %5

4Á Â 70

- Ã Ä3

] � 12

' � Å p %11

7

Æ9

� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

��8� � 6 � � 5� � �8

10

9

�54� 16 � � � 5� 9! 15

7

4

7 " #4

6

$116

% �26

& '19

( ) * 8

+10, -

7. �8/ 0 1 92 - 3

36 4

85 7

6 7 8 95: ; < = 5 > ?7

@A � 23B � C 9 D12

E F 10

99 G �8

H9

I J � K F6L M 9

� 9 6N O P 8

Q R S T U 86

8

7

M V4 W �

6

6

5

5

76X Y 8

Z 6

[ \ ] ^4 _7

`a9 b S 97

c d 8e f g �

7

h � i � j �4k 8

9

l m j �8

6

n o 6

6

5

p B5

4

qr s10 t f : �6

/ u12

97

21

11

5

11 v w18

10

48

9

86

4

x y z10

9

{ f15| } 65e f n m 12 ~ �10

� � m( � 8� � 7 �919

10

9

� 911 � }38

� � �7

7� � � 210� � 19

� � 10 � 20

�� �8

�13

�� f � � �10

9

8

5

4

� � S �10 � �14

� �6

34

8

�15 �  

10

20

¡8

¢49

£ 2 o8

¤ ¥8 ¦   9

6

8

8

§ 5

6¨ 10 ©9

J 9

10

10ª « 27

10 ¬ B 7

19

­® � � 8

R ­11

5

6

9

10�28

6

¯10 ° U5

± �8 ² >8

� ³e f � ´ 8e � S µ8

10

¶ d 7

9

7

· ¸11

7

7¹ � º d » �6

¼ ½ B12¾

6 ¿6

5

À Á Â =8

6 Ã � �8

188

20

27

� 8Ä 8 7

18 Å 20{ f Æ Ç 6

6

9 È15

10

50

44

28

14 É42 Ê 7 Ë * 10

Ì 7Í ¹ �6

Î Ï8 Ã ; Ð B9

8

'9

Ñ �4

4

` g � 4

.   9

8

8l � 7

8

Ò Ó 77

Ô W18

Õ 7

Ö   18

× B9

9

8¤ 9

Ø % Ç Ù Ú4 10

7

Û 9

� ; Ü Ý 4

Þ � 5

ß   17

N h9

� � 99

à j �8

9

N O N O4

5

4

º j Ç5

7

8

7

Page 14: Ch2011slide01

じんもんこんシンポジウム 2011 14

グラフによる分析

• 共出現パターンとグラフ理論

雪/の/ 内/に / 春/は/ 来/ に/ けり/ 鴬/の/ 凍れ/ る/ 涙/ 今/や/ 解く/ らむ

• 共出現パターンの重み付け計算

Page 15: Ch2011slide01

じんもんこんシンポジウム 2011 15

グラフによる分析

• 共出現パターンとグラフ理論

• 共出現パターンの重み付け計算

Page 16: Ch2011slide01

じんもんこんシンポジウム 2011 16

グラフによる分析

• 共出現パターンとグラフ理論

• 共出現パターンの重み付け計算

w(t, d) = (1+log tf(t, d)) · idf(t) (1)

cw(t1, t2, d) = (1+log ctf(t1, t2, d)) · cidf(t1, t2) (2)

cidf(t1, t2) =√

idf(t1) · idf(t2) (3)

idf(t) = logN

df(t)(4)

(1)...Manning, 1999(4)...Sparck Jones, 1972

Page 17: Ch2011slide01

じんもんこんシンポジウム 2011 17

こういうモデルを作って分析する

鴬-CT-23-229-3.73-15 時鳥-CT-40-370-3.27-16

毎朝

野辺8

鴬17

6

10

青柳

4

挿頭す

4

縫う 6春

88

10

立田

10

35

花 138

とまる

15

折る

22

泣く

29

鳴く145

まだ

30

8

時鳥

39

一声

8

五月

42

音羽

20

声174

110261

鳴き声

21

五月雨

14

聞く

69

聞える

37

去年

10

あやめ草

7

梢9

12

20

20

11

今朝

29

9

19

越える10

惜しむ

10

木高い

4

10

近く 6

6226

条理

8

6

案内

誘い出す4

9

送る

4

別れ

7

4

7

2010

春霞

9

立つ

10

夏山

11

ふりしぼる

6

10

56

23

44

山時鳥

9

隠れる

76

10

散る

52

10

触れる

10

10

添える

5

羽ばたく6

6

借りる

19

何時の間に

9

梢高い

7

7

はるか

5

Page 18: Ch2011slide01

じんもんこんシンポジウム 2011 18

方法:材料

• 国文学研究資料館開発正保版本「二十一代集」

• 長歌を除く 9484首の和歌テキスト

(シソーラスの作成はすべての和歌に対して)

• kh で単位分割 (短単位)し、

• 異形同語 (立田/竜田/龍田)の問題→ t2c でシソーラスコードをつける。

• 八代集シソーラスの開発→分類語彙表を利用

• 一般語 (48732)、地名 (1408)、人名 (49)

Page 19: Ch2011slide01

じんもんこんシンポジウム 2011 19

結果

Page 20: Ch2011slide01

じんもんこんシンポジウム 2011 20

蛙から見てみる

蛙 (15/15/15, 6.45) cw > 2.50 K:1-8 U:1 L:0.00 M:7 Z:1.00

山吹蛙10

井手

4

鳴く

9

移ろふ

3

神無備川

1

花 7

5

10

集く

1

閉づ1

漁る

1

3

1

流石に

1

忍ぶ

2

1

浮葉

1水錆

1

1

1

11

1

1

11

1

11

井戸1

11

3

都人

1

11

諸声1

1

浮草

1

騒ぐ

1

1

1

1

11

1

1

沼水

1

1

1

盛る1

1

7

3

小田

1

1

里人

1

1

沢水1

隠れ沼1

1

九重

1

1

1

Page 21: Ch2011slide01

じんもんこんシンポジウム 2011 21

蛙から見てみるpruning

蛙 (15/15/15, 6.45) cw > 2.50 K:1-8 U:1 L:0.00 M:7 Z:1.00

山吹

井手

4鳴く9

移ろふ3 神無備川

1

花7

菱浮葉1

水錆

1

閉づ

1

漁る

1 11

1

11

1

井戸

1

1

都人

1

1

3

諸声

集く

1

浮草

1

騒ぐ1

1

1

1

1

沼水

1 宜

1

盛る

1

1

1

小田

流石に

1

里人

1

隠れ沼 1

九重

1

1

Page 22: Ch2011slide01

じんもんこんシンポジウム 2011 22

山吹から見てみるpruning

蛙井手八重...HUB

山吹 (44/44/44, 5.37) cw > 2.50 K:1-8 U:1 L:0.00 M:7 Z:1.00

井手4

鳴く

9

移ろふ

3

神無備川

1

単衣

八重

4

2

九重3

十重

1

咲く

6

七重

1

重ぬ

2

河水2

梔子

1

1

井戸

1

1 里人

1

2

河浪

2

花色衣

1

1

答ふ

1

許す

1

盛りなり

21

都人

11

1

吉野

4

盛る

2

1

怪し

1

4

4

花7

10

夫1

1

1

3幾重

1

1

2

岩根

清滝河1

沼水

1

1

小島 崎1

添ふ

2

3

玉河

1

飼ふ

1

11

沢水

1

一つ

1

2

散る

3

2

Page 23: Ch2011slide01

じんもんこんシンポジウム 2011 23

「八重」と「山吹」の関係

• 「八重」を検索してみる「八重(やへ)」「八重葎(やへむぐら)」

「八重桜(やへざくら)」「八重雲(やへくも)」

「八重菊(やへぎく)」

• 「八重山吹」– 「山吹」の花には2種類:一重のものと八重のもの

– この解説は歌ことば関連の辞典には見られない

Page 24: Ch2011slide01

じんもんこんシンポジウム 2011 24

「八重山吹」の実態

• モデルから探してみる。

八重さける

かひこそなけれ

山吹の

ちらはひとへも

あらしとおもへは

詞花集 46番 読人不知

Page 25: Ch2011slide01

じんもんこんシンポジウム 2011 25

おわりに

• 「山吹」とともに詠まれる語彙の検討

• 辞典類:「山吹」と「八重」の関連性

→述べられていない。

• モデル:「山吹」と「蛙」「井手」「八重」の関係

→示された。そして「八重山吹」であることも...

• 外在的基準の利用

• 辞典などの見出し語の検討

• モデルによる言語記述の有効性