sciencecafe02

65
神戸サイエンスカフェ 2008/03/24 1 目で見てわかる歌ことばの姿 山元 啓史 Hilofumi Yamamoto, Ph.D. 2008 3 24 日 神戸花鳥園

Upload: hilo-yamamoto

Post on 13-Jul-2015

99 views

Category:

Technology


0 download

TRANSCRIPT

神戸サイエンスカフェ 2008/03/24 1

目で見てわかる歌ことばの姿

山元 啓史

Hilofumi Yamamoto, Ph.D.

2008年 3月 24日 神戸花鳥園

神戸サイエンスカフェ 2008/03/24 2

古今集「春」のモデル

� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

� � � �4

� �7� 10� � 6

�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7

. �/ 70 1 82 % 6

3 %10

45 . 34 624 761824

988: ; 137. < 6 8

!13

7= 10 > ? @ A B %5C 10 D13

E 20

F G27

H I10

J 30K .611H L 10M ' 5

N %9

6 O � P6

12

8

Q RS 12

T UV W10

X Y �23 Z [

10

\ ]10

^ _47 ` a b

10

c '7

d e7f 10g � 10

h i j � %8

31k l 27

m no6

O p %5

14

q6 r s t a - u %5

10

v Uw6

x6

Z y z { Z5

4 | U 5 } ~ %5V R �7

�9 � ~ a )9

� �4

c ) 2 -4

4

� D \ �7

�8 17 � B %

9

� b5

62

6

�36

� � �10� � 7

5

�36 � �8

11

10

6

7

8

� 6 4

4

5

� �8

7

5

L � 4

5� � ~ %4 � p % 4

30

64

27

31

�31� �28

H � � ~ %11 � � � \9

� � �12

14

8

� 89

4

5 55u � p % 7

  % 7 ¡ ¢5

£ p %7¤ � 9 ¥ ¦9

L U9

10

18

6

144 § �5

¨ a © %5¡ � P 7ª % 7

Z« ¬ 16

16

5

­ ® 10

10

89

23

6

1942

¯ 88° % 5

9

± � ² 6

10

9 ³ ´10

7

� µ ¶ %7

· ¸ 4

4

3

18

¹ � %7

30

50

� p %7

6

9 º6» 7

� ¼ P 6

5

½ � 7

¾ ¿ À ~ %5

4Á Â 70

- Ã Ä3

] � 12

' � Å p %11

7

Æ9

神戸サイエンスカフェ 2008/03/24 2-1

まず、最初に古今和歌集データによる春と秋のネットワークモデルを提示する。ネットワークがどんな形をしているのか、どんな部品でできているのか、だいたいのイメージを掴む。

神戸サイエンスカフェ 2008/03/24 3

古今集「春」のモデル

� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

� � � �4

� �7� 10� � 6

�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7

. �/ 70 1 82 % 6

3 %10

45 . 34 624 761824

988: ; 137. < 6 8

!13

7= 10 > ? @ A B %5C 10 D13

E 20

F G27

H I10

J 30K .611H L 10M ' 5

N %9

6 O � P6

12

8

Q RS 12

T UV W10

X Y �23 Z [

10

\ ]10

^ _47 ` a b

10

c '7

d e7f 10g � 10

h i j � %8

31k l 27

m no6

O p %5

14

q6 r s t a - u %5

10

v Uw6

x6

Z y z { Z5

4 | U 5 } ~ %5V R �7

�9 � ~ a )9

� �4

c ) 2 -4

4

� D \ �7

�8 17 � B %

9

� b5

62

6

�36

� � �10� � 7

5

�36 � �8

11

10

6

7

8

� 6 4

4

5

� �8

7

5

L � 4

5� � ~ %4 � p % 4

30

64

27

31

�31� �28

H � � ~ %11 � � � \9

� � �12

14

8

� 89

4

5 55u � p % 7

  % 7 ¡ ¢5

£ p %7¤ � 9 ¥ ¦9

L U9

10

18

6

144 § �5

¨ a © %5¡ � P 7ª % 7

Z« ¬ 16

16

5

­ ® 10

10

89

23

6

1942

¯ 88° % 5

9

± � ² 6

10

9 ³ ´10

7

� µ ¶ %7

· ¸ 4

4

3

18

¹ � %7

30

50

� p %7

6

9 º6» 7

� ¼ P 6

5

½ � 7

¾ ¿ À ~ %5

4Á Â 70

- Ã Ä3

] � 12

' � Å p %11

7

Æ9

� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

� � � �4

� �7� 10� � 6

�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7

. �/ 70 1 82 % 6

3 %10

45 . 34 624 761824

988: ; 137. < 6 8

!13

7= 10 > ? @ A B %5C 10 D13

E 20

F G27

H I10

J 30K .611H L 10M ' 5

N %9

6 O � P6

12

8

Q RS 12

T UV W10

X Y �23 Z [

10

\ ]10

^ _47 ` a b

10

c '7

d e7f 10g � 10

h i j � %8

31k l 27

m no6

O p %5

14

q6 r s t a - u %5

10

v Uw6

x6

Z y z { Z5

4 | U 5 } ~ %5V R �7

�9 � ~ a )9

� �4

c ) 2 -4

4

� D \ �7

�8 17 � B %

9

� b5

62

6

�36

� � �10� � 7

5

�36 � �8

11

10

6

7

8

� 6 4

4

5

� �8

7

5

L � 4

5� � ~ %4 � p % 4

30

64

27

31

�31� �28

H � � ~ %11 � � � \9

� � �12

14

8

� 89

4

5 55u � p % 7

  % 7 ¡ ¢5

£ p %7¤ � 9 ¥ ¦9

L U9

10

18

6

144 § �5

¨ a © %5¡ � P 7ª % 7

Z« ¬ 16

16

5

­ ® 10

10

89

23

6

1942

¯ 88° % 5

9

± � ² 6

10

9 ³ ´10

7

� µ ¶ %7

· ¸ 4

4

3

18

¹ � %7

30

50

� p %7

6

9 º6» 7

� ¼ P 6

5

½ � 7

¾ ¿ À ~ %5

4Á Â 70

- Ã Ä3

] � 12

' � Å p %11

7

Æ9

神戸サイエンスカフェ 2008/03/24 4

古今集「秋」のモデル

� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

��8� � 6 � � 5� � �8

10

9

�54� 16 � � � 5� 9! 15

7

4

7 " #4

6

$116

% �26

& '19

( ) * 8

+10, -

7. �8/ 0 1 92 - 3

36 4

85 7

6 7 8 95: ; < = 5 > ?7

@A � 23B � C 9 D12

E F 10

99 G �8

H9

I J � K F6L M 9

� 9 6N O P 8

Q R S T U 86

8

7

M V4 W �

6

6

5

5

76X Y 8

Z 6

[ \ ] ^4 _7

`a9 b S 97

c d 8e f g �

7

h � i � j �4k 8

9

l m j �8

6

n o 6

6

5

p B5

4

qr s10 t f : �6

/ u12

97

21

11

5

11 v w18

10

48

9

86

4

x y z10

9

{ f15| } 65e f n m 12 ~ �10

� � m( � 8� � 7 �919

10

9

� 911 � }38

� � �7

7� � � 210� � 19

� � 10 � 20

�� �8

�13

�� f � � �10

9

8

5

4

� � S �10 � �14

� �6

34

8

�15 �  

10

20

¡8

¢49

£ 2 o8

¤ ¥8 ¦   9

6

8

8

§ 5

6¨ 10 ©9

J 9

10

10ª « 27

10 ¬ B 7

19

­® � � 8

R ­11

5

6

9

10�28

6

¯10 ° U5

± �8 ² >8

� ³e f � ´ 8e � S µ8

10

¶ d 7

9

7

· ¸11

7

7¹ � º d » �6

¼ ½ B12¾

6 ¿6

5

À Á Â =8

6 Ã � �8

188

20

27

� 8Ä 8 7

18 Å 20{ f Æ Ç 6

6

9 È15

10

50

44

28

14 É42 Ê 7 Ë * 10

Ì 7Í ¹ �6

Î Ï8 Ã ; Ð B9

8

'9

Ñ �4

4

` g � 4

.   9

8

8l � 7

8

Ò Ó 77

Ô W18

Õ 7

Ö   18

× B9

9

8¤ 9

Ø % Ç Ù Ú4 10

7

Û 9

� ; Ü Ý 4

Þ � 5

ß   17

N h9

� � 99

à j �8

9

N O N O4

5

4

º j Ç5

7

8

7

神戸サイエンスカフェ 2008/03/24 5

古今集「秋」のモデル

� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

��8� � 6 � � 5� � �8

10

9

�54� 16 � � � 5� 9! 15

7

4

7 " #4

6

$116

% �26

& '19

( ) * 8

+10, -

7. �8/ 0 1 92 - 3

36 4

85 7

6 7 8 95: ; < = 5 > ?7

@A � 23B � C 9 D12

E F 10

99 G �8

H9

I J � K F6L M 9

� 9 6N O P 8

Q R S T U 86

8

7

M V4 W �

6

6

5

5

76X Y 8

Z 6

[ \ ] ^4 _7

`a9 b S 97

c d 8e f g �

7

h � i � j �4k 8

9

l m j �8

6

n o 6

6

5

p B5

4

qr s10 t f : �6

/ u12

97

21

11

5

11 v w18

10

48

9

86

4

x y z10

9

{ f15| } 65e f n m 12 ~ �10

� � m( � 8� � 7 �919

10

9

� 911 � }38

� � �7

7� � � 210� � 19

� � 10 � 20

�� �8

�13

�� f � � �10

9

8

5

4

� � S �10 � �14

� �6

34

8

�15 �  

10

20

¡8

¢49

£ 2 o8

¤ ¥8 ¦   9

6

8

8

§ 5

6¨ 10 ©9

J 9

10

10ª « 27

10 ¬ B 7

19

­® � � 8

R ­11

5

6

9

10�28

6

¯10 ° U5

± �8 ² >8

� ³e f � ´ 8e � S µ8

10

¶ d 7

9

7

· ¸11

7

7¹ � º d » �6

¼ ½ B12¾

6 ¿6

5

À Á Â =8

6 Ã � �8

188

20

27

� 8Ä 8 7

18 Å 20{ f Æ Ç 6

6

9 È15

10

50

44

28

14 É42 Ê 7 Ë * 10

Ì 7Í ¹ �6

Î Ï8 Ã ; Ð B9

8

'9

Ñ �4

4

` g � 4

.   9

8

8l � 7

8

Ò Ó 77

Ô W18

Õ 7

Ö   18

× B9

9

8¤ 9

Ø % Ç Ù Ú4 10

7

Û 9

� ; Ü Ý 4

Þ � 5

ß   17

N h9

� � 99

à j �8

9

N O N O4

5

4

º j Ç5

7

8

7

� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)

��8� � 6 � � 5� � �8

10

9

�54� 16 � � � 5� 9! 15

7

4

7 " #4

6

$116

% �26

& '19

( ) * 8

+10, -

7. �8/ 0 1 92 - 3

36 4

85 7

6 7 8 95: ; < = 5 > ?7

@A � 23B � C 9 D12

E F 10

99 G �8

H9

I J � K F6L M 9

� 9 6N O P 8

Q R S T U 86

8

7

M V4 W �

6

6

5

5

76X Y 8

Z 6

[ \ ] ^4 _7

`a9 b S 97

c d 8e f g �

7

h � i � j �4k 8

9

l m j �8

6

n o 6

6

5

p B5

4

qr s10 t f : �6

/ u12

97

21

11

5

11 v w18

10

48

9

86

4

x y z10

9

{ f15| } 65e f n m 12 ~ �10

� � m( � 8� � 7 �919

10

9

� 911 � }38

� � �7

7� � � 210� � 19

� � 10 � 20

�� �8

�13

�� f � � �10

9

8

5

4

� � S �10 � �14

� �6

34

8

�15 �  

10

20

¡8

¢49

£ 2 o8

¤ ¥8 ¦   9

6

8

8

§ 5

6¨ 10 ©9

J 9

10

10ª « 27

10 ¬ B 7

19

­® � � 8

R ­11

5

6

9

10�28

6

¯10 ° U5

± �8 ² >8

� ³e f � ´ 8e � S µ8

10

¶ d 7

9

7

· ¸11

7

7¹ � º d » �6

¼ ½ B12¾

6 ¿6

5

À Á Â =8

6 Ã � �8

188

20

27

� 8Ä 8 7

18 Å 20{ f Æ Ç 6

6

9 È15

10

50

44

28

14 É42 Ê 7 Ë * 10

Ì 7Í ¹ �6

Î Ï8 Ã ; Ð B9

8

'9

Ñ �4

4

` g � 4

.   9

8

8l � 7

8

Ò Ó 77

Ô W18

Õ 7

Ö   18

× B9

9

8¤ 9

Ø % Ç Ù Ú4 10

7

Û 9

� ; Ü Ý 4

Þ � 5

ß   17

N h9

� � 99

à j �8

9

N O N O4

5

4

º j Ç5

7

8

7

神戸サイエンスカフェ 2008/03/24 6

はじめに

• モデル作りは語彙の意味研究として始められた。

• ことばの意味のむずかしさ– 本箱→下駄箱/ふでばこ/あみだな

– 「そこがみそだ」

– 「骨を呑み込む」→ learn the ropes

• 意味の変化– 頭が切れる(天才)/頭が切れる(怒り)

• あたたかい/つめたい/上品/下品→コノテーション

神戸サイエンスカフェ 2008/03/24 7

問題

• コノテーションとは何か。→ コノテーションは記述できるか。

→ 語の意味空間はどう記述できるか。

• 歌ことばのモデル化の方法

• 2つのモデルの違いはどうやって示すか。

神戸サイエンスカフェ 2008/03/24 8

コノテーションとは何か!

蛸たこ

octpus

神戸サイエンスカフェ 2008/03/24 9

コノテーションとは何か!

-

気持ち悪い

蛸たこ

octpus

神戸サイエンスカフェ 2008/03/24 10

コノテーションとは何か!

気持ち悪い

-

蛸たこ

octpus�

タコヤキ!おいしい!

神戸サイエンスカフェ 2008/03/24 11

コノテーションとは何か!

気持ち悪い

-

蛸たこ

octpus�

タコヤキ!おいしい!

コノテーションは受け手に依存する。 (Crystal, 1984: 18)

神戸サイエンスカフェ 2008/03/24 12

コノテーションを調べる

• favorable/unfavorable, bright/dark, .... (Osgood)

SD法によるイメージ分析

• 連想による意味の決定(Quillian)

鹿+鳴き声→妻恋ひ?

• 状況による意味の決定(Wittgenstein, Rieger)

Meaning is use. (e.g. コンピュータの画面)

• 語は語そのもので独立して意味を持たない(Lyons 1981)

→語彙の構造は、巨大な多次元の蜘蛛の巣の意味ネット

神戸サイエンスカフェ 2008/03/24 13

コノテーションの問題点

• コノテーションは、はっきり「…だ」と言い切れない。(Crystal, 1984)

• デノテーションとコノテーションの境界ははっきりしない。(Stede 1999)

• デノテーションとコノテーションは分けられない。(Voloshinov, 1973)

→文化を調査するのに重要であるが、研究として敬遠されてきている。(Goddard, 1998)

神戸サイエンスカフェ 2008/03/24 14

そこで!和歌でコノテーションを調べる

• 和歌(韻文)はコノテーションの宝庫!

• 元メッセージ(和歌テキスト)は31文字(定量)

• その現代語訳は文で完結...断定している。

神戸サイエンスカフェ 2008/03/24 15

古今集の現代語訳10種を使う

Schramnによる経験場の理論

歌人 詠む 歌 読む 和歌研究者

書く

読む

一般読者

分析・比較する

10世紀経験野

20世紀専門家の経験野

20世紀一般読者の経験野

R = CT − OP

神戸サイエンスカフェ 2008/03/24 16

アライメント: 和歌とその現代語訳

古今集 298—小町谷照彦 (1982)訳

歌 — —— — — — — — — —立田姫訳 (秋の末近くなって帰り道についた)龍田姫

歌 — — — — — — —手向ける— — 神のあれ ば こそ訳 (が道中の無事を願って)手 向け (をする)神があるからこそ

歌 秋の木の葉 [の]幣と — —散る— — — — らめ訳 秋の木の葉(が)幣(となって)散っ(ているのだろ) う

神戸サイエンスカフェ 2008/03/24 17

アライメントの実際

神戸サイエンスカフェ 2008/03/24 18

歌ことばのモデルをつくる

1. 歌・訳ともにあらかじめ単位切り

2. 単位すべての idf 値を計算

→ 以上をデータベースとして保存

3. キーワードを選ぶ→ 鶯、時鳥、梅、桜など

4. キーワードを含む歌とそれに対応する訳を抽出

5. 歌・訳ともに共出現パターンを作る

6. 共出現ウエイト (cw)を計算

7. cwの値にしたがってグラフ描画

神戸サイエンスカフェ 2008/03/24 19

グラフで可視化

現実

抽象化

神戸サイエンスカフェ 2008/03/24 20

グラフで可視化

現実

抽象化

John Maryhit

神戸サイエンスカフェ 2008/03/24 21

グラフで可視化

現実

抽象化

Sally

John Maryhit

let

精細化

神戸サイエンスカフェ 2008/03/24 22

共出現パターン

雪の内に春は来にけり鴬の凍れる涙今や解くらむ

2語ずつの組合せを和歌ごとに作る。

神戸サイエンスカフェ 2008/03/24 23

共出現ウエイト

w(t, d) = (1 + log tf(t, d)) idf(t)

cw(t1, t2, d) = (1 + log ctf(t1, t2, d))√

idf(t1) idf(t2)

idf(t) = logN

df(t)

神戸サイエンスカフェ 2008/03/24 24

Inverse Document Frequency の計算

Sparck Jones (1972)

idf(t) = logN

df(t)

idf(iru) = logN

df(iru)(1)

= log10000

4383(2)

= log 2.281542.. (3)

= 0.824614.. (4)

神戸サイエンスカフェ 2008/03/24 25

Inverse Document Frequency の計算

Sparck Jones (1972)

idf(t) = logN

df(t)

idf(uguisu) = logN

df(uguisu)(5)

= log10000

239(6)

= log 41.841.. (7)

= 3.733877.. (8)

神戸サイエンスカフェ 2008/03/24 26

和歌の共出現ウエイトと累積度数

0

100

200

300

400

500

600

700

800

2 4 6 8 10 12

the

num

ber

of c

o-oc

curr

ence

pat

tern

s

co-occurrence weight (cw)

warblercuckoo

plumcherry

神戸サイエンスカフェ 2008/03/24 27

現代語訳文の共出現ウエイトと累積度数

0

5000

10000

15000

20000

25000

5 10 15 20

the

num

ber

of c

o-oc

curr

ence

pat

tern

s

co-occurrence weight (cw)

warblercuckoo

plumcherry

神戸サイエンスカフェ 2008/03/24 28

鶯のhigh cwパターン

KEY CT BG-01-5620-02-130 鴬 23 229 3.73

cw ctf t1 idf tf t2 idf tf1 19.18 9 立田 8.52 10 春霞 4.23 92 18.71 56 梅 3.71 56 鴬 3.73 2293 18.62 10 鴬 3.73 229 立田 8.52 104 18.17 35 鴬 3.73 229 枝 4.26 355 17.98 145 鴬 3.73 229 鳴く 2.42 1526 17.72 6 笠 5.99 10 縫う 6.72 67 17.32 88 春 2.68 88 鴬 3.73 2298 17.00 62 声 2.94 62 鴬 3.73 2299 16.80 10 触れる 5.66 10 手 4.58 10

10 16.59 10 立田 8.52 10 立つ 2.96 11

神戸サイエンスカフェ 2008/03/24 29

鶯の low cwパターン

KEY CT BG-01-5620-02-130 鴬 23 229 3.73

cw ctf t1 idf tf t2 idf tf10962 1.56 1 私 1.33 50 ない 1.83 3510963 1.55 1 見る 1.67 11 思う 1.44 4310964 1.53 1 ゆく 2.07 8 する 1.13 7510965 1.52 1 私 1.33 50 人 1.75 2110966 1.49 1 見る 1.67 11 私 1.33 5010967 1.48 1 あの人 2.56 9 ある 0.86 3310968 1.48 1 よう 1.31 44 見る 1.67 1110969 1.37 1 する 1.13 75 見る 1.67 1110970 1.33 1 ある 0.86 33 心 2.07 1110971 1.20 1 見る 1.67 11 ある 0.86 33

神戸サイエンスカフェ 2008/03/24 30

和歌テキストによる「鶯」のモデル

Graphviz (Kamada-Kawai algorithm)による描画

鴬 (23/23,3.77): OP cw.>5.5;non-dist=off; idf=on(2)

鴬2

春9

物憂し

2

4

2

吹く

2

野辺

2

梅4

枝 2

花14

4

2

有り

3

立つ

2

匂ふ

2

2

来4

鳴く66

15

4

音3

3

2

2

2

果て

1

山里1

2

3

風3

2

2

折る

2

3

2

掛かる

1

来居る

1

未だ

1

9

2

3

散る

44

鳴き止む

1

1

掛く1

神戸サイエンスカフェ 2008/03/24 31

現代語訳テキストによる「鶯」のモデル

鴬 (23/229,3.73): CT cw.>15;non-dist=off; idf=on(2)

毎朝

野辺8

17

6

10

青柳

4

挿頭す4

縫う

6

春88

10

立田

10枝35

花138

とまる

15

折る

22

泣く

29

鳴く

145 まだ

30

近く

6

声62

案内

誘い出す

4

9

送る

4

4

香7

10

春霞

9

立つ10

梅10 56

23

隠れる

7

6

散る52

10

触れる

10

10

添える

5

神戸サイエンスカフェ 2008/03/24 32

ベン図: OP(歌) と CT(訳)

OP OP ∩ CT CT

神戸サイエンスカフェ 2008/03/24 33

論理積パターンの「鶯」のモデル

鴬 (23/229,3.73): OP-5.5-1; CT-15-2; (op(IS)ct)

鴬88

35

花138

折る22

鳴く

145

62

野辺

17梅

56

散る

52

神戸サイエンスカフェ 2008/03/24 34

論理積パターン取り除いた「鶯」のモデル

鴬 (23/229,3.73): OP-5.5-1; CT-15-2; (op(is)CT)

毎朝

野辺

8

6

青柳

4

鴬10

挿頭す

4

縫う 6

近く

6

案内

誘い出す

4

9

送る

4

10

立田

10

とまる

15

泣く

29

まだ

30

4

7

10春霞

9

立つ

10

10

枝23

隠れる

76

散る

10

触れる10 手10

添える

5

神戸サイエンスカフェ 2008/03/24 35

「鶯」と「時鳥」

神戸サイエンスカフェ 2008/03/24 36

「鶯」と「時鳥」の統合モデル

鴬-CT-23-229-3.73-15 時鳥-CT-40-370-3.27-16

毎朝

野辺8

鴬17

6

10

青柳

4

挿頭す

4

縫う 6春

88

10

立田

10

35

花 138

とまる

15

折る

22

泣く

29

鳴く145

まだ

30

8

時鳥

39

一声

8

五月

42

音羽

20

声174

110261

鳴き声

21

五月雨

14

聞く

69

聞える

37

去年

10

あやめ草

7

梢9

12

20

20

11

今朝

29

9

19

越える10

惜しむ

10

木高い

4

10

近く 6

6226

条理

8

6

案内

誘い出す4

9

送る

4

別れ

7

4

7

2010

春霞

9

立つ

10

夏山

11

ふりしぼる

6

10

56

23

44

山時鳥

9

隠れる

76

10

散る

52

10

触れる

10

10

添える

5

羽ばたく6

6

借りる

19

何時の間に

9

梢高い

7

7

はるか

5

神戸サイエンスカフェ 2008/03/24 37

描画上の問題点

• エッジの数が多いと結果の図示が困難なこと

• 重み (cw)の決め方に基準がないこと

(竹内・宇津木, 1988, 235)

神戸サイエンスカフェ 2008/03/24 38

ここまでのまとめ

• 歌ことばモデルと可視化

• 共出現ウエイト→低頻度語の取り込みと無意味語の排除

• モデルを演算操作→ merge, union, zoom in/out, subtract, pruning

• コノテーションの抽出

• 相対的な差の提示

• フラクタル

神戸サイエンスカフェ 2008/03/24 39

つぎの課題は?

• 固有名詞はむずかしい。→「なまえ」を言われても...

• 歌枕→ 和歌に読み込まれた地名のこと

→ 明石/奈良/京都/立田/吉野/あをによし

あをによしならのみやこは咲く花のにほふがごとく今盛りなり

(巻第 3, 雑歌 328, 太宰少弐小野老朝臣/をののおゆ)

神戸サイエンスカフェ 2008/03/24 40

立田と吉野

Yoshino

Tatsuta

「歌枕」とは

1. 土地の名称

2. 情緒/観念

神戸サイエンスカフェ 2008/03/24 41

立田と吉野のモデルを作る

が、しかし

地名は idf 値が大きいのが問題点

神戸サイエンスカフェ 2008/03/24 42

立田のモデル cw 25

立田 (12/116,8.52): CT cw.>25;non-dist=off; idf=on(2)

立田19

時雨

20

川76

神奈備

17

神戸サイエンスカフェ 2008/03/24 43

立田のモデル cw 24

立田 (12/116,8.52): CT cw.>24;non-dist=off; idf=on(2)

錦 立田19

時雨

20

76 紅葉46

16

神奈備

17御室

10

神戸サイエンスカフェ 2008/03/24 44

立田のモデル cw 22

立田 (12/116,8.52): CT cw.>22;non-dist=off; idf=on(2)

神代 立田9

横糸

8

竪糸

10

時雨20

42

76

河口

7

紅葉

46

織る

9

神無月

10

19 幣

16

渡る

16

流れる

26

手向ける10

神奈備17

御室

10

神戸サイエンスカフェ 2008/03/24 45

立田のモデル cw 20

立田 (12/116,8.52): CT cw.>20;non-dist=off; idf=on(2)

神代

立田9

手向け

7

横糸

8

竪糸

10

時雨

20

白波

10

42

76

河口

7

紅葉46

もみじ葉

8

越える

11

織る

9

括り染める

5

36

神無月

10

夜中5

神10

19幣

16

18

9

15

渡る 16 立つ27

流れる26

流す

8

手向ける

10

神奈備

17

御室

10

神戸サイエンスカフェ 2008/03/24 46

立田のモデル cw 18

立田 (12/116,8.52): CT cw.>18;non-dist=off; idf=on(2)

神代

立田9 竪糸10

織る

9

横糸

8

川76

手向け

7

絞り染め4

時雨

20

白波

10 山42

河口

7

紅葉46

もみじ葉

8

越える11

通り過ぎる5

散る

22

括り染める

5

安全 4

36

神無月

10

10

9

8

9

夜中

5 終り

5

上流

4

10

錦 19

10 幣

16

湊6

18

春霞

9

神奈備

17

17

御室7

9

15

10

渡る

16

立つ

27

流れる

26

流す

8

降る

12

遂げる4

手向ける10 8

毎年

7

10

神戸サイエンスカフェ 2008/03/24 47

立田のモデル cw 15

立田 (12/116,8.52): CT cw.>15;non-dist=off; idf=on(2)

神代

川9

立田9

神無月10

織る

9

横糸

8

神奈備17

河口

7

流れる

28

76

竪糸

109

絞り染め

48

時雨

20

白波

10

山42

7

紅葉

46

越える 11

通り過ぎる

5

括り染める

5

安全

4

これ

6

道中

3

一人

6

8

8

手向け

7

10

もみじ葉8

乱れ流れる

3

散る

22

聞く

10

吹く

9

この

22

その21

ひとり

4

36

10

10

10910

8

20

19

10

9

8

9

7

9

夜中

5

終り

5

上流

4

山口 3

神10

816

手向ける 9

5

4

88

20

1010

10

108

湊6

4

唐紅色

3

18

春霞

9

5

9

9

17

177

812

御室7

流す

6

毎年 5

26

8

7

15

木の葉

6

43

10渡る

17

16

立つ27

10

5

降る

12

切れる4

祈る4

遂げる

4

4

あの

10

4

不思議4

美しい9

10

10

9

神戸サイエンスカフェ 2008/03/24 48

Spoke Effect

立田 (12/116,8.52): CT cw.>13;non-dist=off; idf=on(2)

わけ 立田4 川76

竪糸

10 織る

9

白波10

越える

11

ひとり

4

手向け

7

供え物

2

絞り染め

4

横糸

8時雨

20紅葉

46

山42

河口

7もみじ葉

8

乱れ流れる

3

断ち切れる

2

通り過ぎる

5

聞く

10

括り染める

5

安全

4

これ6

事実2

帰り道

2

道中3

西

3

真ん中

2

一人

6

8

ちはやぶる

2

8

泊り

2

深紅

2

10

いる

50

かける

3

しまう12

掛けわたす

2

流し下す

2

散る

22

散り乱れる

3

つく

4

知る

7

吹く

9

つかさどる2

この22

その21

事実無根2

あのように

3

ない13

よう

20

早い

4

多い

3

さびしい

3

停泊

2

神代9

3

唐紅色 3

9

9

4

3

18 19

神無月

10

9

8

流す

8毎年

7神奈備

17

7

葉15

8

流れる

28

36

10

10

錦10

9

10

8

19 20

10

9

8

渡る

9

97

9

夜中5

5

5

4 沖

9

10

夜半

2終り

5

中途2

終着

2

上流4

山口

3

2

10

8

16 7

手向ける

9

女神

2

声 7

評判

3 旅

5

無き名

25

5

ささげる

2

2

44

8

8

20

1010

10412

1617

108

8

4

3

道4

66

4

4

8

5

7春霞

9

5

5

43

14

御室8

95

9

20

17177

8

12

7

降る

8

3

6

5

15

26 99

木の葉

6

5

1010

3 9

10

10

10

立つ

27

3

2

流れ着く

2

5

過ぎる

3

行く

13

12

12

9

散らす

3

切れる4

暮れる

3

鳴く

8

祈る4

9

5

45

する

36

遂げる

4

4

あの

10

不思議

44

あざやか

3美しい

9

神戸サイエンスカフェ 2008/03/24 49

Pruning/枝剪定

「立田」と関係を持つ枝を

すべて刈り取ってしまいます!

神戸サイエンスカフェ 2008/03/24 50

立田 (12/116,8.52): CT cw.>13;non-dist=off; idf=on(2); pruned 立田

神代

紅3

唐紅色

3

水9

9

19

神無月 10

織る

9

横糸

8

流す

8

毎年

7

神奈備

17

河口

7

葉15

もみじ葉

8

流れる

28

竪糸10

109

10

8

20

10

9

8

渡る9

9

7

時雨

9

夜中

白波

5

越える

5

ひとり

4

9

10

幣8

7

手向ける

9

手向け

5

5

供え物ささげる2

絞り染め

4

4

8

8

201010

10

上流

4

紅葉12

17

8

8

通り過ぎる

4

安全

3

6

4

4

5

雨 543

14

御室

8

5

9

山20

17 78 12

7

降る

8

3

65

99

木の葉5

10

9

3

10

乱れ流れる

3

断ち切れる

2

5

12

9

聞く

9

括り染める

5

4

5

祈る

4

不思議

4

風吹けば沖つ白波立田山夜半にや君が一人越ゆらむkks 994

神戸サイエンスカフェ 2008/03/24 51

立田 (12/116,8.52): CT cw.>13;non-dist=off; idf=on(2); pruned 立田

神代

紅3

唐紅色

3

水9

9

19

神無月 10

織る

9

横糸

8

流す

8

毎年

7

神奈備

17

河口

7

葉15

もみじ葉

8

流れる

28

竪糸10

109

10

8

20

10

9

8

渡る9

9

7

時雨

9

夜中

白波

5

越える

5

ひとり

4

9

10

幣8

7

手向ける

9

手向け

5

5

供え物ささげる2

絞り染め

4

4

8

8

201010

10

上流

4

紅葉12

17

8

8

通り過ぎる

4

安全

3

6

4

4

5

雨 543

14

御室

8

5

9

山20

17 78 12

7

降る

8

3

65

99

木の葉5

10

9

3

10

乱れ流れる

3

断ち切れる

2

5

12

9

聞く

9

括り染める

5

4

5

祈る

4

不思議

4

風吹けば沖つ白波立田山夜半にや君が一人越ゆらむkks 994

神戸サイエンスカフェ 2008/03/24 52

立田/川 (12/116,8.52): CT cw.>14.5;non-dist=off; idf=on(2); pruned 立田

神代水 9

9

神無月

10

織る

9横糸

8

神奈備

17

河口

7

流れる

28

竪糸10錦 10

9

10

8

20

10

9

8

9

7

時雨

9

8

手向ける

9

手向け

5

絞り染め

4

8

8

20

10

1010

8

8

17

7

8

紅葉12

御室

7

流す

6

毎年

5

9

43

渡る 17

10

9

通り過ぎる

5

降る

9

聞く

9

括り染める

4不思議

4

立田のモデル

神戸サイエンスカフェ 2008/03/24 53

立田/川 (12/116,8.52): CT cw.>14.5;non-dist=off; idf=on(2); pruned 立田

神代水 9

9

神無月

10

織る

9横糸

8

神奈備

17

河口

7

流れる

28

竪糸10錦 10

9

10

8

20

10

9

8

9

7

時雨

9

8

手向ける

9

手向け

5

絞り染め

4

8

8

20

10

1010

8

8

17

7

8

紅葉12

御室

7

流す

6

毎年

5

9

43

渡る 17

10

9

通り過ぎる

5

降る

9

聞く

9

括り染める

4不思議

4

立田のモデル

千早振る神代も聞かず立田川唐紅に水括るとは kks 294

神奈備の山を過ぎ行く秋なれば立田川にぞ幣は手向くる kks 300

神戸サイエンスカフェ 2008/03/24 54

立田/川 (12/116,8.52): CT cw.>14.5;non-dist=off; idf=on(2); pruned 立田

神代水 9

9

神無月

10

織る

9横糸

8

神奈備

17

河口

7

流れる

28

竪糸10錦 10

9

10

8

20

10

9

8

9

7

時雨

9

8

手向ける

9

手向け

5

絞り染め

4

8

8

20

10

1010

8

8

17

7

8

紅葉12

御室

7

流す

6

毎年

5

9

43

渡る 17

10

9

通り過ぎる

5

降る

9

聞く

9

括り染める

4不思議

4

立田のモデル

千早振る神代も聞かず立田川唐紅に水括るとは kks 294

神奈備の山を過ぎ行く秋なれば立田川にぞ幣は手向くる kks 300

神戸サイエンスカフェ 2008/03/24 55

吉野/川 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野

仲妹山4

8夫婦

3

流れ落ちる

3

水底

映る

5 影

8

7山吹8

男女

4

5

7

8

8

6

切り通す

4

烈しい

11

4

18たとえ

8

7

4

水13

14

15

10

9

10

22

29

激流

8

流れる26

思い初める6

高い

15

早い21

6

6

立てる 11

1516

9

4

11

短い

4

吉野川のモデル

神戸サイエンスカフェ 2008/03/24 56

吉野/川 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野

仲妹山4

8夫婦

3

流れ落ちる

3

水底

映る

5 影

8

7山吹8

男女

4

5

7

8

8

6

切り通す

4

烈しい

11

4

18たとえ

8

7

4

水13

14

15

10

9

10

22

29

激流

8

流れる26

思い初める6

高い

15

早い21

6

6

立てる 11

1516

9

4

11

短い

4

吉野川のモデル

流れては妹背の山の中に落つる吉野の川の縦しや世の中kks 828

神戸サイエンスカフェ 2008/03/24 57

吉野/川 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野

仲妹山4

8夫婦

3

流れ落ちる

3

水底

映る

5 影

8

7山吹8

男女

4

5

7

8

8

6

切り通す

4

烈しい

11

4

18たとえ

8

7

4

水13

14

15

10

9

10

22

29

激流

8

流れる26

思い初める6

高い

15

早い21

6

6

立てる 11

1516

9

4

11

短い

4

吉野川のモデル

流れては妹背の山の中に落つる吉野の川の縦しや世の中kks 828

吉野川岩波高く行く水の早くぞ人を思ひ初めてし貫之 kks 471

神戸サイエンスカフェ 2008/03/24 58

吉野/山 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野

近い

10

在明

月9

照る

4

その後

ふみ分ける

4

白雪

7

入る

6

山奥

3

一日

9

里9

隠れ所 向こう6

世の中

6

いや

4

雪10

山46

9

22

7降り積もる8

4

降る

10

夕方

10

積もる

奈良

5

降りしきる

7

5

ほしい

6

寒い 66

6

吉野山のモデル

神戸サイエンスカフェ 2008/03/24 59

吉野/山 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野

近い

10

在明

月9

照る

4

その後

ふみ分ける

4

白雪

7

入る

6

山奥

3

一日

9

里9

隠れ所 向こう6

世の中

6

いや

4

雪10

山46

9

22

7降り積もる8

4

降る

10

夕方

10

積もる

奈良

5

降りしきる

7

5

ほしい

6

寒い 66

6

吉野山のモデル

御吉野の山のあなたに宿もがな世の憂き時の隠れ家にせむよみ人知らず kks 950

神戸サイエンスカフェ 2008/03/24 60

立田と吉野

「立田と吉野」で共有するノードは?

神戸サイエンスカフェ 2008/03/24 61

立田と吉野

「立田と吉野」で共有するノードは?

ありませんでした!

神戸サイエンスカフェ 2008/03/24 62

まとめ1

• 共出現パターンによる歌語の視覚化

• クラスタによる意味の分類→沖つ白波

• 視覚化を通しての操作→ pruning

• コノテーションの表示→神の立田/世の吉野

• 相対的な違いの明示

• 時代別の意味の調査と比較→吉野の桜

神戸サイエンスカフェ 2008/03/24 63

まとめ2

• 八代集 (古今集から新古今集まで 300年間)で歌ことばを比較する。

• 時代別の意味の調査と比較→「吉野の桜」はいつごろからか?

• 共出現パターンは正規分布をする!→1シグマを以上で内容語だけになる。

神戸サイエンスカフェ 2008/03/24 64

どうもありがとうございました

• 歌ことば可視化システムhttp://etymology.jp/waka/poem.cgi

• お問い合わせEmail: [email protected]