sciencecafe02
TRANSCRIPT
神戸サイエンスカフェ 2008/03/24 2
古今集「春」のモデル
� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
� � � �4
� �7� 10� � 6
�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7
. �/ 70 1 82 % 6
3 %10
45 . 34 624 761824
988: ; 137. < 6 8
!13
7= 10 > ? @ A B %5C 10 D13
E 20
F G27
H I10
J 30K .611H L 10M ' 5
N %9
6 O � P6
12
8
Q RS 12
T UV W10
X Y �23 Z [
10
\ ]10
^ _47 ` a b
10
c '7
d e7f 10g � 10
h i j � %8
31k l 27
m no6
O p %5
14
q6 r s t a - u %5
10
v Uw6
x6
Z y z { Z5
4 | U 5 } ~ %5V R �7
�9 � ~ a )9
� �4
c ) 2 -4
4
� D \ �7
�8 17 � B %
9
� b5
62
6
�36
� � �10� � 7
5
�36 � �8
11
10
6
7
8
� 6 4
4
5
� �8
7
5
L � 4
5� � ~ %4 � p % 4
30
64
27
31
�31� �28
H � � ~ %11 � � � \9
� � �12
14
8
� 89
4
5 55u � p % 7
% 7 ¡ ¢5
£ p %7¤ � 9 ¥ ¦9
L U9
10
18
6
144 § �5
¨ a © %5¡ � P 7ª % 7
Z« ¬ 16
16
5
® 10
10
89
23
6
1942
¯ 88° % 5
9
± � ² 6
10
9 ³ ´10
7
� µ ¶ %7
· ¸ 4
4
3
18
¹ � %7
30
50
� p %7
6
9 º6» 7
� ¼ P 6
5
½ � 7
¾ ¿ À ~ %5
4Á Â 70
- Ã Ä3
] � 12
' � Å p %11
7
Æ9
神戸サイエンスカフェ 2008/03/24 2-1
まず、最初に古今和歌集データによる春と秋のネットワークモデルを提示する。ネットワークがどんな形をしているのか、どんな部品でできているのか、だいたいのイメージを掴む。
神戸サイエンスカフェ 2008/03/24 3
古今集「春」のモデル
� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
� � � �4
� �7� 10� � 6
�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7
. �/ 70 1 82 % 6
3 %10
45 . 34 624 761824
988: ; 137. < 6 8
!13
7= 10 > ? @ A B %5C 10 D13
E 20
F G27
H I10
J 30K .611H L 10M ' 5
N %9
6 O � P6
12
8
Q RS 12
T UV W10
X Y �23 Z [
10
\ ]10
^ _47 ` a b
10
c '7
d e7f 10g � 10
h i j � %8
31k l 27
m no6
O p %5
14
q6 r s t a - u %5
10
v Uw6
x6
Z y z { Z5
4 | U 5 } ~ %5V R �7
�9 � ~ a )9
� �4
c ) 2 -4
4
� D \ �7
�8 17 � B %
9
� b5
62
6
�36
� � �10� � 7
5
�36 � �8
11
10
6
7
8
� 6 4
4
5
� �8
7
5
L � 4
5� � ~ %4 � p % 4
30
64
27
31
�31� �28
H � � ~ %11 � � � \9
� � �12
14
8
� 89
4
5 55u � p % 7
% 7 ¡ ¢5
£ p %7¤ � 9 ¥ ¦9
L U9
10
18
6
144 § �5
¨ a © %5¡ � P 7ª % 7
Z« ¬ 16
16
5
® 10
10
89
23
6
1942
¯ 88° % 5
9
± � ² 6
10
9 ³ ´10
7
� µ ¶ %7
· ¸ 4
4
3
18
¹ � %7
30
50
� p %7
6
9 º6» 7
� ¼ P 6
5
½ � 7
¾ ¿ À ~ %5
4Á Â 70
- Ã Ä3
] � 12
' � Å p %11
7
Æ9
� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
� � � �4
� �7� 10� � 6
�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7
. �/ 70 1 82 % 6
3 %10
45 . 34 624 761824
988: ; 137. < 6 8
!13
7= 10 > ? @ A B %5C 10 D13
E 20
F G27
H I10
J 30K .611H L 10M ' 5
N %9
6 O � P6
12
8
Q RS 12
T UV W10
X Y �23 Z [
10
\ ]10
^ _47 ` a b
10
c '7
d e7f 10g � 10
h i j � %8
31k l 27
m no6
O p %5
14
q6 r s t a - u %5
10
v Uw6
x6
Z y z { Z5
4 | U 5 } ~ %5V R �7
�9 � ~ a )9
� �4
c ) 2 -4
4
� D \ �7
�8 17 � B %
9
� b5
62
6
�36
� � �10� � 7
5
�36 � �8
11
10
6
7
8
� 6 4
4
5
� �8
7
5
L � 4
5� � ~ %4 � p % 4
30
64
27
31
�31� �28
H � � ~ %11 � � � \9
� � �12
14
8
� 89
4
5 55u � p % 7
% 7 ¡ ¢5
£ p %7¤ � 9 ¥ ¦9
L U9
10
18
6
144 § �5
¨ a © %5¡ � P 7ª % 7
Z« ¬ 16
16
5
® 10
10
89
23
6
1942
¯ 88° % 5
9
± � ² 6
10
9 ³ ´10
7
� µ ¶ %7
· ¸ 4
4
3
18
¹ � %7
30
50
� p %7
6
9 º6» 7
� ¼ P 6
5
½ � 7
¾ ¿ À ~ %5
4Á Â 70
- Ã Ä3
] � 12
' � Å p %11
7
Æ9
神戸サイエンスカフェ 2008/03/24 4
古今集「秋」のモデル
� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
��8� � 6 � � 5� � �8
10
9
�54� 16 � � � 5� 9! 15
7
4
7 " #4
6
$116
% �26
& '19
( ) * 8
+10, -
7. �8/ 0 1 92 - 3
36 4
85 7
6 7 8 95: ; < = 5 > ?7
@A � 23B � C 9 D12
E F 10
99 G �8
H9
I J � K F6L M 9
� 9 6N O P 8
Q R S T U 86
8
7
M V4 W �
6
6
5
5
76X Y 8
Z 6
[ \ ] ^4 _7
`a9 b S 97
c d 8e f g �
7
h � i � j �4k 8
9
l m j �8
6
n o 6
6
5
p B5
4
qr s10 t f : �6
/ u12
97
21
11
5
11 v w18
10
48
9
86
4
x y z10
9
{ f15| } 65e f n m 12 ~ �10
� � m( � 8� � 7 �919
10
9
� 911 � }38
� � �7
7� � � 210� � 19
� � 10 � 20
�� �8
�13
�� f � � �10
9
8
5
4
� � S �10 � �14
� �6
34
8
�15 �
10
20
¡8
¢49
£ 2 o8
¤ ¥8 ¦ 9
6
8
8
§ 5
6¨ 10 ©9
J 9
10
10ª « 27
10 ¬ B 7
19
® � � 8
R 11
5
6
9
10�28
6
¯10 ° U5
± �8 ² >8
� ³e f � ´ 8e � S µ8
10
¶ d 7
9
7
· ¸11
7
7¹ � º d » �6
¼ ½ B12¾
6 ¿6
5
À Á Â =8
6 Ã � �8
188
20
27
� 8Ä 8 7
18 Å 20{ f Æ Ç 6
6
9 È15
10
50
44
28
14 É42 Ê 7 Ë * 10
Ì 7Í ¹ �6
Î Ï8 Ã ; Ð B9
8
'9
Ñ �4
4
` g � 4
. 9
8
8l � 7
8
Ò Ó 77
Ô W18
Õ 7
Ö 18
× B9
9
8¤ 9
Ø % Ç Ù Ú4 10
7
Û 9
� ; Ü Ý 4
Þ � 5
ß 17
N h9
� � 99
à j �8
9
N O N O4
5
4
º j Ç5
7
8
7
神戸サイエンスカフェ 2008/03/24 5
古今集「秋」のモデル
� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
��8� � 6 � � 5� � �8
10
9
�54� 16 � � � 5� 9! 15
7
4
7 " #4
6
$116
% �26
& '19
( ) * 8
+10, -
7. �8/ 0 1 92 - 3
36 4
85 7
6 7 8 95: ; < = 5 > ?7
@A � 23B � C 9 D12
E F 10
99 G �8
H9
I J � K F6L M 9
� 9 6N O P 8
Q R S T U 86
8
7
M V4 W �
6
6
5
5
76X Y 8
Z 6
[ \ ] ^4 _7
`a9 b S 97
c d 8e f g �
7
h � i � j �4k 8
9
l m j �8
6
n o 6
6
5
p B5
4
qr s10 t f : �6
/ u12
97
21
11
5
11 v w18
10
48
9
86
4
x y z10
9
{ f15| } 65e f n m 12 ~ �10
� � m( � 8� � 7 �919
10
9
� 911 � }38
� � �7
7� � � 210� � 19
� � 10 � 20
�� �8
�13
�� f � � �10
9
8
5
4
� � S �10 � �14
� �6
34
8
�15 �
10
20
¡8
¢49
£ 2 o8
¤ ¥8 ¦ 9
6
8
8
§ 5
6¨ 10 ©9
J 9
10
10ª « 27
10 ¬ B 7
19
® � � 8
R 11
5
6
9
10�28
6
¯10 ° U5
± �8 ² >8
� ³e f � ´ 8e � S µ8
10
¶ d 7
9
7
· ¸11
7
7¹ � º d » �6
¼ ½ B12¾
6 ¿6
5
À Á Â =8
6 Ã � �8
188
20
27
� 8Ä 8 7
18 Å 20{ f Æ Ç 6
6
9 È15
10
50
44
28
14 É42 Ê 7 Ë * 10
Ì 7Í ¹ �6
Î Ï8 Ã ; Ð B9
8
'9
Ñ �4
4
` g � 4
. 9
8
8l � 7
8
Ò Ó 77
Ô W18
Õ 7
Ö 18
× B9
9
8¤ 9
Ø % Ç Ù Ú4 10
7
Û 9
� ; Ü Ý 4
Þ � 5
ß 17
N h9
� � 99
à j �8
9
N O N O4
5
4
º j Ç5
7
8
7
� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
��8� � 6 � � 5� � �8
10
9
�54� 16 � � � 5� 9! 15
7
4
7 " #4
6
$116
% �26
& '19
( ) * 8
+10, -
7. �8/ 0 1 92 - 3
36 4
85 7
6 7 8 95: ; < = 5 > ?7
@A � 23B � C 9 D12
E F 10
99 G �8
H9
I J � K F6L M 9
� 9 6N O P 8
Q R S T U 86
8
7
M V4 W �
6
6
5
5
76X Y 8
Z 6
[ \ ] ^4 _7
`a9 b S 97
c d 8e f g �
7
h � i � j �4k 8
9
l m j �8
6
n o 6
6
5
p B5
4
qr s10 t f : �6
/ u12
97
21
11
5
11 v w18
10
48
9
86
4
x y z10
9
{ f15| } 65e f n m 12 ~ �10
� � m( � 8� � 7 �919
10
9
� 911 � }38
� � �7
7� � � 210� � 19
� � 10 � 20
�� �8
�13
�� f � � �10
9
8
5
4
� � S �10 � �14
� �6
34
8
�15 �
10
20
¡8
¢49
£ 2 o8
¤ ¥8 ¦ 9
6
8
8
§ 5
6¨ 10 ©9
J 9
10
10ª « 27
10 ¬ B 7
19
® � � 8
R 11
5
6
9
10�28
6
¯10 ° U5
± �8 ² >8
� ³e f � ´ 8e � S µ8
10
¶ d 7
9
7
· ¸11
7
7¹ � º d » �6
¼ ½ B12¾
6 ¿6
5
À Á Â =8
6 Ã � �8
188
20
27
� 8Ä 8 7
18 Å 20{ f Æ Ç 6
6
9 È15
10
50
44
28
14 É42 Ê 7 Ë * 10
Ì 7Í ¹ �6
Î Ï8 Ã ; Ð B9
8
'9
Ñ �4
4
` g � 4
. 9
8
8l � 7
8
Ò Ó 77
Ô W18
Õ 7
Ö 18
× B9
9
8¤ 9
Ø % Ç Ù Ú4 10
7
Û 9
� ; Ü Ý 4
Þ � 5
ß 17
N h9
� � 99
à j �8
9
N O N O4
5
4
º j Ç5
7
8
7
神戸サイエンスカフェ 2008/03/24 6
はじめに
• モデル作りは語彙の意味研究として始められた。
• ことばの意味のむずかしさ– 本箱→下駄箱/ふでばこ/あみだな
– 「そこがみそだ」
– 「骨を呑み込む」→ learn the ropes
• 意味の変化– 頭が切れる(天才)/頭が切れる(怒り)
• あたたかい/つめたい/上品/下品→コノテーション
神戸サイエンスカフェ 2008/03/24 7
問題
• コノテーションとは何か。→ コノテーションは記述できるか。
→ 語の意味空間はどう記述できるか。
• 歌ことばのモデル化の方法
• 2つのモデルの違いはどうやって示すか。
神戸サイエンスカフェ 2008/03/24 11
コノテーションとは何か!
気持ち悪い
-
蛸たこ
octpus�
タコヤキ!おいしい!
コノテーションは受け手に依存する。 (Crystal, 1984: 18)
神戸サイエンスカフェ 2008/03/24 12
コノテーションを調べる
• favorable/unfavorable, bright/dark, .... (Osgood)
SD法によるイメージ分析
• 連想による意味の決定(Quillian)
鹿+鳴き声→妻恋ひ?
• 状況による意味の決定(Wittgenstein, Rieger)
Meaning is use. (e.g. コンピュータの画面)
• 語は語そのもので独立して意味を持たない(Lyons 1981)
→語彙の構造は、巨大な多次元の蜘蛛の巣の意味ネット
神戸サイエンスカフェ 2008/03/24 13
コノテーションの問題点
• コノテーションは、はっきり「…だ」と言い切れない。(Crystal, 1984)
• デノテーションとコノテーションの境界ははっきりしない。(Stede 1999)
• デノテーションとコノテーションは分けられない。(Voloshinov, 1973)
→文化を調査するのに重要であるが、研究として敬遠されてきている。(Goddard, 1998)
神戸サイエンスカフェ 2008/03/24 14
そこで!和歌でコノテーションを調べる
• 和歌(韻文)はコノテーションの宝庫!
• 元メッセージ(和歌テキスト)は31文字(定量)
• その現代語訳は文で完結...断定している。
神戸サイエンスカフェ 2008/03/24 15
古今集の現代語訳10種を使う
Schramnによる経験場の理論
歌人 詠む 歌 読む 和歌研究者
書く
訳
読む
一般読者
分析・比較する
10世紀経験野
20世紀専門家の経験野
20世紀一般読者の経験野
R = CT − OP
神戸サイエンスカフェ 2008/03/24 16
アライメント: 和歌とその現代語訳
古今集 298—小町谷照彦 (1982)訳
歌 — —— — — — — — — —立田姫訳 (秋の末近くなって帰り道についた)龍田姫
歌 — — — — — — —手向ける— — 神のあれ ば こそ訳 (が道中の無事を願って)手 向け (をする)神があるからこそ
歌 秋の木の葉 [の]幣と — —散る— — — — らめ訳 秋の木の葉(が)幣(となって)散っ(ているのだろ) う
神戸サイエンスカフェ 2008/03/24 18
歌ことばのモデルをつくる
1. 歌・訳ともにあらかじめ単位切り
2. 単位すべての idf 値を計算
→ 以上をデータベースとして保存
3. キーワードを選ぶ→ 鶯、時鳥、梅、桜など
4. キーワードを含む歌とそれに対応する訳を抽出
5. 歌・訳ともに共出現パターンを作る
6. 共出現ウエイト (cw)を計算
7. cwの値にしたがってグラフ描画
神戸サイエンスカフェ 2008/03/24 23
共出現ウエイト
w(t, d) = (1 + log tf(t, d)) idf(t)
cw(t1, t2, d) = (1 + log ctf(t1, t2, d))√
idf(t1) idf(t2)
idf(t) = logN
df(t)
神戸サイエンスカフェ 2008/03/24 24
Inverse Document Frequency の計算
Sparck Jones (1972)
idf(t) = logN
df(t)
idf(iru) = logN
df(iru)(1)
= log10000
4383(2)
= log 2.281542.. (3)
= 0.824614.. (4)
神戸サイエンスカフェ 2008/03/24 25
Inverse Document Frequency の計算
Sparck Jones (1972)
idf(t) = logN
df(t)
idf(uguisu) = logN
df(uguisu)(5)
= log10000
239(6)
= log 41.841.. (7)
= 3.733877.. (8)
神戸サイエンスカフェ 2008/03/24 26
和歌の共出現ウエイトと累積度数
0
100
200
300
400
500
600
700
800
2 4 6 8 10 12
the
num
ber
of c
o-oc
curr
ence
pat
tern
s
co-occurrence weight (cw)
warblercuckoo
plumcherry
神戸サイエンスカフェ 2008/03/24 27
現代語訳文の共出現ウエイトと累積度数
0
5000
10000
15000
20000
25000
5 10 15 20
the
num
ber
of c
o-oc
curr
ence
pat
tern
s
co-occurrence weight (cw)
warblercuckoo
plumcherry
神戸サイエンスカフェ 2008/03/24 28
鶯のhigh cwパターン
KEY CT BG-01-5620-02-130 鴬 23 229 3.73
cw ctf t1 idf tf t2 idf tf1 19.18 9 立田 8.52 10 春霞 4.23 92 18.71 56 梅 3.71 56 鴬 3.73 2293 18.62 10 鴬 3.73 229 立田 8.52 104 18.17 35 鴬 3.73 229 枝 4.26 355 17.98 145 鴬 3.73 229 鳴く 2.42 1526 17.72 6 笠 5.99 10 縫う 6.72 67 17.32 88 春 2.68 88 鴬 3.73 2298 17.00 62 声 2.94 62 鴬 3.73 2299 16.80 10 触れる 5.66 10 手 4.58 10
10 16.59 10 立田 8.52 10 立つ 2.96 11
神戸サイエンスカフェ 2008/03/24 29
鶯の low cwパターン
KEY CT BG-01-5620-02-130 鴬 23 229 3.73
cw ctf t1 idf tf t2 idf tf10962 1.56 1 私 1.33 50 ない 1.83 3510963 1.55 1 見る 1.67 11 思う 1.44 4310964 1.53 1 ゆく 2.07 8 する 1.13 7510965 1.52 1 私 1.33 50 人 1.75 2110966 1.49 1 見る 1.67 11 私 1.33 5010967 1.48 1 あの人 2.56 9 ある 0.86 3310968 1.48 1 よう 1.31 44 見る 1.67 1110969 1.37 1 する 1.13 75 見る 1.67 1110970 1.33 1 ある 0.86 33 心 2.07 1110971 1.20 1 見る 1.67 11 ある 0.86 33
神戸サイエンスカフェ 2008/03/24 30
和歌テキストによる「鶯」のモデル
Graphviz (Kamada-Kawai algorithm)による描画
鴬 (23/23,3.77): OP cw.>5.5;non-dist=off; idf=on(2)
毎
鴬2
春9
物憂し
2
声
4
事
2
吹く
2
野辺
2
梅4
枝 2
花14
我
4
雪
2
有り
3
立つ
2
匂ふ
2
世
2
来4
鳴く66
15
4
音3
3
2
2
今
2
果て
1
山里1
2
3
風3
2
2
折る
2
3
2
掛かる
1
来居る
1
未だ
1
9
2
3
散る
44
鳴き止む
1
1
掛く1
神戸サイエンスカフェ 2008/03/24 31
現代語訳テキストによる「鶯」のモデル
鴬 (23/229,3.73): CT cw.>15;non-dist=off; idf=on(2)
毎朝
野辺8
鴬
17
老
笠
6
10
青柳
4
挿頭す4
縫う
6
春88
10
立田
10枝35
花138
とまる
15
折る
22
泣く
29
鳴く
145 まだ
30
近く
6
声62
案内
誘い出す
4
9
送る
4
4
香7
山
10
春霞
9
立つ10
梅10 56
23
隠れる
7
6
散る52
10
触れる
10
手
10
添える
5
神戸サイエンスカフェ 2008/03/24 33
論理積パターンの「鶯」のモデル
鴬 (23/229,3.73): OP-5.5-1; CT-15-2; (op(IS)ct)
春
鴬88
枝
35
花138
折る22
鳴く
145
声
62
野辺
17梅
56
散る
52
神戸サイエンスカフェ 2008/03/24 34
論理積パターン取り除いた「鶯」のモデル
鴬 (23/229,3.73): OP-5.5-1; CT-15-2; (op(is)CT)
毎朝
野辺
8
老
笠
6
青柳
4
鴬10
挿頭す
4
縫う 6
近く
6
案内
誘い出す
4
9
送る
4
10
立田
10
とまる
15
泣く
29
まだ
30
4
香
7
山
10春霞
9
立つ
10
梅
10
枝23
隠れる
76
散る
10
触れる10 手10
添える
5
神戸サイエンスカフェ 2008/03/24 36
「鶯」と「時鳥」の統合モデル
鴬-CT-23-229-3.73-15 時鳥-CT-40-370-3.27-16
毎朝
野辺8
鴬17
老
笠
6
10
青柳
4
挿頭す
4
縫う 6春
88
10
立田
10
枝
35
花 138
とまる
15
折る
22
泣く
29
鳴く145
まだ
30
夏
横
8
時鳥
39
一声
8
五月
42
音羽
20
声174
山
110261
鳴き声
21
五月雨
14
聞く
69
聞える
37
去年
10
あやめ草
7
梢9
12
20
20
11
今朝
29
9
19
越える10
惜しむ
10
木高い
4
10
近く 6
6226
条理
8
6
案内
誘い出す4
9
送る
4
別れ
7
4
香
7
2010
春霞
9
立つ
10
夏山
11
ふりしぼる
6
梅
10
56
23
44
山時鳥
9
隠れる
76
10
散る
52
10
触れる
10
手
10
添える
5
羽ばたく6
6
借りる
19
何時の間に
9
梢高い
7
7
はるか
5
神戸サイエンスカフェ 2008/03/24 38
ここまでのまとめ
• 歌ことばモデルと可視化
• 共出現ウエイト→低頻度語の取り込みと無意味語の排除
• モデルを演算操作→ merge, union, zoom in/out, subtract, pruning
• コノテーションの抽出
• 相対的な差の提示
• フラクタル
神戸サイエンスカフェ 2008/03/24 39
つぎの課題は?
• 固有名詞はむずかしい。→「なまえ」を言われても...
• 歌枕→ 和歌に読み込まれた地名のこと
→ 明石/奈良/京都/立田/吉野/あをによし
あをによしならのみやこは咲く花のにほふがごとく今盛りなり
(巻第 3, 雑歌 328, 太宰少弐小野老朝臣/をののおゆ)
神戸サイエンスカフェ 2008/03/24 42
立田のモデル cw 25
立田 (12/116,8.52): CT cw.>25;non-dist=off; idf=on(2)
錦
立田19
時雨
20
川76
神奈備
17
神戸サイエンスカフェ 2008/03/24 43
立田のモデル cw 24
立田 (12/116,8.52): CT cw.>24;non-dist=off; idf=on(2)
錦 立田19
時雨
20
川
76 紅葉46
幣
16
神奈備
17御室
10
神戸サイエンスカフェ 2008/03/24 44
立田のモデル cw 22
立田 (12/116,8.52): CT cw.>22;non-dist=off; idf=on(2)
神代 立田9
横糸
8
竪糸
10
時雨20
山
42
川
76
河口
7
紅葉
46
織る
9
神無月
10
錦
19 幣
16
渡る
16
流れる
26
手向ける10
神奈備17
御室
10
神戸サイエンスカフェ 2008/03/24 45
立田のモデル cw 20
立田 (12/116,8.52): CT cw.>20;non-dist=off; idf=on(2)
神代
立田9
手向け
7
横糸
8
竪糸
10
時雨
20
白波
10
山
42
川
76
河口
7
紅葉46
もみじ葉
8
越える
11
織る
9
括り染める
5
秋
36
神無月
10
夜中5
神10
錦
19幣
16
水
18
沖
9
葉
15
渡る 16 立つ27
流れる26
流す
8
手向ける
10
神奈備
17
御室
10
神戸サイエンスカフェ 2008/03/24 46
立田のモデル cw 18
立田 (12/116,8.52): CT cw.>18;non-dist=off; idf=on(2)
神代
立田9 竪糸10
織る
9
横糸
8
川76
手向け
7
絞り染め4
時雨
20
白波
10 山42
河口
7
紅葉46
もみじ葉
8
越える11
通り過ぎる5
散る
22
括り染める
5
安全 4
秋
36
神無月
10
10
9
8
9
夜中
5 終り
5
上流
4
神
10
錦 19
10 幣
16
湊6
水
18
春霞
9
神奈備
17
17
御室7
沖
9
葉
15
鴬
10
渡る
16
立つ
27
流れる
26
流す
8
降る
12
遂げる4
手向ける10 8
毎年
7
10
神戸サイエンスカフェ 2008/03/24 47
立田のモデル cw 15
立田 (12/116,8.52): CT cw.>15;non-dist=off; idf=on(2)
神代
川9
立田9
神無月10
織る
9
横糸
8
神奈備17
河口
7
流れる
28
76
竪糸
109
絞り染め
48
時雨
20
白波
10
山42
7
紅葉
46
越える 11
通り過ぎる
5
括り染める
5
安全
4
これ
6
道中
3
一人
6
誰
8
名
8
手向け
7
風
10
もみじ葉8
乱れ流れる
3
散る
22
聞く
10
吹く
9
この
22
その21
ひとり
4
秋
36
10
10
錦
10910
8
20
19
10
9
8
9
7
9
夜中
5
終り
5
上流
4
山口 3
神10
幣
816
手向ける 9
旅
5
4
88
20
1010
10
108
湊6
紅
4
唐紅色
3
水
18
春霞
9
雨
5
沖
9
9
17
177
812
御室7
流す
6
毎年 5
26
8
7
葉
15
木の葉
6
43
鴬
10渡る
17
16
立つ27
10
5
降る
12
切れる4
祈る4
遂げる
4
4
あの
10
4
不思議4
美しい9
10
10
9
神戸サイエンスカフェ 2008/03/24 48
Spoke Effect
立田 (12/116,8.52): CT cw.>13;non-dist=off; idf=on(2)
わけ 立田4 川76
竪糸
10 織る
9
白波10
越える
11
ひとり
4
手向け
7
供え物
2
絞り染め
4
横糸
8時雨
20紅葉
46
山42
河口
7もみじ葉
8
乱れ流れる
3
断ち切れる
2
通り過ぎる
5
聞く
10
括り染める
5
安全
4
これ6
事実2
帰り道
2
道中3
西
3
真ん中
2
一人
6
誰
8
ちはやぶる
2
名
8
泊り
2
深紅
2
風
10
いる
50
かける
3
しまう12
掛けわたす
2
流し下す
2
散る
22
散り乱れる
3
つく
4
知る
7
吹く
9
つかさどる2
この22
その21
事実無根2
あのように
3
ない13
よう
20
早い
4
多い
3
さびしい
3
停泊
2
神代9
紅
3
唐紅色 3
水
9
9
4
3
18 19
神無月
10
9
8
流す
8毎年
7神奈備
17
7
葉15
8
流れる
28
秋
36
10
10
錦10
9
10
8
19 20
10
9
8
渡る
9
97
9
夜中5
5
5
4 沖
9
10
夜半
2終り
5
中途2
終着
2
上流4
山口
3
姫
2
神
10
幣
8
16 7
手向ける
9
女神
2
声 7
評判
3 旅
5
無き名
25
5
ささげる
2
2
44
8
8
20
1010
10412
1617
108
8
4
3
道4
湊
66
4
4
8
5
7春霞
9
雨
5
5
43
14
御室8
95
9
20
17177
8
12
7
降る
8
3
6
5
15
26 99
木の葉
6
5
1010
3 9
10
花
10
鴬
10
立つ
27
3
2
流れ着く
2
5
過ぎる
3
行く
13
12
12
9
散らす
3
切れる4
暮れる
3
鳴く
8
祈る4
9
5
45
する
36
遂げる
4
4
あの
10
不思議
44
あざやか
3美しい
9
神戸サイエンスカフェ 2008/03/24 50
立田 (12/116,8.52): CT cw.>13;non-dist=off; idf=on(2); pruned 立田
神代
紅3
唐紅色
3
水9
川
9
19
神無月 10
織る
9
横糸
8
流す
8
毎年
7
神奈備
17
河口
7
葉15
もみじ葉
8
流れる
28
竪糸10
錦
109
10
8
20
10
9
8
渡る9
9
7
時雨
9
夜中
白波
5
越える
5
ひとり
4
沖
9
10
神
幣8
7
手向ける
9
手向け
5
5
供え物ささげる2
絞り染め
4
4
8
8
201010
10
上流
4
紅葉12
17
8
8
通り過ぎる
4
安全
3
湊
6
4
4
5
雨 543
14
御室
8
5
9
山20
17 78 12
7
降る
8
3
65
99
木の葉5
10
9
3
10
乱れ流れる
3
断ち切れる
2
5
12
9
聞く
9
括り染める
5
4
5
祈る
4
不思議
4
風吹けば沖つ白波立田山夜半にや君が一人越ゆらむkks 994
神戸サイエンスカフェ 2008/03/24 51
立田 (12/116,8.52): CT cw.>13;non-dist=off; idf=on(2); pruned 立田
神代
紅3
唐紅色
3
水9
川
9
19
神無月 10
織る
9
横糸
8
流す
8
毎年
7
神奈備
17
河口
7
葉15
もみじ葉
8
流れる
28
竪糸10
錦
109
10
8
20
10
9
8
渡る9
9
7
時雨
9
夜中
白波
5
越える
5
ひとり
4
沖
9
10
神
幣8
7
手向ける
9
手向け
5
5
供え物ささげる2
絞り染め
4
4
8
8
201010
10
上流
4
紅葉12
17
8
8
通り過ぎる
4
安全
3
湊
6
4
4
5
雨 543
14
御室
8
5
9
山20
17 78 12
7
降る
8
3
65
99
木の葉5
10
9
3
10
乱れ流れる
3
断ち切れる
2
5
12
9
聞く
9
括り染める
5
4
5
祈る
4
不思議
4
風吹けば沖つ白波立田山夜半にや君が一人越ゆらむkks 994
神戸サイエンスカフェ 2008/03/24 52
立田/川 (12/116,8.52): CT cw.>14.5;non-dist=off; idf=on(2); pruned 立田
神代水 9
川
9
神無月
10
織る
9横糸
8
神奈備
17
河口
7
流れる
28
竪糸10錦 10
9
10
8
20
10
9
8
9
7
時雨
9
神
幣
8
手向ける
9
手向け
5
絞り染め
4
8
8
20
10
1010
8
8
山
17
7
8
紅葉12
御室
7
流す
6
毎年
5
9
43
渡る 17
10
9
通り過ぎる
5
降る
9
聞く
9
括り染める
4不思議
4
立田のモデル
神戸サイエンスカフェ 2008/03/24 53
立田/川 (12/116,8.52): CT cw.>14.5;non-dist=off; idf=on(2); pruned 立田
神代水 9
川
9
神無月
10
織る
9横糸
8
神奈備
17
河口
7
流れる
28
竪糸10錦 10
9
10
8
20
10
9
8
9
7
時雨
9
神
幣
8
手向ける
9
手向け
5
絞り染め
4
8
8
20
10
1010
8
8
山
17
7
8
紅葉12
御室
7
流す
6
毎年
5
9
43
渡る 17
10
9
通り過ぎる
5
降る
9
聞く
9
括り染める
4不思議
4
立田のモデル
千早振る神代も聞かず立田川唐紅に水括るとは kks 294
神奈備の山を過ぎ行く秋なれば立田川にぞ幣は手向くる kks 300
神戸サイエンスカフェ 2008/03/24 54
立田/川 (12/116,8.52): CT cw.>14.5;non-dist=off; idf=on(2); pruned 立田
神代水 9
川
9
神無月
10
織る
9横糸
8
神奈備
17
河口
7
流れる
28
竪糸10錦 10
9
10
8
20
10
9
8
9
7
時雨
9
神
幣
8
手向ける
9
手向け
5
絞り染め
4
8
8
20
10
1010
8
8
山
17
7
8
紅葉12
御室
7
流す
6
毎年
5
9
43
渡る 17
10
9
通り過ぎる
5
降る
9
聞く
9
括り染める
4不思議
4
立田のモデル
千早振る神代も聞かず立田川唐紅に水括るとは kks 294
神奈備の山を過ぎ行く秋なれば立田川にぞ幣は手向くる kks 300
神戸サイエンスカフェ 2008/03/24 55
吉野/川 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野
仲妹山4
間
8夫婦
3
流れ落ちる
3
水底
映る
5 影
8
岸
7山吹8
男女
4
5
7
8
8
6
音
切り通す
4
烈しい
11
4
川
18たとえ
8
岩
7
4
水13
14
15
10
9
10
22
29
激流
8
流れる26
思い初める6
高い
15
早い21
6
6
立てる 11
1516
9
4
11
短い
4
吉野川のモデル
神戸サイエンスカフェ 2008/03/24 56
吉野/川 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野
仲妹山4
間
8夫婦
3
流れ落ちる
3
水底
映る
5 影
8
岸
7山吹8
男女
4
5
7
8
8
6
音
切り通す
4
烈しい
11
4
川
18たとえ
8
岩
7
4
水13
14
15
10
9
10
22
29
激流
8
流れる26
思い初める6
高い
15
早い21
6
6
立てる 11
1516
9
4
11
短い
4
吉野川のモデル
流れては妹背の山の中に落つる吉野の川の縦しや世の中kks 828
神戸サイエンスカフェ 2008/03/24 57
吉野/川 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野
仲妹山4
間
8夫婦
3
流れ落ちる
3
水底
映る
5 影
8
岸
7山吹8
男女
4
5
7
8
8
6
音
切り通す
4
烈しい
11
4
川
18たとえ
8
岩
7
4
水13
14
15
10
9
10
22
29
激流
8
流れる26
思い初める6
高い
15
早い21
6
6
立てる 11
1516
9
4
11
短い
4
吉野川のモデル
流れては妹背の山の中に落つる吉野の川の縦しや世の中kks 828
吉野川岩波高く行く水の早くぞ人を思ひ初めてし貫之 kks 471
神戸サイエンスカフェ 2008/03/24 58
吉野/山 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野
日
近い
10
在明
月9
照る
4
その後
ふみ分ける
4
白雪
7
入る
6
山奥
3
一日
9
里9
隠れ所 向こう6
世の中
6
いや
4
雪10
山46
9
22
7降り積もる8
4
降る
10
夕方
10
積もる
奈良
5
降りしきる
7
麓
5
ほしい
6
寒い 66
6
吉野山のモデル
神戸サイエンスカフェ 2008/03/24 59
吉野/山 (23/193,6.08): CT cw.>13.5;non-dist=off; idf=on(2); pruned 吉野,御吉野
日
近い
10
在明
月9
照る
4
その後
ふみ分ける
4
白雪
7
入る
6
山奥
3
一日
9
里9
隠れ所 向こう6
世の中
6
いや
4
雪10
山46
9
22
7降り積もる8
4
降る
10
夕方
10
積もる
奈良
5
降りしきる
7
麓
5
ほしい
6
寒い 66
6
吉野山のモデル
御吉野の山のあなたに宿もがな世の憂き時の隠れ家にせむよみ人知らず kks 950
神戸サイエンスカフェ 2008/03/24 62
まとめ1
• 共出現パターンによる歌語の視覚化
• クラスタによる意味の分類→沖つ白波
• 視覚化を通しての操作→ pruning
• コノテーションの表示→神の立田/世の吉野
• 相対的な違いの明示
• 時代別の意味の調査と比較→吉野の桜
神戸サイエンスカフェ 2008/03/24 63
まとめ2
• 八代集 (古今集から新古今集まで 300年間)で歌ことばを比較する。
• 時代別の意味の調査と比較→「吉野の桜」はいつごろからか?
• 共出現パターンは正規分布をする!→1シグマを以上で内容語だけになる。
神戸サイエンスカフェ 2008/03/24 64
どうもありがとうございました
• 歌ことば可視化システムhttp://etymology.jp/waka/poem.cgi
• お問い合わせEmail: [email protected]