ch2011slide01
TRANSCRIPT
じんもんこんシンポジウム 2011 1
「山吹」をめぐる和歌語彙の空間
山 元 啓 史東京工業大学大学院社会理工学研究科
カリフォルニア大学サンディエゴ校環太平洋大学院大学
December 10th 2011
じんもんこんシンポジウム 2011 2
本論の主旨(1)
歌ことばの特徴は何か?
↓
専門家に聞いてみる
「○○の特徴は何か?」
↓
答えられない or
歌ことば辞典に記述なし
じんもんこんシンポジウム 2011 3
本論の主旨(2)
専門家が指摘しない語の意味、
その理由は?
↓1. そういうものは重要でない。2. 常識であって記述するほどのものではない。3. そういうものを本当に知らない。4. 言われればそうだが、思いつかなかった。
じんもんこんシンポジウム 2011 4
本論の主旨(3)
専門家でも指摘できない語
↓
計算手続きで指摘する
↓
辞書開発に役立てる
(関係の記述)
じんもんこんシンポジウム 2011 5
「山吹」をめぐって
八代集での「山吹」の出現頻度
勅撰集名 頻度古今集 6後撰集 4拾遺集 6後拾遺集 6金葉集 5詞花集 3千載集 7新古今集 7
計 44
じんもんこんシンポジウム 2011 6
厚見王、万葉集1435
蝦鳴く
甘南備河に
かげ見えて
今か咲くらむ
山吹の花
じんもんこんシンポジウム 2011 7
厚見王、万葉集1435
蝦鳴く
甘南備河に
かげ見えて
今か咲くらむ
山吹の花
じんもんこんシンポジウム 2011 8
芭蕉
古池や
蛙飛びこむ
水の音
じんもんこんシンポジウム 2011 9
芭蕉
山吹や
蛙飛びこむ
水の音
じんもんこんシンポジウム 2011 10
歌川広重「山吹に蛙」
じんもんこんシンポジウム 2011 11
本論の目的
計算手続きによる
「山吹」をめぐる
語彙の空間の検討
じんもんこんシンポジウム 2011 12
インターネットのネットワーク構造
M. E. J. Newman 2003 The Structure and Function of Complex Networks SIAM Review p. 170
じんもんこんシンポジウム 2011 13
古今集の春歌と秋歌の空間
� � � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
� � � �4
� �7� 10� � 6
�� � 5 ! "5 # $ %8& '4 ( )7 * + , -7
. �/ 70 1 82 % 6
3 %10
45 . 34 624 761824
988: ; 137. < 6 8
!13
7= 10 > ? @ A B %5C 10 D13
E 20
F G27
H I10
J 30K .611H L 10M ' 5
N %9
6 O � P6
12
8
Q RS 12
T UV W10
X Y �23 Z [
10
\ ]10
^ _47 ` a b
10
c '7
d e7f 10g � 10
h i j � %8
31k l 27
m no6
O p %5
14
q6 r s t a - u %5
10
v Uw6
x6
Z y z { Z5
4 | U 5 } ~ %5V R �7
�9 � ~ a )9
� �4
c ) 2 -4
4
� D \ �7
�8 17 � B %
9
� b5
62
6
�36
� � �10� � 7
5
�36 � �8
11
10
6
7
8
� 6 4
4
5
� �8
7
5
L � 4
5� � ~ %4 � p % 4
30
64
27
31
�31� �28
H � � ~ %11 � � � \9
� � �12
14
8
� 89
4
5 55u � p % 7
% 7 ¡ ¢5
£ p %7¤ � 9 ¥ ¦9
L U9
10
18
6
144 § �5
¨ a © %5¡ � P 7ª % 7
Z« ¬ 16
16
5
® 10
10
89
23
6
1942
¯ 88° % 5
9
± � ² 6
10
9 ³ ´10
7
� µ ¶ %7
· ¸ 4
4
3
18
¹ � %7
30
50
� p %7
6
9 º6» 7
� ¼ P 6
5
½ � 7
¾ ¿ À ~ %5
4Á Â 70
- Ã Ä3
] � 12
' � Å p %11
7
Æ9
� � � � � � � � � � � � � � � � � � � �non-dist=off; idf=on(2)
��8� � 6 � � 5� � �8
10
9
�54� 16 � � � 5� 9! 15
7
4
7 " #4
6
$116
% �26
& '19
( ) * 8
+10, -
7. �8/ 0 1 92 - 3
36 4
85 7
6 7 8 95: ; < = 5 > ?7
@A � 23B � C 9 D12
E F 10
99 G �8
H9
I J � K F6L M 9
� 9 6N O P 8
Q R S T U 86
8
7
M V4 W �
6
6
5
5
76X Y 8
Z 6
[ \ ] ^4 _7
`a9 b S 97
c d 8e f g �
7
h � i � j �4k 8
9
l m j �8
6
n o 6
6
5
p B5
4
qr s10 t f : �6
/ u12
97
21
11
5
11 v w18
10
48
9
86
4
x y z10
9
{ f15| } 65e f n m 12 ~ �10
� � m( � 8� � 7 �919
10
9
� 911 � }38
� � �7
7� � � 210� � 19
� � 10 � 20
�� �8
�13
�� f � � �10
9
8
5
4
� � S �10 � �14
� �6
34
8
�15 �
10
20
¡8
¢49
£ 2 o8
¤ ¥8 ¦ 9
6
8
8
§ 5
6¨ 10 ©9
J 9
10
10ª « 27
10 ¬ B 7
19
® � � 8
R 11
5
6
9
10�28
6
¯10 ° U5
± �8 ² >8
� ³e f � ´ 8e � S µ8
10
¶ d 7
9
7
· ¸11
7
7¹ � º d » �6
¼ ½ B12¾
6 ¿6
5
À Á Â =8
6 Ã � �8
188
20
27
� 8Ä 8 7
18 Å 20{ f Æ Ç 6
6
9 È15
10
50
44
28
14 É42 Ê 7 Ë * 10
Ì 7Í ¹ �6
Î Ï8 Ã ; Ð B9
8
'9
Ñ �4
4
` g � 4
. 9
8
8l � 7
8
Ò Ó 77
Ô W18
Õ 7
Ö 18
× B9
9
8¤ 9
Ø % Ç Ù Ú4 10
7
Û 9
� ; Ü Ý 4
Þ � 5
ß 17
N h9
� � 99
à j �8
9
N O N O4
5
4
º j Ç5
7
8
7
じんもんこんシンポジウム 2011 14
グラフによる分析
• 共出現パターンとグラフ理論
雪/の/ 内/に / 春/は/ 来/ に/ けり/ 鴬/の/ 凍れ/ る/ 涙/ 今/や/ 解く/ らむ
• 共出現パターンの重み付け計算
じんもんこんシンポジウム 2011 15
グラフによる分析
• 共出現パターンとグラフ理論
• 共出現パターンの重み付け計算
じんもんこんシンポジウム 2011 16
グラフによる分析
• 共出現パターンとグラフ理論
• 共出現パターンの重み付け計算
w(t, d) = (1+log tf(t, d)) · idf(t) (1)
cw(t1, t2, d) = (1+log ctf(t1, t2, d)) · cidf(t1, t2) (2)
cidf(t1, t2) =√
idf(t1) · idf(t2) (3)
idf(t) = logN
df(t)(4)
(1)...Manning, 1999(4)...Sparck Jones, 1972
じんもんこんシンポジウム 2011 17
こういうモデルを作って分析する
鴬-CT-23-229-3.73-15 時鳥-CT-40-370-3.27-16
毎朝
野辺8
鴬17
老
笠
6
10
青柳
4
挿頭す
4
縫う 6春
88
10
立田
10
枝
35
花 138
とまる
15
折る
22
泣く
29
鳴く145
まだ
30
夏
横
8
時鳥
39
一声
8
五月
42
音羽
20
声174
山
110261
鳴き声
21
五月雨
14
聞く
69
聞える
37
去年
10
あやめ草
7
梢9
12
20
20
11
今朝
29
9
19
越える10
惜しむ
10
木高い
4
10
近く 6
6226
条理
8
6
案内
誘い出す4
9
送る
4
別れ
7
4
香
7
2010
春霞
9
立つ
10
夏山
11
ふりしぼる
6
梅
10
56
23
44
山時鳥
9
隠れる
76
10
散る
52
10
触れる
10
手
10
添える
5
羽ばたく6
6
借りる
19
何時の間に
9
梢高い
7
7
はるか
5
じんもんこんシンポジウム 2011 18
方法:材料
• 国文学研究資料館開発正保版本「二十一代集」
• 長歌を除く 9484首の和歌テキスト
(シソーラスの作成はすべての和歌に対して)
• kh で単位分割 (短単位)し、
• 異形同語 (立田/竜田/龍田)の問題→ t2c でシソーラスコードをつける。
• 八代集シソーラスの開発→分類語彙表を利用
• 一般語 (48732)、地名 (1408)、人名 (49)
じんもんこんシンポジウム 2011 19
結果
じんもんこんシンポジウム 2011 20
蛙から見てみる
蛙 (15/15/15, 6.45) cw > 2.50 K:1-8 U:1 L:0.00 M:7 Z:1.00
山吹蛙10
井手
4
鳴く
9
移ろふ
3
神無備川
1
花 7
5
10
集く
1
閉づ1
漁る
1
3
1
流石に
1
忍ぶ
2
菱
1
浮葉
1水錆
1
1
1
11
1
1
11
1
県
11
井戸1
11
3
都人
1
11
諸声1
1
浮草
1
騒ぐ
1
池
1
1
1
夫
11
1
1
沼水
1
1
宜
1
盛る1
岸
1
7
今
3
小田
1
1
里人
1
1
沢水1
隠れ沼1
1
九重
1
1
折
1
じんもんこんシンポジウム 2011 21
蛙から見てみるpruning
蛙 (15/15/15, 6.45) cw > 2.50 K:1-8 U:1 L:0.00 M:7 Z:1.00
山吹
井手
4鳴く9
移ろふ3 神無備川
1
花7
菱浮葉1
水錆
1
閉づ
1
漁る
1 11
1
11
県
1
井戸
1
1
都人
1
1
3
諸声
集く
1
浮草
1
騒ぐ1
池
1
1
1
1
沼水
1 宜
1
盛る
1
岸
1
夫
1
小田
流石に
1
里人
1
隠れ沼 1
九重
1
折
1
じんもんこんシンポジウム 2011 22
山吹から見てみるpruning
蛙井手八重...HUB
山吹 (44/44/44, 5.37) cw > 2.50 K:1-8 U:1 L:0.00 M:7 Z:1.00
蛙
井手4
鳴く
9
移ろふ
3
神無備川
1
単衣
八重
4
2
九重3
十重
1
咲く
6
七重
1
重ぬ
2
河水2
梔子
1
県
1
井戸
1
1 里人
1
2
河浪
2
口
花色衣
1
主
1
答ふ
1
許す
1
盛りなり
21
都人
11
1
岸
吉野
4
盛る
2
実
1
怪し
1
河
4
4
花7
10
夫1
1
1
み
3幾重
1
1
影
2
岩根
清滝河1
沼水
1
宜
1
小島 崎1
添ふ
2
今
3
玉河
1
飼ふ
1
彼
11
沢水
1
一つ
1
底
2
散る
3
此
2
じんもんこんシンポジウム 2011 23
「八重」と「山吹」の関係
• 「八重」を検索してみる「八重(やへ)」「八重葎(やへむぐら)」
「八重桜(やへざくら)」「八重雲(やへくも)」
「八重菊(やへぎく)」
• 「八重山吹」– 「山吹」の花には2種類:一重のものと八重のもの
– この解説は歌ことば関連の辞典には見られない
じんもんこんシンポジウム 2011 24
「八重山吹」の実態
• モデルから探してみる。
八重さける
かひこそなけれ
山吹の
ちらはひとへも
あらしとおもへは
詞花集 46番 読人不知
じんもんこんシンポジウム 2011 25
おわりに
• 「山吹」とともに詠まれる語彙の検討
• 辞典類:「山吹」と「八重」の関連性
→述べられていない。
• モデル:「山吹」と「蛙」「井手」「八重」の関係
→示された。そして「八重山吹」であることも...
• 外在的基準の利用
• 辞典などの見出し語の検討
• モデルによる言語記述の有効性