顔文字の役割に着目したツイートの...
TRANSCRIPT
顔文字の役割に着目したツイートの多次元感情抽出手法の提案
◎山本 湧輝(甲南大学)
熊本 忠彦(千葉工業大学)
灘本 明代(甲南大学)
背景
•140文字以内の短文を投稿 •気軽に発言できる
気軽にツイート 今思っていることや意見を 投稿する
その人の感情が出やすい
感情を含んだツイート
こんな天気のいい日はわくわくするな
こんな天気のいい日はわくわくするな(*´∀`*)
顔文字あり
顔文字なし
顔文字なしの 感情
楽しい
より楽しい
< 顔文字ありの 感情
感情を含んだツイート
顔文字あり
顔文字なし
怒ってる
あまり 怒ってない
むかつくからブロックしよ
むかつくからブロックしよ\(^o^)/
顔文字なしの 感情 ≠ 顔文字ありの
感情
目的
顔文字が入るとツイートの感情が変化する
ポイント
文だけではなく…
顔文字を考慮したツイートの感情抽出
•映画の要約 •おすすめの本を推薦
期待できること
顔文字の役割に着目
ホントに悲しい(*^^*)
感情抽出の方法
感情語辞書
感情語辞書の構築方法
中村の感情表現辞典 10軸の感情
熊本らの感情語を 定量化するツール
感情語辞書
感情語辞書の構築手順
・中村明:「感情表現辞典」.東京堂出版,1993. ・熊本忠彦,河合由起子,田中克己,“ 新聞記事を対象とするテキスト印象マイニング手法 の設計と評価”,信学論,Vol. J94-D,No.3,pp.540–548,2011.
感情語辞書の特徴
様々な感情軸に対応
感情軸ごとに単語を定量化
ツイートに適した感情語辞書の構築
中村の感情表現辞典
熊本らの感情語を 定量化するツール
映画のレビューを用いる
[1]
[2]
[1]
[2]
様々な感情軸に対応
中村明の感情表現辞典は小説の用例を10軸の感情に分類
喜 哀 怒 怖 好 厭 昂 驚 安 恥
感情 単語 感情 単語
喜 楽しい,嬉しい,心が引かれる 怒 怒る,甚だしい,むっとする
哀 悲しい,痛い,じいんと来る 怖 怖い,震える,気味悪い
恥 恥ずかしい,照れる,穴に入りたい 好 恋しい,愛しい,敬意を表する
厭 暗い,憎い,愛想をつかす 昂 苛立つ,感情,心が張り詰める
安 のんびり,すっきり,気を鎮める 驚 ぼんやり,歓喜,目を丸くする
感情軸ごとに単語を定量化
哀⇔喜
怖⇔怒
厭⇔好
驚⇔昂
恥⇔安
Plutchikの感情の輪 R.Plutchik, “The nature of emotions”.American Scientist, Vol.89, pp.344-355,2011.
辞書構築手法 熊本らの提案する感情語を定量化するツールを用いる
対極な感情軸 例)喜⇔哀
ツイートに適した感情語辞書の構築
データ:Yahoo!映画のレビューデータ74,000文書
感情語:感情表現辞典の語句
感情軸:感情表現辞典の10軸の感情で構成された対極な軸
ツイートに適した感情語辞書を構築 →映画のレビューデータを使用
なぜ…
ツイートでは短文のため崩れた表現や文法が乱れている
口語的な表現が多く有り,かつ文法の乱れの少ない
映画のレビューを用いる
構築した感情語辞書の例
単語 哀⇔喜 厭⇔好 恥⇔安 怖⇔怒 驚⇔昂
爆笑できる 0.9266 0.0142 0 0.3717 0.5
涙ながらだ -0.9433 -0.0428 -0.7228 -0.3922 0.5964
泣き崩れる -0.9171 0.2987 0.3142 -0.073 0.792
恋する 0.1267 0.8927 -0.0176 -0.1385 0.0561
嫌らしい -0.2417 -0.9616 0 0.0424 -0.0938
明快だ 0.3598 -0.0033 0.7422 0.2494 0.0339
真っ赤だ -0.3879 0.1115 -0.9926 -0.0089 0.2922
腹立つ -0.3405 0.1049 0.0937 0.9051 -0.1221
恐ろしい -0.2891 -0.2304 0.0375 -0.9662 0.14
熱心だ -0.0481 0.1551 0.183 0.231 0.9697
意外だ -0.0081 0.1663 0.207 0.003 -0.9906
-1 1 左側の感情 右側の感情
文から感情値の抽出
感情語辞書
喜 好 安 哀 厭 怖 怒 恥 昴 驚 わくわく 0.76 0 0 0 0 0 0 0 0.3 0
いい 0.25 0.52 0.21 0 0 0 0 0 0 0
形態素解析
こんな天気のいい日はわくわくする
各感情値の合計を求める
こんな/天気/の/いい/日/わくわく/する
喜 好 安 哀 厭 怖 怒 恥 昴 驚 感情値 1.01 0.52 0.21 0 0 0 0 0 0.3 0
ホントに悲しい(*^^*)
感情抽出の方法
顔文字から感情の抽出
顔文字辞書
こんな天気のいい日はわくわくする な(*´∀`*)
こんな天気のいい日はわくわくするな(*´∀`*)
(*´∀`*) 喜
顔文字 感情
顔文字辞書
既存の顔文字辞書は本研究の感情軸とあっていない
新たな辞書を構築する必要がある
顔文字 感情 (^o^) 喜 好
(^^) 喜 (>_<) 厭 哀 昂
•スマートフォン向けの顔文字辞書 •顔文字のまとめてあるサイト
1. 教師データとする顔文字を集める
2. 10人により教師データの顔文字の感情を決定
3. 教師データの顔文字のパーツごとの感情を決定
4. 顔文字を顔文字辞書に追加
顔文字辞書構築の手順
Twitter 顔文字を収集
教師データとする顔文字
顔文字を含む17,647ツイート
顔文字を100個収集
出現頻度が高い
顔文字 回数 割合 (^o^) 2832 0.160
(^^) 935 0.053 (>_<) 917 0.052 (´・_・`) 742 0.042
(^-^) 527 0.030 ( ´ ▽ ` ) 504 0.029
(´・ω・`) 499 0.028 (´・ω・`) 498 0.028
(´・ω・`) 496 0.028 (´;ω;`) 413 0.023
( ̄▽ ̄) 389 0.022 ( ^ω^ ) 361 0.020
実験に使用した顔文字の例
• Twitterからランダムにツイートを取得
•その中から顔文字付きのツイート17,647ツイートを抽出
•出現頻度の高い顔文字を教師データとして使用
1. 教師データとする顔文字を集める
2. 10人により教師データの顔文字の感情を決定
3. 教師データの顔文字のパーツごとの感情を決定
4. 顔文字を顔文字辞書に追加
顔文字辞書構築の手順
(*´・ω・`*) 「哀」,「厭」
教師データの顔文字の感情を決定する為の実験
顔文字 喜 哀 怒 怖 好 厭 昂 驚 安 恥 (^o^) 1.0 1.2 2.5 2.7
(^^) 1.0 1.5 2.7 2.6 (>_<) 1.2 2.0 1.9
顔文字を見てもらい当てはまると思う感情を選ぶ (順位の高い順に1→2→3)
実験方法
実験の結果
• データ → 抽出した顔文字100個 • 被験者 → 10人
(10人の被験者の平均順位)
1. 教師データとする顔文字を集める
2. 10人により教師データの顔文字の感情を決定
3. 教師データの顔文字のパーツごとの感情を決定
4. 顔文字を顔文字辞書に追加
顔文字辞書構築の手順
(*´・ω・`*)
パーツごとの感情を決定
(*´・ω・`*)
顔文字のパーツに着目
• 顔文字を「頬」「眉」「目」「口」の4パーツに分ける • 教師データの顔文字の感情を元にパーツごとの感情を決定
目 感情
^ ^ 喜 好 安
> < 哀 厭 驚
. . 哀 厭 恥
° ° 驚
≧ ≦ 喜 好 昂
1. 教師データとする顔文字を集める
2. 10人により教師データの顔文字の感情を決定
3. 教師データの顔文字のパーツごとの感情を決定
4. 顔文字を顔文字辞書に追加
顔文字辞書構築の手順
教師データ Twitter
パーツごとに顔文字を収集
顔文字辞書の構築
• 教師データ(100個)+パーツに着目して収集した顔文字(400個)
感情軸 単語 喜 (^o^) (^^) (^-^) 好 (^o^) ( ´ ▽ ` ) (≧▽≦) 安 ( ´ ▽ ` ) (・ω ・) (・∀・) 哀 (>_<) (´・_・`) (ToT)
計500個の顔文字を顔文字辞書に追加
結果
• 抽出したパーツをもつ顔文字400個を収集
•400個の顔文字の感情をパーツに基づき決定
•顔文字辞書に感情の決定した顔文字を追加
登録されている顔文字の例
ホントに悲しい(*^^*)
感情抽出の方法
文と顔文字の関係
悲しいよ~(^O^)
めっちゃ楽しい(^O^)
同じ顔文字でも文によって使われ方が異なる
(^O^)
顔文字
文と顔文字の関係から全体の感情値を算出する
ポイント
顔文字の役割
文の感情を強めている
文の感情を弱めている
顔文字を考慮した感情抽出の流れ
こんな天気のいい日はわくわくするな(*´∀`*)
文の感情 • ツイートを形態素に分ける
• 顔文字辞書を用いて感情値を抽出
顔文字の感情
• 顔文字辞書とのマッチング により顔文字の感情を抽出
(顔文字を含む場合)
役割を決定
文の感情
喜
顔文字の感情
喜
役割の決定の為の実験
• 被験者 10代~50代の男女10人ずつ計100人 • 質問数 200ツイート
同じ文に対して顔文字が付いている時と付いていないときを評価してもらう
実験方法
今親元と離れたばっかだから心配ごと多い
今親元と離れたばっかだから心配ごと多い(´∀`)
例
差 顔文字がつくことで感情がどのように変化するかを調べる
顔文字の役割を決定するための前準備
喜 好 安 哀 厭 怖 怒 恥 昴 驚
positive negative
•10軸の感情軸を 「positive」「negative」の2軸に分ける
Plutchikの感情の輪 R.Plutchik, “The nature of emotions”.American Scientist, Vol.89, pp.344-355,2011.
顔文字の役割の決定
文の感情 (positive, negative,
neutral)
顔文字の感情 (positive, negative)
組み合わせ
役割を決定
文と顔文字の感情から役割を決める
顔文字の役割の決定
文+顔文字 ツイートの感情
P N Nu
P+P 14 0 0
P+N 12 5 3
P+Nu 0 0 0
N+P 1 19 0
N+N 1 35 0
N+Nu 0 0 0
Nu+P 3 0 1
Nu+N 0 3 1
Nu+Nu 0 0 0
Positive → P
Negative → N
Neutral → Nu
文+顔文字 ツイートの感情
P N Nu
P+P 強調 - -
P+N 弛緩 転換 -
P+Nu - - -
N+P 転換 弛緩 -
N+N - 強調 -
N+Nu - - -
Nu+P 付加 - -
Nu+N - 付加 -
Nu+Nu - - -
• 文と顔文字の感情の組み合わせを行
• 実験結果の顔文字を含んだツイートの感情を列
• 各々のツイート数を値として示している
役割の種類
顔文字が文の感情を和らげている
顔文字が文の感情をより強めている
顔文字の感情が文の感情と入れ替わる
文の感情がない時に顔文字の感情が付加される
文の感情=顔文字の感情
特徴
役割の種類
顔文字が文の感情をより強めている
文+顔文字 ツイートの感情
P N Nu
P+P 強調 - -
P+N 弛緩 転換 -
P+Nu - - -
N+P 転換 弛緩 -
N+N - 強調 -
N+Nu - - -
Nu+P 付加 - -
Nu+N - 付加 -
Nu+Nu - - -
やったああ(*^_^*)
学校嫌だ(T_T)
ツイートの例
文の感情↔顔文字の感情 ツイートの感情が
文の感情と同じになる
特徴
役割の種類
顔文字が文の感情を和らげている
文+顔文字 ツイートの感情
P N Nu
P+P 強調 - -
P+N 弛緩 転換 -
P+Nu - - -
N+P 転換 弛緩 -
N+N - 強調 -
N+Nu - - -
Nu+P 付加 - -
Nu+N - 付加 -
Nu+Nu - - -
勉強ばっかり嫌になる(*^-^*)
めっちゃ楽しい(T_T)
ツイートの例
役割の種類
文+顔文字 ツイートの感情
P N Nu
P+P 強調 - -
P+N 弛緩 転換 -
P+Nu - - -
N+P 転換 弛緩 -
N+N - 強調 -
N+Nu - - -
Nu+P 付加 - -
Nu+N - 付加 -
Nu+Nu - - -
今日からテストスタート(^O^)
ツイートの例
顔文字の感情が文の感情と入れ替わる
文の感情↔顔文字の感情 ツイートの感情が
顔文字の感情と同じになる
特徴
役割の種類
文の感情がない時に顔文字の感情が付加される
文+顔文字 ツイートの感情
P N Nu
P+P 強調 - -
P+N 弛緩 転換 -
P+Nu - - -
N+P 転換 弛緩 -
N+N - 強調 -
N+Nu - - -
Nu+P 付加 - -
Nu+N - 付加 -
Nu+Nu - - -
学校なう(*^_^*)
もうすぐ明日が来る(T_T)
ツイートの例
文の感情がなく, 顔文字がついている場合
特徴
強調における文とツイートの感情の相関関係
役割 相関係数
強調 0.97
強調の散布図
• 顔文字を含むツイートの感情値を縦軸
• 文の感情値を横軸
0
2
4
6
8
10
0 2 4 6 8 10
ツイートの感情値
文の感情値
弛緩における文とツイートの感情の相関関係
役割 相関係数
弛緩 0.95
• 顔文字を含むツイートの感情値を縦軸
• 文の感情値を横軸
0
2
4
6
8
10
0 2 4 6 8 10
ツイートの感情値
文の感情値
弛緩の散布図
転換における文とツイートの感情の相関関係
役割 相関係数
転換 0.98
• 顔文字を含むツイートの感情値を縦軸
• 文の感情値を横軸
転換の散布図
-6
-5
-4
-3
-2
-1
0
0 1 2 3 4 5 6 7
ツイートの感情値
文の感情値
役割ごとの回帰分析
0
2
4
6
8
10
0 2 4 6 8 10
ツイートの感情値
文の感情値
(a) 「強調」
0
2
4
6
8
10
0 2 4 6 8 10
ツイートの感情値
文の感情値
(b) 「弛緩」
-6
-4
-2
0
0 2 4 6 8
ツイートの感情値
文の感情値
(c)「転換」
役割 回帰式
強調 y=0.9886x+0.3215
役割 回帰式
転換 y=-0.8002x+0.001
役割 回帰式
弛緩 y=0.8728x+0.3083
決定係数 : 0.95
決定係数 : 0.91
決定係数 : 0.95
まとめと今後の課題
まとめ
•ユーザ実験を行い感情軸ごとの顔文字辞書を構築した •顔文字の役割ごとに回帰分析を行い定式化を行った •文と顔文字の関係からツイートの感情抽出を行った
今後の課題
•顔文字辞書の拡張 •顔文字の影響を考慮して感情軸の見直し •システムの評価実験