感情を考慮したtwitter自動応答システムの提案 · 仕事でミスして...

36
甲南大学 知能情報学部 知能情報学科 灘本研究室 11271066 辻 由希子 感情を考慮したTwitter自動応答システムの提案

Upload: others

Post on 14-Sep-2019

0 views

Category:

Documents


0 download

TRANSCRIPT

甲南大学 知能情報学部 知能情報学科

灘本研究室 11271066 辻 由希子

感情を考慮したTwitter自動応答システムの提案

背景

SNSやマイクロブログの普及

誰でも手軽に情報を発信することが可能に

背景

SNSやマイクロブログの普及

日常的な些細なこともリアルタイムで数多く投稿されている

特徴

ツイートからツイート時のユーザの本音に近い気分や感情を

垣間見ることができる

背景

仕事でミスしていっぱい怒られた..

その人が落ち込んでいることが

わかる仕事でミスしちゃった,上司怖かった・・・(´・ω・`)

ツイート

背景

大丈夫?

どんまい

何かあったの?

こっちだってそれどころじゃないわ

ため息ついたら幸せ逃げるよー

ふーん

仕事でミスしていっぱい怒られた..

仕事でミスしちゃった,上司怖かった・・・(´・ω・`)

ツイート

リプライ

どんまい

ツイートに対してコメントをもらうことで承認欲求を満たすユーザも多い

背景

1.欲しいコメントがもらえるとは限らない

2.同じ内容のツイートをしても欲しい応答がいつでも同じとは限らない

適切なタイミングで適切な応答を得ることが可能になれば,

ユーザはより快適にツイッターを利用できる

ストレス発散 や承認欲求を満た

という目的でツイートを投稿

現状

背景

それらの欲求が満たせない

ストレス発散 承認欲求を満たす

目的

ネガティブなツイートに対して

ユーザの感情を考慮した適切な応答をすることで

ネガティブな感情を緩和させよう!

ユーザ 応答システム

傘忘れた…

ツイート

明日はいいことあるよ!

応答

Twitter自動応答システムを提案

目的

ネガティブなツイートに対して

ユーザの感情を考慮した適切な応答をすることで

ユーザ 応答システム

傘忘れた…

ツイート

明日はいいことあるよ!

応答

Twitter自動応答システムを提案

ネガティブな感情の緩和

本研究では

『ネガティブに偏った感情値が平常時に戻る』と定義

平常時の感情ユーザの過去のツイートの感情値の平均を用いて算出

応答タイプ

日頃の感情値(プロファイル)との差分を累積させていき、累積値が閾値を超えた場合、応答。

①蓄積タイプ

日頃の感情値(プロファイル)との差分が閾値を超えた場合、応答。

②爆発タイプ

応答タイプ

日頃の感情値(プロファイル)との差分を累積させていき、累積値が閾値を超えた場合、応答。

①蓄積タイプ

日頃の感情値(プロファイル)との差分が閾値を超えた場合、応答。

②爆発タイプ

システム構成

プロファイル作成部

応答生成部

ユーザの日頃の感情を求めるユーザの直近200ツイートを用いて算出

ユーザの更新ツイートを用いて応答タイプを決定条件を満たした際に応答

システムフロー

ツイート

ツイートの感情値を算出

感情値の差分が閾値を超える

no

応答なし

ネガティブの軸の決定

応答内容・キャラクターの表情の決定

応答

yes

ツイッターID入力

直近200ツイートを収集

各ツイートの感情値を算出

200ツイートの感情値の平均を算出

日本語評価極性辞書

プロファイル

ネガティブ感情語辞書

プロファイル作成部

応答生成部

システムフロー プロファイル作成部

ツイッターID入力

直近200ツイートを収集

各ツイートの感情値を算出

200ツイートの感情値の平均を算出

日本語評価極性辞書

プロファイル

感情値算出

p:ポジティブ

n:ネガティブ

e:ニュートラル

今日はいい天気で嬉しいe ep p

p = 2 , n = 0 , e = 2より

極性単語 極性 評価極性の基準

元気 p □である・になる(評価・感情)主観

悩み n □がある・高まる(存在・性質)

徹夜 e □する(行為)

日本語評価極性辞書[1]

・名詞編・用言編

マッチングした単語の数を極性毎にカウント

分母が0のときは感情値 = 0 とする 感情値 s =2−0

2+0+2=

1

2

(例)

感情値 si =𝑝 − 𝑛

𝑝 + 𝑛 + 𝑒

[1]小林のぞみ,乾健太郎,松本裕治,立石健二,福島俊一.

意見抽出のための評価表現の収集.自然言語処理,Vol.12, No.3, pp.203-222, 2005.

システムフロー 応答生成部

ツイート

ツイートの感情値を算出

感情値の差分が閾値を超える

no

応答なし

ネガティブの軸の決定

応答内容・キャラクターの表情の決定

応答

yes

ネガティブ感情語辞書

プロファイル

応答を決めるにあたって

応援する

叱咤激励する

なだめる頑張れ!!

お前はそんなもんじゃない!!

まぁまぁ

同調する

それはつらいね

ネガティブな人に対してどのように声をかけるか

応答を決めるにあたって

本システムでは『同調』を基に応答内容を作成

応援する

叱咤激励する

なだめる頑張れ!!

お前はそんなもんじゃない!!

まぁまぁ

同調する

それはつらいね

『同調』によって承認欲求を満たす効果が

期待できる

応答するツイートが持つネガティブの感情軸を

決定

何に対して同調するかを知る必要がある

ネガティブの軸の決定

単語 厭 哀 恥 怒 怖

涙ながらだ 0.23 0.88 0.3 0.1 0

泣き崩れる 0.25 0.98 0.42 0 0.12

恋する 0 0 0.33 0 0

嫌らしい 0.87 0.72 0.25 0

真っ赤だ 0.34 0.21 0.76 0.68 0.3

腹立つ 0.23 0.11 0.43 0.97 0.64

ネガティブ感情語辞書

ツイート

ツイートとのマッチングにより各軸毎の感情値を算出

感情値が最大の軸を応答の軸とする

決定したネガティブの感情軸に従って応答を生成

応答で用いるキャラクター

応答の内容に合わせてキャラクターの表情

が変化

応答内容・キャラクターの表情の決定

怒 哀

照厭

それは腹立つなぁ それは悲しいね それは怖いね

それは嫌やなぁ それは恥ずかしいね

応答の決定

めっちゃ腹立つわー!

爆発タイプ<怒>で検知

めっちゃ / 腹立つ / わー / !

単語 厭 哀 恥 怒 怖

腹立つ 0.2 0 0.12 0.98 0.1

それは腹立つなぁ

インタフェース サインイン画面

インタフェース タイムライン・応答画面

折れ線グラフで投稿されているツイートの感情値の遷移を示す

インタフェース タイムライン・応答画面

プロファイル作成時に収集した200ツイートのP,N,Eの割合

ツイート

応答

応答内容とキャラクターの表情が変化

評価実験 目的

目的

本システムで決定する応答のタイミングが,ユーザにとって適切であるかどうかを検証するため

ツイートが持つ感情が本システムで抽出する感情と一致するかを検証するため

1.

2.

データセット 被験者

200ツイート×2ユーザ感情的な投稿をよく行う大学生

8名男子大学生

方法

1.

2.

評価実験 実験方法

全ツイートを見てもらい,応答してほしいか否かを判断

応答してほしいツイートに関しては,そのツイートの持つ感情を5段階で評価してもらう

応答が必要であると答えた被験者が3人以上のツイートを正解データとし,適合率と再現率を算出した.

評価実験 結果

ユーザ名 適合率 再現率 F値

ユーザ1 0.33333 0.42857 0.374997

ユーザ2 0.25641 0.37037 0.30303

ユーザ1,2ともにF値は0.3程度

評価実験 結果・考察

(例1)応答すべきツイートに応答した

あーつら・・・

悲しい

新年早々お腹痛い

ネガティブな単語『悲しい』『痛い』などが含まれ,かつ短文である

適切なタイミングで応答が可能

評価実験 結果・考察

(例2)応答が不要なツイートに応答してしまった

だらだら飲みたい

@Abe_An4

春合宿風邪ひいて帰ってきた。。。

@toroni95 @ktktltsmtgrss

かわいそう

ネガティブな単語を含むがポジティブな使い方

ネガティブな単語を含むリプライ

適切なタイミングで応答が困難

評価実験 結果・考察

(例3)応答すべきツイートに応答しなかった

はぁぁぁやってしまった

3日間連続で電車乗り過ごしたなんでなん

せっかく行ったのに休診とか…

のどとれそうや

口語表現『はぁぁぁ』関西弁『なんでなん』などが含まれる

適切なタイミングで応答が困難

今後の課題

まとめと今後の課題

ネガティブなツイートに対して

ユーザの感情を考慮した適切な応答をすることで

ネガティブな感情を緩和させよう!

Twitter自動応答システムを提案

まとめ

精度向上のために・口語表現への対応・応答内容のバリエーションの向上

その他・蓄積タイプの検知と応答の研究

予備スライド

提案手法の優位性

システム 適合率 再現率 F値

提案手法 0.33333 0.42857 0.374997

比較手法 0.24 0.22222 0.230769

データ : ユーザ1のツイート200件

システム 適合率 再現率 F値

提案手法 0.25641 0.37037 0.30303

比較手法 0.09523 0.13333 0.11111

データ : ユーザ2のツイート200件

応答の検知の段階でP,N,Eを用いた感情値ではなく

感情語辞書を用いた感情値を使用し,応答のタイミングをはかる

実験結果

辞書の詳細情報

日本語評価極性辞書

名詞編 : 12948語

用言編 : 5289語

感情語辞書

3961語

日本人の一日ツイート数

一日の平均ツイート数 : 25.7回