twitter上の地域別シズルワードの分析 ·...

27
Twitter 上の地域別シズルワードの分析 甲南大学 知能情報学部 知能情報学科 灘本研究室 11271093 藤原優汰

Upload: others

Post on 12-Feb-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Twitter上の地域別シズルワードの分析

甲南大学知能情報学部知能情報学科

灘本研究室 11271093 藤原優汰

地域によって味の好みが異なる

背景

一方近年,Twitterを代表とするSNSの普及により誰でも気軽に情報を発信することが可能になっている.

背景

本研究ではTwitterを研究対象とする

•利用者が多く全国にいる•短文なので本音が出やすい•リアルタイムでの投稿ができる

味覚系 食感系 情報系

あっさり もちもち 季節限定

濃厚 ジューシー 新鮮

ピリ辛 サクサク 産地直送

甘い ホクホク 昔ながらの

博多の豚骨ラーメンは濃厚でおいしかった

函館の塩ラーメンはあっさりしていておいしかった

シズルワード

背景

おいしさを示す言葉

食品に対するイメージとして重要なワード‼

地域によって主に使われるシズルワードが異なる

背景

地域ごとで主に使われているシズルワード分析し可視化する

目的

対象食品とシズルワード

分析を行うにあたり,年間を通して食べられていて

味の表現によくシズルワードが用いられている

ラーメン

あっさり濃厚こってり

同じものとして扱う

データセット

ラーメンを含むツイート 14,285,714件県ごとの地名データベース

地名データベース:

各都道府県を市区町村レベルで分類したものこのとき使用した地名DBは手作業で作成した地名,駅名,ランドマークの3,977件である

ラーメンを含むツイートを取得

シズルワード毎に分類

地名を含むツイートを抽出 地名DB

県ごとに出現頻度を求める

出現頻度を基に色分け可視化

可視化までの流れ

取得データ

ラーメンを含むツイート:14,285,714件

あっさりツイート:45168件

濃厚,こってりツイート:31183件

あっさり∩地名ツイート:10104件

濃厚,こってり∩地名ツイート:9936件

県ごとに出現頻度を求める

出現頻度

出現頻度を基に色分け可視化

Pythonライブラリ

matplotlib出現頻度データ

出現頻度ごとに色分けを行い日本地図上で可視化

可視化ツール

分析

仮説1:都市部ではシズルワードの偏りはあまり見られない

仮説2:九州は濃厚,関西はあっさりに偏りが見られる

仮説3:ラーメンで特定のシズルワードが多い地域は無作為に取得したシズルツイートでもそのシズルワードが多く見られる

分析をするにあたりシズルワードと地域の関係に着目し以下の3つの仮説を立てた.

分析

仮説1 都市部ではシズルワードの偏りがあまり見られない

東京,大阪などの都市部は様々な地域からラーメン店が出店されているため「濃厚」,「あっさり」どちらのシズルワードも多く見られる

可視化結果

濃厚 あっさり

700以上

500以上

300以上

100以上

100以下

700以上

500以上

300以上

100以上

100以下

仮説1の考察

都市部ではシズルワードの偏りはあまり見られなかった

可視化結果より都市部は「あっさり」「濃厚」ともに多く見られる

よって仮説1は「真」である

分析

仮説2 九州は濃厚,関西はあっさりに偏りがみられる

九州では豚骨ラーメンが有名なため濃厚ツイートが多くみられ,関西はだしを使った料理が多いためラーメンでも同様にあっさりツイートが多くみられる

可視化結果

濃厚 あっさり

700以上

500以上

300以上

100以上

100以下

700以上

500以上

300以上

100以上

100以下

可視化結果

濃厚とあっさりが共起

可視化結果

濃厚 あっさり

700以上

500以上

300以上

100以上

100以下

700以上

500以上

300以上

100以上

100以下

和歌山奈良

仮説2の考察九州には濃厚が多く見られたがあっさりも多く見られた

あっさりが多かった要因は濃厚ツイートの中に「濃厚だけどあっさり」といったツイートが多かったためである

関西は仮説とは異なり濃厚,あっさりともに多くみられることが分かった.濃厚が多く見られた要因として奈良,和歌山のご当地ラーメンが濃厚なラーメンで有名であるためである

よって仮説2は「偽」である

分析

ラーメンで特定のシズルワードが多い地域は無作為に

取得したシズルツイートでもそのシズルワードが多くみられる

よく食べられるラーメンのシズルワードが濃厚であればその地域で好まれる味は濃厚であると考えられる.同様にあっさりのシズルワードが多い場合はその地域で好まれる味はあっさりである.

仮説3

無作為に取得したシズルツイートの可視化

濃厚あっさり

仮説3の考察結果として分析を行うことはできなかった.

これは無作為に取得したツイートの中に「あっさり交換手続きしてもらえた」などの食品に関係のないツイートが多かったためである.

しかし仮説2の結果を鑑みるに,必ずしもラーメンとその他の食品の味の好みが同じであるとは言えない.

よって仮説3は「偽」である.

まとめと今後の課題本研究ではおいしさを表現する言葉をシズルワードと定義し,Twitter上におけるラーメンを含むシズルワードと地域の関係について可視化し,その結果を基に分析を行った

<結果> 都市部ではどちらのシズルワードも多く出現され,一部の地域ではシズルワードに差が出ることが分かった

ラーメンと他の食品の好みが必ずしも同じであることはないということが分かった

<今後の課題>今回はラーメンを対象に分析を行ったが,他の食品でも分析を行う.ツイートの投稿時期に着目して分析を行う.