検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight

Post on 09-Jan-2017

306 Views

Category:

Technology

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

2016年12月5日

D&S 関西 田村 健

検索クエリの時間差を可視化することで

わかる人の行動パターン

田村 健ヤフー株式会社データ&サイエンスソリューション統括本部 D&S関西

自己紹介

経歴

2009年4月 ヤフー新卒エンジニア入社(東京本社)

2009年10月 検索開発部配属(検索データの可視化チーム)

2012年10月 データソリューション開発部(現D&S統括本部)に異動

2015年10月 D&S関西に異動

お仕事:社内向けのデータ可視化ツールを作っています

ヤフー東京本社D&S統括本部には 300名以上在籍

(2016年10月時点)

D&S関西とは?(宣伝)

ヤフー福岡オフィスD&Sメンバは 1名在籍(2016年10月時点)

ヤフー大阪オフィスD&S関西チーム9名在籍(2016年10月時点)

関西のデータ&サイエンス人材に門戸を開きたい

主要なICT企業が東京に一極集中している中で、

関西で働きたい人材に、関西で輝ける場所を提供し、

地域の発展に貢献したい。

なぜ関西にD&Sチームを作ったか?

検索データを使った

• これまでのトレンド/人の行動理解の取り組みの事例

• 今取り組んでいる分析/可視化手法について

今日のお話

長い期間をかけて少しずつ検索回数が伸びるているものを検知2013年1月-2015年11月のYahoo!検索データ

“airbnb”

2013/1 2015/11

検索

回数

周期性のある検索クエリ

2013年1月1日~2015年10月10日

「ネクタイ 結び方」の検索数推移

1/15前後

4/1前後1/15前後

4/1前後

毎年1月前半と4月頭に検索数が増えるという周期性が存在する

地域性の可視化

今川焼き

大判焼き

回転焼き

回転焼き風おやつの検索数が多い呼び方分布

2015年4月6-12日の検索データ2015年3月30日-4月5日の検索データ

2015年4月6-12日の検索データ2015年3月30日-4月5日の検索データ

“花見”

インフルエンザの感染状況可視化

Yahoo!JAPAN ビッグデータレポート http://docs.yahoo.co.jp/info/bigdata/influenza/2015/01/

検索数 多

検索数 少

上昇傾向下降傾向

流行

蔓延峠をこえる

収束

ニーズを深掘りする

ダイソン ドライヤー

ドライヤー 人気

パナソニック ドライヤー

復元 ドライヤー

ドライヤー おすすめ

ナノケア ドライヤー

くるくるドライヤー

ドライヤー パナソニック

ドライヤー ヘアビューザー

パナソニックドライヤー

ドライヤー ランキング

リュミエリーナ ドライヤー

テスコム ドライヤー

“ドライヤー” を含む検索クエリ

• 人気のメーカー(ダイソン、パナソニック)• 人気のタイプ(復元、ナノケア、くるくる)• ドライヤーの探し方(人気、おすすめ)などがわかる。

検索量多

検索量少

第2ワードの抽出/可視化

ニーズを深掘りする

相関が高い(検索推移が似ている)検索クエリを抽出

“映画” と “漫画喫茶”

ニーズを深掘りする

想像もつかない競合をデータを導くこともできる。

“映画” と “焼肉”

検索推移だけを見ると・・

キーワードとキーワードの関係をユーザ軸に説明できない。

“映画” と “焼肉” は相関が高いクエリである(検索推移が似ている)

でも、それは、- 同じユーザが、“映画” と “焼肉” で悩んでいるのか?- “映画” と “焼肉” はまったく違うユーザセグメントなのか?

映画好き 焼肉好き

??

ここを調べたい あらゆる検索クエリに対応すると結構大変。

圧倒的なデータボリューム…年間の検索クエリの種類:約100億種類年間の検索データのレコード数:約7000億

検索クエリをハッシュ化し、256グループに分類。256回重複計算を実施。

映画好き 焼肉好き

??

重複ユーザ数を計算

あるワードを検索した人がよく検索している他のワード

“ユニクロ”

GU

H&M

Gap

“アルマーニ”

ドルチェ&ガッバーナ

gucchi

カルバンクライン

“映画”を検索している人は、他にどんなことを検索している?

“映画”を検索している人は、他にどんなことを検索している?

“天気”

“食べログ”

“デートプラン” “休日 一人”

“英語の勉強”

検索時間差を可視化することで物事の検討タイミング/行動パターンが可視化できるのでは?

映画 焼肉

time

検索時間差 映画 焼肉

time

映画 焼肉

time

“咳止め 薬” の検索時間差ワード

time

0 +2.0-2.0

集計期間 1週間

“咳止め 薬” の検索時間差ワード

time

0 +2.0-2.0

喉の痛み 治す

喉の痛み 薬

集計期間 1週間

“咳止め 薬” の検索時間差ワード

time

0 +2.0-2.0

喉の痛み 治す

喉の痛み 薬

咳を止める方法メジコン

集計期間 1週間

“咳止め 薬” の検索時間差ワード

time

0 +2.0-2.0

喉の痛み 治す

喉の痛み 薬

咳を止める方法メジコン

喘息咳 治療

肺炎 症状

集計期間 1週間

“失恋” の検索時間差ワード

time

0 +2.0-2.0

集計期間 1週間

“失恋” の検索時間差ワード

time

0 +2.0-2.0

好きな人にとる態度

告白 タイミング

集計期間 1週間

“失恋” の検索時間差ワード

time

0 +2.0-2.0

好きな人にとる態度

告白 タイミング LINE ブロック

告白 失敗

集計期間 1週間

“失恋” の検索時間差ワード

time

0 +2.0-2.0

好きな人にとる態度

告白 タイミング LINE ブロック

告白 失敗

タロット占い

情緒不安定

集計期間 1週間

“粉ミルク” の検索時間差ワード

time

0 +250-250

集計期間 1年間

“粉ミルク” の検索時間差ワード

time

0 +250-250

つわり対策

妊娠初期

集計期間 1年間

“粉ミルク” の検索時間差ワード

time

0 +250-250

つわり対策

妊娠初期

チャイルドシート口コミ

赤ちゃん命名辞典

集計期間 1年間

“粉ミルク” の検索時間差ワード

time

0 +250-250

つわり対策

妊娠初期

チャイルドシート口コミ

赤ちゃん命名辞典

集計期間 1年間

おっぱいの飲ませ方

新生児夜泣き

“粉ミルク” の検索時間差ワード

time

0 +250-250

つわり対策

妊娠初期

チャイルドシート口コミ

赤ちゃん命名辞典

離乳食 ベビーフード

集計期間 1年間

おっぱいの飲ませ方

新生児夜泣き

“粉ミルク” の検索時間差ワード

time

0 +250-250

つわり対策

妊娠初期

チャイルドシート口コミ

赤ちゃん命名辞典

離乳食 ベビーフード

1歳絵本

集計期間 1年間

おっぱいの飲ませ方

新生児夜泣き ベビースイミング

• 単純な手法でも、データボリュームと処理基盤があればインターネットのデータからリアルを可視化することができる。

• AIの時代だけど、人が理解出来る形での可視化は相変わらず重要だと思う。

• ヤフーにしかできない可視化はすごく楽しい!

最後に

top related