tokyor42_r_datamining_18

56
デデデデデデデデデデ 4 デデデデ デデ @yokkuns 42 Tokyo.R デデデデデデデデ 2014.08.30 デ R デデデデデデデデデデデ デデ 18

Upload: yohei-sato

Post on 31-May-2015

4.631 views

Category:

Data & Analytics


0 download

DESCRIPTION

Point of view when analyzing

TRANSCRIPT

Page 1: Tokyor42_r_datamining_18

データを分析する時の4 つの視点

里 洋平 ( @yokkuns )第42回 Tokyo.R 初心者セッション

2014.08.30

〜 R で学ぶデータマイニング1 第18章〜

Page 2: Tokyor42_r_datamining_18

AGENDA

自己紹介 メディアにあふれるデータ

交通事故死亡データ まとめ

Page 3: Tokyor42_r_datamining_18

AGENDA

自己紹介 メディアにあふれるデータ

交通事故死亡データ まとめ

Page 4: Tokyor42_r_datamining_18

自己紹介

里 洋平 ( @yokkuns ) やってきたこと

Web アプリ開発 統計解析 / データマイニング マーケティング

今やってること 全社横断の分析 分析環境の整備

Page 5: Tokyor42_r_datamining_18

活動例1:やってきたこと

Page 6: Tokyor42_r_datamining_18

活動例2: TokyoR

Tokyo.R の主催やってます

Page 7: Tokyor42_r_datamining_18

活動例3:執筆

Page 8: Tokyor42_r_datamining_18

AGENDA

自己紹介 メディアにあふれるデータ

交通事故死亡データ まとめ

Page 9: Tokyor42_r_datamining_18

本日のテーマ:メディア等に溢れるデータ

■ テキスト・ R で学ぶデータマイニング〈 1 〉データ解析編 - http://amzn.to/1prDlLU

■R コードと実行結果・ TokyoR#42 テキスト - http://rpubs.com/yokkuns/27223

第 1 部 基本知識篇 (R のインストールR の起動R の終了簡単な計算方法R 用エディタと本文の記載方法について ほか )第 2 部 グラフとデータマイニング ( グラフとデータマイニンググラフの保存メディア等に溢れるデータ合計特殊出生率と少子化 )

Page 10: Tokyor42_r_datamining_18

テキストの内容はメディアにあふれているデータについていろいろ言及するという内容

Page 11: Tokyor42_r_datamining_18

そのままでは面白くないので少しアレンジしてデータを分析する時の視点を考えてみる構成

に変更しました

Page 12: Tokyor42_r_datamining_18

なので、表現とか内容がテキストと異なるところが

あります

Page 13: Tokyor42_r_datamining_18

ってか、全然違います

Page 14: Tokyor42_r_datamining_18

AGENDA

自己紹介 メディアにあふれるデータ

交通事故死亡データ まとめ

Page 15: Tokyor42_r_datamining_18

交通事故死亡者数

飲酒運転の罰金が最大 30 万となったことにより交通事故死亡者数が減少!

道路交通法改正

Page 16: Tokyor42_r_datamining_18

交通事故死亡者数( Rコード)

Page 17: Tokyor42_r_datamining_18

グラフに対して

Page 18: Tokyor42_r_datamining_18

交通事故死亡者数

飲酒運転の罰金が最大 30 万となったことにより交通事故死亡者数が減少!

道路交通法改正

Page 19: Tokyor42_r_datamining_18

交通事故死亡者数

飲酒運転の罰金が最大 30 万となったことにより交通事故死亡者数が減少!

0じゃない

道路交通法改正

Page 20: Tokyor42_r_datamining_18

交通事故死亡者数

飲酒運転の罰金が最大 30 万となったことにより交通事故死亡者数が減少!

0じゃない

道路交通法改正13年より前の傾向は?

Page 21: Tokyor42_r_datamining_18

交通事故死亡者数( 0から始まる棒グラフ)

0 から始めると・・・

道路交通法改正

Page 22: Tokyor42_r_datamining_18

交通事故死亡者数( 0から始まる棒グラフ)

0 から始めると・・・

道路交通法改正

Page 23: Tokyor42_r_datamining_18

交通事故死亡者数(棒グラフで長期間)

平成 13 年よりも前から見てみると改正前から緩やかな減少トレンドになってい

道路交通法改正

Page 24: Tokyor42_r_datamining_18

交通事故死亡者数(棒グラフで長期間)

平成 13 年よりも前から見てみると改正前から緩やかな減少トレンドになってい

道路交通法改正

Page 25: Tokyor42_r_datamining_18

【おまけ】交通事故死亡者数(折れ線グラフで長期間)

平成 13 年よりも前から見てみると改正前から減少トレンドになっている

道路交通法改正

Page 26: Tokyor42_r_datamining_18

【おまけ】交通事故死亡者数(折れ線グラフで長期間)

平成 13 年よりも前から見てみると改正前から減少トレンドになっている

道路交通法改正

Page 27: Tokyor42_r_datamining_18

【おまけ】交通事故死亡者数(棒グラフを横長にした図)

平成 13 年よりも前から見てみると改正前から緩やかな減少トレンドになってい

道路交通法改正

Page 28: Tokyor42_r_datamining_18

【おまけ】交通事故死亡者数(棒グラフを横長にした図)

平成 13 年よりも前から見てみると改正前から緩やかな減少トレンドになってい

道路交通法改正

Page 29: Tokyor42_r_datamining_18

結論に対して

Page 30: Tokyor42_r_datamining_18

交通事故死亡者数

飲酒運転の罰金が最大 30 万となったことにより交通事故死亡者数が減少!

道路交通法改正

Page 31: Tokyor42_r_datamining_18

交通事故死亡者数

飲酒運転の罰金が最大 30 万となったことにより交通事故死亡者数が減少!

道路交通法改正

Page 32: Tokyor42_r_datamining_18

交通事故死亡者数の分解

なぜ飲酒運転の罰金増加で交通事故死亡者が減るのか?

Page 33: Tokyor42_r_datamining_18

交通事故死亡者数の分解

なぜ飲酒運転の罰金増加で交通事故死亡者が減るのか?

交通事故死亡者

飲酒なしの交通事故死亡者

飲酒ありの交通事故死亡者

Page 34: Tokyor42_r_datamining_18

交通事故死亡者数の分解

交通事故死亡者

飲酒なしの交通事故死亡者

飲酒ありの交通事故死亡者

+飲酒運転の罰金で減少することが期待出来る

飲酒運転の罰金では減少しない

飲酒運転の罰金増加で減少するのは、飲酒ありの交通事故による死亡者数

Page 35: Tokyor42_r_datamining_18

改正によるインパクト

飲酒ありによる交通事故死亡者が交通事故死亡者に占める割合はどれくらいか

飲酒あり

飲酒あり

交通事故死亡者 交通事故死亡者

Page 36: Tokyor42_r_datamining_18

調べてみた

http://www.npa.go.jp/koutsuu/kikaku190906/3_insyu/insyu.pdf

Page 37: Tokyor42_r_datamining_18

飲酒有無別交通事故死亡者数推移

飲酒なしの交通事故死亡者数の方が飲酒ありの交通事故死亡者数と比べて多い

飲酒あり(第1当事者)

飲酒なし(第1当事者)

交通事故死亡者数全体

Page 38: Tokyor42_r_datamining_18

飲酒有無別交通事故死亡者数推移( Rコード)

Page 39: Tokyor42_r_datamining_18

飲酒有無別交通事故死亡者数推移

飲酒ありの交通事故死亡者数は最大で 1,500 前後

飲酒あり(第1当事者)

飲酒なし(第1当事者)

交通事故死亡者数全体

1,500

Page 40: Tokyor42_r_datamining_18

交通事故死亡者数飲酒ありの交通事故死亡者数は最大で 1,500 前後(※)

⇒ 減少すべてを改正によるものとするのは無理がある

道路交通法改正

約 1,900

※ 正確には第1当事者なのでもう少し増える

Page 41: Tokyor42_r_datamining_18

飲酒有無別交通事故死亡者比率

「飲酒あり」が占める割合は、 12 〜 15%

Page 42: Tokyor42_r_datamining_18

飲酒有無別交通事故死亡者比率

「飲酒あり」が占める割合は改正によって減少している( 15%→12% )

改正後に15%→12% に減少

Page 43: Tokyor42_r_datamining_18

飲酒有無別交通事故死亡者比率( Rコード)

Page 44: Tokyor42_r_datamining_18

飲酒ありの交通事故死亡者数推移

飲酒ありだけの推移を見てみると改正から顕著に減少している

道路交通法改正

改正効果?

Page 45: Tokyor42_r_datamining_18

飲酒有無別交通事故死亡者数推移

改正とは無関係の飲酒なしの交通事故死亡者数も減少している

⇒ 改正とは別の効果が混ざっている

飲酒あり(第1当事者)

飲酒なし(第1当事者)

交通事故死亡者数全体

Page 46: Tokyor42_r_datamining_18

飲酒有無での比較

見たい効果以外の条件が同じもので比較する⇒ 飲酒ありと飲酒なしの差分が改正効果

改正効果

時間効果 時間効果- = 改正効果

飲酒あり 飲酒なし

その他効果 その他効果

Page 47: Tokyor42_r_datamining_18

改正による交通事故死亡者数減少効果

飲酒なしの推移から改正なし想定を算出

×β

Page 48: Tokyor42_r_datamining_18

改正による交通事故死亡者数減少効果

改正なし想定のトレンドとの差分が改正による減少効果

道路交通法改正

Page 49: Tokyor42_r_datamining_18

改正による交通事故死亡者数減少効果

Page 50: Tokyor42_r_datamining_18

AGENDA

自己紹介 メディアにあふれるデータ

交通事故死亡データ まとめ

Page 51: Tokyor42_r_datamining_18

視点1:分解

交通事故死亡者

飲酒なしの交通事故死亡者

飲酒ありの交通事故死亡者

+飲酒運転の罰金で減少することが期待出来る

飲酒運転の罰金では減少しない

具体的に何に効くのかを分解して考える

Page 52: Tokyor42_r_datamining_18

視点2:インパクト

全体に対するインパクトを確認する

飲酒あり

飲酒あり

交通事故死亡者 交通事故死亡者

Page 53: Tokyor42_r_datamining_18

視点3:時系列トレンド

長期的なトレンドを確認する

Page 54: Tokyor42_r_datamining_18

視点4:比較

見たい効果以外の条件が同じもので比較する

改正効果

時間効果 時間効果- = 改正効果

飲酒あり 飲酒なし

その他効果 その他効果

Page 55: Tokyor42_r_datamining_18

AGENDA

自己紹介 メディアにあふれるデータ

交通事故死亡データ まとめ

Page 56: Tokyor42_r_datamining_18

Enjoy!