【スクー】業務改善のためのデータサイエンス
TRANSCRIPT
業務改善のためのデータサイエンス代表・最高解析責任者
倉橋一成
1
設立: 2011年 3月 24日 Web: http://ianalysis.jp/ 本社:東京都港区南青山 2-2-15 ウィン青山 取引先企業
◦ エーザイ株式会社、大鵬薬品工業株式会社、株式会社 gumi、大手自動車会社、大手人材サービス会社など
医療分野から始まり、多種多様な業種へ
実績◦ セミナー活動◦ コンサルティング
分析手法のアドバイス 分析環境作りのアドバイス
◦ 分析実務 調査データ分析によるインサイト抽出 売上データ分析による KPIの開発
◦ 分析のためのデータベース構築◦ 予測モデル開発
Web上の行動履歴データを使ったユーザーの属性予測
2
【本社エントランス】
【経歴】 東京大学 Ph.D (2011), Statistician, Data Scientist, Data Miner
【専門】cDNAマイクロアレイ、臨床試験データ、レセプトデータ、電子カルテ・医療オーダーデータ、マーケティングデータ
【スキル】R, SAS, SPSS, Visual C++, Ruby on Rails, Python
【主な実績】・ 2005: NPO日本臨床研究支援ユニット、解析担当 腎臓癌患者の調査データの解析 (SAS)
レセプトデータの解析と結果のレポーティング (R)
・ 2007、 2009:スタットコム株式会社、統計解析者 小児癌の臨床試験のプロトコルに沿った解析とレポーティング 術後乳癌患者の QOLに関する研究の解析と統計アドバイス
・ 2009~ 2010:帝京大学、医師への統計コンサルタント 論文化にあたっての医師へのアドバイスと解析 様々な科の医師に対してのコンサルタント(内科、外科、眼科など)スタットコム株式会社、統計解析者
・ 2010:キャピタルメディカ株式会社、プロジェクトメンバー レセプトデータを活用した新規プロジェクトの立ち上げメンバー
・ 2011: iAnalysis合同会社 設立※Twitter: @isseing333
※blog: 「おとうさんの解析日記」 http://d.hatena.ne.jp/isseing333/
最高解析責任者:倉橋一成( issei Kurahashi)
3
データサイエンスとは?
ローデータ(生データ):集計前のデータ◦ エクセルの表をイメージ◦ 1つのシートが、 1つのデータ
ローデータを集計した値も「データ」◦ 平均年齢○○歳、平均年収○○万円
データとは?
5
ID 年齢 身長 体重 …
1 20 165 60 …
2 43 178 73 …
3 36 163 57 …
... ... ... ... …
行:レコード
列:変数、項目
データ分析を行う「データサイエンティスト」の必要能力
6
学問知識学問知識 エンジニアリングエンジニアリング
ビジネス感ビジネス感
実務経験マーケティング経営企画
統計学機械学習
データベースプログラミング
能力の身に付け方は?
7
大学の講義 本 実戦 セミナー
1.学問知識統計学系:少機械学習系:多
データサイエンス本
統計検定CodeIQ
おしゃスタTokyoWebmi
ningTokyoR
2.エンジニアリング
情報学系学科工学系学科
DB系、プログラミング系の本
コンテストアプリ実装
3.ビジネス感 経済系学科『分析力を武器とする企業』
業務経験 各種研修
公開されているデータを使う◦ 国が公開しているデータ◦ Twitter、 Facebookなどのデータ
分析を行なっている会社で働く◦ 各企業の分析部門、マーケティング部門◦ 分析専門会社
分析のコンテストをやってみる◦ KDD◦ KAGGLE
詳しくは「理系ナビ」でのセミナー資料◦ http://www.slideshare.net/isseing333/ss-13690717
実際にデータを分析してみるのが一番の近道
8
9
データ分析の流れ
10
ビジネスインテリジェンス
( BI)
ビジネスアナリティクス( BA)
Phase I データの加工・収集
11
DBの加工
ERP
CRM
ETLツールバッチ処理・抽出・変換・ロード
DWHデータマート・集約
・絞り込み販売生産在庫
Phase I データの加工・収集
12
エクセルの加工
Phase I データの加工・収集
13
エクセルの加工
人口
総数 男 女
未成年 成年 未成年 成年 未成年 成年.. .. .. .. .. ..
.. .. .. .. .. ..
.. .. .. .. .. ..
人口 _総数 _未成年 人口 _総数 _成年 人口 _男 _未成年 人口 _男 _成年 人口 _女 _未成年 人口 _女 _成年
.. .. .. .. .. ..
.. .. .. .. .. ..
.. .. .. .. .. ..
14
Phase II データの可視化、集計
BIツール
15
16
データに様々な「モデル」を当てはめて、情報を探索する
Phase III モデル作成
BAソフト、分析ソフト
17
18
データ分析成功事例
トップダウン(近道)◦経営層が分析プロジェクトを計画◦人材を確保しプロジェクトを進める
ボトムアップ◦それぞれの部署で何か成果を上げる◦なるべく多く溜まっている部門でデータを分析する◦会社の利益に直結する分析を行う
社内での分析プロジェクトの推し進め方
19
データ分析の活用例
20
売上アップ◦最適なプライシング◦会員の離脱を防ぐ◦新商品の開発
コスト削減◦広告の最適化◦在庫管理・サプライチェーン最適化◦人事:離職率低下のための分析◦財務:M&A・投資
事例:鉄鋼製造会社( Rocky Mountain Steel Mills)
21
課題
鋼管製造の再開を検討。しかし意思決定のためのコスト分析の信頼性が低いと感じていた。
2005年に価格競争のためシームレス鋼管製造を打ち切ったが、原油価格が高騰したために原油採掘会社からの需要が高まった。
背景
分析
プロフィット・インサイトという分析ソフトを導入し、工場を再稼働させるべきかどうか分析結果をみながら毎月検討。12月に損益分岐点を超え、さらに予測モデルによってその後も価格上昇が見込まれる状況になって初めて、製造の再開を行った。
成果
早期に生産再開した場合の損失 4300万ドルを回避
事例:金融・クレジット会社(キャピタル・ワン)
22
1990年代、「情報ベース戦略」を打ち立てる。「まだ顔を見たことない 2億の人達について情報を集め、集めた情報を基にして、長期的な作戦を練る」
背景
分析
データベースの整備、分析などを精緻に行うことで、 「高額の商品をあっさりクレジットで買い、長期にわたってゆっくり返済する客」が最も優良顧客であることが判明。
成果
業界で初めて「リボルビング機能」をカードに搭載し、新商品開発につながった。
現在では 1日に 300回のマーケティング調査。譲渡性預金の利息、ロールオーバーのための優遇措置、最低必要残高などと、顧客定着率との間にはっきりとした関係があることが判明。→定着率の 87%アップ、新規顧客開拓コストの 83%ダウン
データ分析の PDCA
23
ぜひデータ分析を活用して業務アップに役立てて下さい!
ホームページ: http://ianalysis.jp/ Twitter: https://twitter.com/iAnalysisLLC Facebook: http://www.facebook.com/ianalysis メルマガ
◦ データマイニングのすすめ: http://staff.ianalysis.jp/neo/usrctrl.php?mag_id=1
◦ データマイニング・アンド・ザ・シティ: http://staff.ianalysis.jp/neo/usrctrl.php?mag_id=2
ブログ◦ おとうさんの解析日記: http://d.hatena.ne.jp/isseing333/◦ iAnalysisブログ: http://d.hatena.ne.jp/iAnalysis/
CodeIQ問題: https://codeiq.jp/ace/kurahashi_issei/
iAnalysisの情報発信場所
25