the real world use of big data to change business

120
1 © Hortonworks Inc. 2011 – 2016. All Rights Reserved The real world use of Big Data to change business Kimihiko Kitase, Hortonworks Japan Hiroue Harada, Gruff, Inc.

Upload: hadoop-summit

Post on 07-Jan-2017

192 views

Category:

Technology


2 download

TRANSCRIPT

1 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

TherealworlduseofBigDatatochangebusiness

Kimihiko Kitase, Hortonworks JapanHiroue Harada, Gruff, Inc.

2 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

北瀬 公彦KIMIHIKOKITAsE

http://blogs.itmedia.co.jp/kkitase@kkitase

2016年6⽉、ホートンワークスジャパンに⼊社。ビッグデータの収集、蓄積、分析基盤製品のマーケティングを担当。⼊社前、⽶Data Science Dojoが開催するデータサイエンティスト養成講座に参加するも、全く畑の違う分野で悪戦苦闘。開き直って、初⼼者に優しいデータの利活⽤術をお伝えしようと考えている。

facebook.com/kkitase

3 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

4ZBDATA

MOBILEDEVICES

HUMANCONTENT

INTERNETOFTHINGS

44ZBDATA

Source:http://www.emc.com/leadership/digital-universe/2014iview/executive-summary.htm

4 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

出所:第27回産業競争⼒会議 2016.5

政府は2016年5⽉19⽇、第27回産業競争⼒会議を開催し、名⽬国内総⽣産(GDP)600兆円に向けた成⻑戦略(「⽇本再興戦略2016」)の素案を公表しました。

新たな有望成⻑市場の創出では、IoT・ビッグデータ・AI・ロボットなどによる第4次産業⾰命の実現で2020年には30兆円の付加価値創出を⽬指しています。

⽇本再興戦略2016 〜第4次産業⾰命の実現〜

5 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

現⾏のシステムで受け⽌められますか?Ã 課題• データがアプリに固定化していてる• 新しいデータの受け⼊れが難しい• スケールするとコスト⾼

ビジネスの価値

クリックストリーム

Webデータ

Internet of Things

ドキュメント、メール

サーバーログ

⾳声・画像

2013年4 Zettabytes

2020年40 Zeta bytes

1

2 新しいデータ

ERP CRM SCM

新しいデータ

既存データ

新たなデータの多くは、Internet of Anythingとしてシステムとデバイス間のやり取りとして誕⽣します

6 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

企業のIT投資動向ほぼ横ばい

7 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

Hortonworksが提唱する「ConnectedDataPlatforms」

8 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

HortonworksDataPlatform

9 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

事例のご紹介

10 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

データ活⽤による新規ビジネスの展開

運転傾向・⾞の使⽤環境に基づいた柔軟な保険提案の実現

à Snapshot plug-in デバイスは運転の詳細を収集

à Progressiveは、1000万マイル以上の運転データを保存 (約1600万Km)

à Webアプリ経由で、顧客は⾃⾝の運転詳細を⾒ることができ、安全向上に努めることが可能

à Snapshotとusage-based insurance は2014年には、Progressiveに2.6 億ドルの貢献(約273億円)

Innovate

Renovate

Claims Notes Mining

Individual Driving

Histories

Usage-BasedInsurance (UBI)

Web LogAnalysis

Online AdPlacement

Sensor DataIngest

PREDICTIVEANALYTICS

A C T I V EA R C H I V E

D A T AD I S C O V E R

Y

D A T AD I S C O V E R

Y

D A T AD I S C O V E R

Y

E T LO N B O A R D

Safe Roads

既存データの可視化

データ拡充新規基盤構築

新規モデル作成 新規サービス提供

11 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

12 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

スマートメーター活⽤による新しいマーケティング・顧客サービスの導⼊

1.3 Million Smart Meters

EDW Offload

Mobile App for Customer Sites

Ingest 300 GB per Day

Product Cross-Sell

データ活⽤による新しい電⼒提供サービス

スマートメーターによるデータ量増加に対応した環境構築年数回の顧客訪問(検針)→13万個のスマートメーター数億円のDWHコスト最適化11時間かかっていたETL処理を45分に削減個客に応じた新たなサービス⾰新的サービスを主体としたビジネモデルに変⾰

Innovate

RenovateSmart,

Efficient Homes

D A T AD I S C O V E R

Y

D A T AE N R I C H M E N

T

P R E D I C T I V EA N A L Y T I C S

S I N G L EV I E W

A C T I V EA R C H I V E

E T LO N B O A R D

SINGLEVIEW

S I N G L EV I E W

P R E D I C T I V EA N A L Y T I C S

On-site customer data capture

Optimized engineering

schedule

Tailored servicing

Customer sentiment

既存環境の最適化・可視化

データ拡充 予測分析Data Discovery

新規サービス提供

13 © Hortonworks Inc. 2011 – 2016. All Rights Reserved

爆発するデータ容量に対応したサービス改善

Metadata Capture

Threat Predictions

Attacker Detection

Unified Security

Security LogAnalysis

Threat Archive

Device Data Ingest

Threat Detection

Legacy Offload

Data Science Speeds Time to Protection

à 脅威検出時間が4時間から2秒にà 防御回数が5000倍にà 10ペタバイト以上のデータを

使って機械学習した結果、脅威予測が可能に

à AmbariとCloudbreakを使ってクラスターを管理

Innovate

Renovate

Digital Security

PREDICTIVEANALYTICS

E T LO N B O A R D

D A T AD I S C O V E R

Y

D A T AD I S C O V E R

Y

D A T AD I S C O V E R

YE T L

O N B O A R DE T L

O N B O A R D

A C T I V EA R C H I V E

P R E D I C T I V EA N A L Y T I C S

S I N G L EV I E W

Proactive Safeguards

増え続けるセキュリティ攻撃に対応した新規基盤及びサービスレベルの改善

既存データの⾒える化及びデータ拡充

既存システムのオフロードコスト最適化

新規モデル作成新規データ活⽤

新規サービス提供

アナリスト

原⽥ 博植はらだ ひろうえ

わたしについて

⽇本経済新聞社データサイエンティスト・オブ・ザ・イヤー2015を頂きました <(_ _)>

講評:シンクタンク、外資ITベンチャー、リクルートにおけるデータサイエンス施策の実績および業種横断データサイエンス勉強会”丸の内アナリティクス”での啓蒙活動を評価

市場について

©2015ASATSU-DKINC.ALLRIGHTSRESERVED.

©2015ASATSU-DKINC.ALLRIGHTSRESERVED.

実務について

本⽇、データサイエンスの実務についてお話することは2つです

①案件のスコープと攻守を明確にし業務のコストとインパクトを精査すること

③戦⼒構想を可視化すること

①案件のスコープと攻守を明確にし業務のコストとインパクトを精査すること

事業モニタリング環境改善

データに基づく経営が困難

①データ内容が標準化されていない②データ活⽤が⾼速化されていない③データへのアクセスがオープン化されていない

①データ内容が標準化されていない

RAG

SalesforceHadoopマネジメント

集客

統括

企画

パートナー

エンジニア

営業

Hadoop

RNN

Oracle

SiteCatalyst

Adobe

データ

データ

RAG

SalesforceHadoopマネジメント

集客

統括

企画

パートナー

エンジニア

営業

Hadoop

RNN

Oracle

SiteCatalyst

Adobe

データ

データ

RAG

SalesforceHadoopマネジメント

集客

統括

企画

パートナー

エンジニア

営業

Hadoop

RNN

Oracle

SiteCatalyst

Adobe

データ

データ

RAG

SalesforceHadoopマネジメント

集客

統括

企画

パートナー

エンジニア

営業

Hadoop

RNN

Oracle

SiteCatalyst

Adobe

データ

データ

RAG

SalesforceHadoopマネジメント

集客

統括

企画

パートナー

エンジニア

営業

Hadoop

RNN

Oracle

SiteCatalyst

Adobe

データ

データ

編集記事流⼊率

3.78%

項⽬ ツール KPI

Hadoop

編集記事流⼊率

項⽬ ツール KPI

2.64%サイカタ

編集記事流⼊率

3.78%

項⽬ ツール KPI

2.64%

Hadoop

サイカタ

①データ内容を標準化✔

RAG

SalesforceHadoopマネジメント

集客

統括

企画

パートナー

エンジニア

営業

Hadoop

RNN

Oracle

SiteCatalyst

Adobe

データ

データ

日次

表示

帳票出力

DWH

BIツール

RAG

RNN

SiteCatalyst

Hadoop

Hadoop

データ

データ整形

データ

データエンジニア

マネジメント

集客

統括

営業

企画

パートナー

✔データ内容を標準化Salesforce

Oracle

Adobe

編集記事流⼊率

3.78%

項⽬ ツール KPI

2.64%

Hadoop

サイカタ

✔データ内容を標準化

編集記事流⼊率

3.78%

項⽬ ツール KPI

BI

②データ活⽤が⾼速化されていない

RAG

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

実績報告を指示

RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

タ抽出依頼

実績報告を指示

RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

タ抽出依頼

実績報告を指示

RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

タ抽出依頼

実績報告を指示

アドホックレポ

RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

タ抽出依頼

実績報告を指示

アドホックレポ

定型レポ

ト RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

集計依頼1/7(⽉)10:00

集計依頼1/7(⽉)10:00

定義1/8(⽕) 16:00

集計依頼1/7(⽉)10:00

ローデータ抽出

1/9(⽔)10:00

定義1/8(⽕) 16:00

集計依頼1/7(⽉)10:00

ローデータ抽出

1/9(⽔)10:00

定義1/8(⽕) 16:00

抽出完了1/11(⽉) 18:00

集計依頼1/7(⽉)10:00

ローデータ抽出

1/9(⽔)10:00

定義1/8(⽕) 16:00

抽出完了1/11(⽉) 18:00

※認識違いによる⼿戻りも頻発

集計依頼1/7(⽉)10:00

ローデータ抽出

1/9(⽔)10:00

データ成型1/11(⽉) 18:

00

定義1/8(⽕) 16:00

抽出完了1/11(⽉) 18:00

※認識違いによる⼿戻りも頻発

集計依頼1/7(⽉)10:00

ローデータ抽出

1/9(⽔)10:00

データ成型1/11(⽉) 18:

00

レポート受け取り

1/13(⽔)

定義1/8(⽕) 16:00

抽出完了1/11(⽉) 18:00

※認識違いによる⼿戻りも頻発

集計依頼1/7(⽉)10:00

ローデータ抽出

1/9(⽔)10:00

データ成型1/11(⽉) 18:

00

レポート受け取り

1/13(⽔)

定義1/8(⽕) 16:00

抽出完了1/11(⽉) 18:00

※認識違いによる⼿戻りも頻発

②データ活⽤を⾼速化✔

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

タ抽出依頼

実績報告を指示

アドホックレポ

定型レポ

ト RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

日次

表示

帳票出力

DWH

BIツール

RAG

RNN

Hadoop

Hadoop

データ

データ整形

データ

データエンジニア

マネジメント

集客

営業

企画

パートナー

✔データ活⽤を⾼速化

SiteCatalyst

統括

Salesforce

Oracle

Adobe

集計依頼1/7(⽉)10:00

ローデータ抽出

1/9(⽔)10:00

データ成型1/11(⽉) 18:

00

レポート受け取り

1/13(⽔)

定義1/8(⽕) 16:00

抽出完了1/11(⽉) 18:00

※認識違いによる⼿戻りも頻発

集計依頼1/7(⽉)10:00

レポート受け取り1/8(⽔)

BI1/7(⽉) 10:00

✔データ活⽤を⾼速化

③データへのアクセスがオープン化されていない

RAG

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

タ抽出依頼

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

タ抽出依頼

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

タ抽出依頼

タ抽出依頼

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

タ抽出依頼

タ抽出依頼

タ抽出依頼

Salesforce

統括 Oracle

SiteCatalyst

Adobe

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

タ抽出依頼

タ抽出依頼

タ抽出依頼

タ抽出依頼

Salesforce

統括 Oracle

SiteCatalyst

Adobe

③データへのアクセスをオープン化✔

RAG

プログラミングで抽出

Hadoopマネジメント

集客

企画

パートナー

エンジニア

営業

Hadoop

RNNデータ

データ

タ抽出依頼

タ抽出依頼

タ抽出依頼

タ抽出依頼

Salesforce

統括 Oracle

SiteCatalyst

Adobe

日次

表示

帳票出力

DWH

BIツール

RAG

RNN

Hadoop

Hadoop

データ

データ整形

データ

データエンジニア

マネジメント

集客

営業

企画

パートナー

✔データ活⽤を⾼速化

SiteCatalyst

統括

Salesforce

Oracle

Adobe

マネジメント

企画

営業

集客

✔経営ボードと達成率をリアルタイムで監督できる✔未達成要因特定のためのドリルダウンが容易になる✔経⽬のために過去データ・予測データを活⽤できる

✔データの活⽤で施策の効果検証を精緻化できる✔施策ごとの効果測定サイクルが早く回る

✔現状のお客様向けレポートを強化できる✔チームKPIの変更にも迅速に対応できる

✔集客コストの予算調整が短スパンでできる✔時系列把握で改善指標の⾒極めが正確になる

✔データへのアクセスをオープン化

データサイエンス組織設⽴に向けた業務のコストとインパクトの可視化

テーマ 評価指標 下期⽬標

施策施策の成果額(売上・コスト改善)×関与度=貢献額(円) ―

施策数 4本

分析意思決定の⼤きさ(⾦額効果)×関与度=貢献額(円) ―意思決定の⼤きさ(影響組織)×関与度=貢献度(pt)分析提供数 10本

運⽤意思決定の⼤きさ(⾦額効果)×関与度=貢献額(円) ―

意思決定の⼤きさ(影響組織)×関与度=貢献度(pt) ―

基盤 基盤構築は①②③の前提となるので評価はしない ―

②③④

関与度 考え⽅ 事例

1% ビジネス検討のための集計依頼に対応 バックログ依頼(スポット)

5% 抽出データ要件定義とデータ整形と運⽤設計 メジャメントシート

20%

分析モデル・マネジメントツール作成と利⽤部⾨への導⼊・展開(VBAなどのツール開発を含む)

CA求職者モニタリングシート

仮説設定から利⽤部⾨に伴⾛し、分析モデルの導⼊と展開 Nプロためスタ

⾼度なデータ分析モデル構築を伴った意思決定⽀援 DB横断差配

50%施策の全体設計に対するデータディレクションを含むコンサルティング業務 採⽤成功⽅程式

分析のレポーティングについて蹴り出しから抽出・集計・分析・計算・成型業務までの⼀貫着⼿ ―

影響組織 考え⽅ 事例

1pt 営業⼈員やMPの対象⼈数⼀⼈当たりへの貢献 バックログ依頼(スポット)

5pt G配下のユニットやチームへの貢献 メジャメントシート改善

20pt G全体への本格導⼊、業務フローへの装着完了 CA求職者モニタリングシート

100pt 部全体への業務⽀援、部署の戦略に係る意思決定⽀援業務 ―

500pt 統括部への業務⽀援、部署の戦略に係る意思決定⽀援業務 採⽤成功⽅程式

1000pt 本部への業務⽀援、部署の戦略に係る意思決定⽀援業務 ―

採⽤⽅程式Suiteを使った提案/使わなかった提案でKPI:推薦数純増を追う。付属的に、事業側KPI推薦網羅率50%の引き上げ、決定数=決定額の純増を⽬標とする。

【試算上換⾦化売上】

課題ヒアリング、プロセスデータの分析によりスコープ/⽬標設定。ツール開発の実装・現場導⼊⽀援のすべての⼯程に関与する。

概要

DSGの関与

第2営業統括部利⽤組織

換⾦価値30.59億成果額

事業貢献額 = 施策の成果額or利⽤組織 × 関与度施策の成果額:推薦純増30.59億円

× 50%250Pt =

※2営決定数1981件への推薦網羅率7%UP+新規推薦ゼロ求⼈4,000件/⽉中55%の条件緩和成功の合算※決定率は2営実績の1.95%/決定単価は2営実績123.3万で試算

× 50%15.29億円 =対象組織:統括部500pt

①案件のスコープと攻守を明確にし業務のコストとインパクトを精査すること

③戦⼒構想を可視化すること

③戦⼒構想を可視化すること

事業課題設定⼒

分析テーマ設定⼒

サービス導⼊⼒

分析⼒分析⼒

(統計解析)データ抽出⼒

(HQL)Hadoop環境理解データ

構造理解

データ分析の組織装着

専⾨組織型

1年間、分析だけをして報酬をもらっている独⽴採算情報システム部内へ組織を異動、事業接点を強める基盤の改善や、業務⽀援ツールなどは関わらない

総研系データサイエンスセンター

本社ガス事業部 リビング

事業部

情報システム部

事業接点事業接点 分社型ビジネスR&Dライン

メリット 専⾨組織のため分析⼒は⾼いデメリット チームの提供機能は分析のみで基盤や運⽤連携薄い

本社/グループ会社

マーケティング部⾨

コーポレート情報システム社(システム部⾨)

分析企画データ解釈、分析評価、モデル適⽤分析推進分析実⾏、⼿法やツールの社内展開データ管理データ結合、管理、提供

商品開発部⾨SCM部⾨顧客サポート部⾨R&D部⾨

連携

システム部⾨型

システム部⾨であるコーポレート情報システム⽀社にデータ分析の企画、グループ/社内展開、データ管理の部隊を整備していく計画

メリット システム部⾨のためデータ管理や運⽤までサポートデメリット 別会社のため関与度は浅い

開発

サービス施策ターゲット

カスタマサービスGデータチーム

■施策企画データ解釈、評価、モデル適⽤

カスタマー側

就活プラットフォーム

実装

カスタマWEB型

分析者はウェブ開発のディレクター的な動きカスタマサービスG内にデータTを配置チームメンバー5名がCS側・就活PFなどの案件を検討

PTN

協働

協働

協働

メリット MP起点なのでビジネスゴールを⾒据えた分析取組デメリット 基盤・運⽤は別組織なので抜本的な進化は遂げにくい

ハイブリッド型

企画者と分析者と開発者が同⼀チーム化し⾼速連携。全⽅位に機能提供を磨きかつ施策も⾃発するアルゴリズムの実装までをスコープとしている

統括G

データサイエンスG施策企画データ解釈、分析評価、モデル適⽤

分析推進分析実⾏、⼿法やツールの社内展開

データ管理データ結合、管理、提供

集客G

開発G

PFG

企画部

連携

基盤開発アーキテクチャ検討、検証、要件定義

事業接続

実装

運営

営業

集客

メリット データ分析の全ての機能を提供可能デメリット 全ての機能を持っているが全体の底上げが必要

専⾨組織型 システム部⾨型 カスタマWEB型 ハイブリッド

提供範囲の広さ

△⾜で施策余地を探し個別検討

◎グループの全ての機能部署に提供

×分析者起点が基本

◎全⽅位に機能提供を磨きかつ施策も⾃発する

提供先とのリレーションの作りやすさ

◎着⼿案件の事業部に情シス経由で⼊り込む

×受け⾝が基本

○企画者と分析者が同⼀⼈格に近い

◎企画者と分析者と開発者が同⼀チームで⾼速連携

分析の実⾏レベル

〇分析のみを担当

○情シスとして関われる範囲内で提供

△企画者として検証と提案

◎アルゴリズムの実装までをスコープとしている

HR RAG

RIND

①_受注データ・窓口別・RCA組織別・商品別  ・・・等

CALIB

C ALIB

SC

②_2_求職者データ・エントリー実績

・属性・紹介案件実績・決定実績  ・・・等

②-1_受注データ・窓口別・RCA組織別・求人別

・進捗(プロセス)別  ・・・等

カスタマ

④_サイト訪問者データ・流入経路

・流入者属性(PC、スマホ、etc)・回遊ログ

・イベントCVR  ・・・等

HADO O P

クライアント

③_・会員ステータス(属性含む)

・求人検索履歴・会員アクションデータ(応募、説明会等のイベント申込みログ)

・決定実績  ・・・等

※現時点では、RNNサービスログがメイン。  斡旋データは今後接続強化予定

Level4

・すべてのビュー、マスタについて熟知している。 -各データ項目の定義 -更新タイミング -例外事項

Level3

・自身の業務に使用するビューについて熟知している。 -各データ項目の定義 -更新タイミング -例外事項

Level2

・ビューの種類について概ね理解している。 -ビューとは何か -ビューの種類 -ビュー含まれる情報

Level1

・Rindにどのような事業データが格納されているか知っている。 -システム概要 -接続方法 -接続に関しての最低限のルール

・基本的な操作ができる。 -テーブルリンクの設定 -Excelエクスポート -既存ツールや既に組まれているクエリの更新

・単一テーブルからデータを抽出できる。 -テーブル、クエリの作成 -データ項目、抽出条件の設定

・複数テーブルを組み合わせてデータを抽出できる。 -システム概要 -接続方法 -接続に関しての最低限のルール

・汎用性のあるデータ抽出ツール作成できる。 -レポート、フォームの作成 -マクロ、VBAの作成

Level1 Level2 Level3 Level4

ルール

ツール

目標スコア

領域企画 RNN GR T

①RIN D 2.00 2.00 2.00②C ALIB 3.00 1.00 2.00③H adoop 1.33 1.67 1.50④SC 1.00 2.00 1.50

現状領域企画 RNN G

R T①RIN D 2.00 2.00 2.00②C ALIB 3.00 1.00 2.00③H adoop 1.33 1.67 1.50④SC 1.00 1.00 1.00

G AP領域企画 RNN G

R T①RIN D 0.00 0.00 0.00②C ALIB 0.00 0.00 0.00③H adoop 0.00 0.00 0.00④SC 0.00 -1.00 -0.50

データマップ スキルマップ スキルスコア

HR RAG

RIND

①_受注データ・窓口別・RCA組織別・商品別  ・・・等

CALIB

C ALIB

SC

②_2_求職者データ・エントリー実績

・属性・紹介案件実績・決定実績  ・・・等

②-1_受注データ・窓口別・RCA組織別・求人別

・進捗(プロセス)別  ・・・等

カスタマ

④_サイト訪問者データ・流入経路

・流入者属性(PC、スマホ、etc)・回遊ログ

・イベントCVR  ・・・等

HADO O P

クライアント

③_・会員ステータス(属性含む)

・求人検索履歴・会員アクションデータ(応募、説明会等のイベント申込みログ)

・決定実績  ・・・等

※現時点では、RNNサービスログがメイン。  斡旋データは今後接続強化予定

ルール(X軸)4レベル、ツール(Y軸)4レベルでメンバーをプロット

Level4

・すべてのビュー、マスタについて熟知している。 -各データ項目の定義 -更新タイミング -例外事項

Level3

・自身の業務に使用するビューについて熟知している。 -各データ項目の定義 -更新タイミング -例外事項

Level2

・ビューの種類について概ね理解している。 -ビューとは何か -ビューの種類 -ビュー含まれる情報

Level1

・Rindにどのような事業データが格納されているか知っている。 -システム概要 -接続方法 -接続に関しての最低限のルール

・基本的な操作ができる。 -テーブルリンクの設定 -Excelエクスポート -既存ツールや既に組まれているクエリの更新

・単一テーブルからデータを抽出できる。 -テーブル、クエリの作成 -データ項目、抽出条件の設定

・複数テーブルを組み合わせてデータを抽出できる。 -システム概要 -接続方法 -接続に関しての最低限のルール

・汎用性のあるデータ抽出ツール作成できる。 -レポート、フォームの作成 -マクロ、VBAの作成

Level1 Level2 Level3 Level4

ルール

ツール

【領域企画統括部 Hadoopスキルマップ】

Level4

商品全体の業務において必要なデータの在り処、データの保持⽅法、各データの意味についても熟知している。

具体例:Nプロ実績集計の要件定義から、各施策に必要な検証データの集計、⽅針設計について主体的に動くことができる

Level3

⾃⾝のG業務に必要なデータ保持⽅法、抽出⽅法について、Gの中⼼となって実動・⽅針設計できる。

具体例:スカウトオファーの時系列実績データやカスタマ属性毎のスカウトオファー実績取得について、要件定義から実働できる

⼭⽥ 太郎⼭⽥ 太郎⼭⽥ 太郎⼭⽥ 太郎

Level2⾃分の担当業務と紐づいているデータのありかを知っている

具体例:Nプロオファーのアクションデータ、SKS検索軸に使われるカスタマ属性データの取得元を知っている

かもめ 花⼦⼭⽥ 太郎

かもめ 花⼦かもめ 花⼦

⼭⽥ 太郎⼭⽥ 太郎

Level1事業プロセスとHadoopデータのつながりを知っている

具体例:事業ログのうち、Nプロ系のアクションデータやSalesforceデータが連携されていることを知っている

かもめ 花⼦かもめ 花⼦

かもめ 花⼦かもめ 花⼦

・ログインしてHQL記述を要さない範囲の操作ができる。

・単⼀スキーマからデータを抽出できる。 ・複数スキーマを組み合わせて

データを抽出できる。・他Gに提供できるレベルのロジック構築・データ抽出ができる。

Level1 Level2 Level3 Level4

ツール

企画G

企画G

【領域企画統括部 Hadoopスキルマップ】

Level4

商品全体の業務において必要なデータの在り処、データの保持⽅法、各データの意味についても熟知している。

具体例:Nプロ実績集計の要件定義から、各施策に必要な検証データの集計、⽅針設計について主体的に動くことができる

Level3

⾃⾝のG業務に必要なデータ保持⽅法、抽出⽅法について、Gの中⼼となって実動・⽅針設計できる。

具体例:スカウトオファーの時系列実績データやカスタマ属性毎のスカウトオファー実績取得について、要件定義から実働できる

Level2⾃分の担当業務と紐づいているデータのありかを知っている

具体例:Nプロオファーのアクションデータ、SKS検索軸に使われるカスタマ属性データの取得元を知っている

Level1事業プロセスとHadoopデータのつながりを知っている

具体例:事業ログのうち、Nプロ系のアクションデータやSalesforceデータが連携されていることを知っている

・ログインしてHQL記述を要さない範囲の操作ができる。

・単⼀スキーマからデータを抽出できる。 ・複数スキーマを組み合わせて

データを抽出できる。・他Gに提供できるレベルのロジック構築・データ抽出ができる。

Level1 Level2 Level3 Level4

ツール

集客G

集客G

企画G

企画G

開発G

開発G

統括G

統括G

事業開発

事業開発

目標スコア

領域企画 RNN G Nプロ企画G RAN G 斡旋開発G 集客編集G RFD GR T R T R T R T R T R T

①RIN D 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00②CALIB 3.00 1.00 2.00 1.00 1.00 1.00 2.56 2.00 2.28 1.00 1.00 1.00③Hadoop 1.33 1.67 1.50 1.00 1.00 1.00 2.57 2.00 2.29 1.20 1.60 1.40 1.00 1.00 1.00 1.63 2.38 2.00④SC 1.00 2.00 1.50 1.43 2.00 1.71 0.00 0.00 0.00 1.40 1.80 1.60 1.17 1.33 1.25 2.13 3.38 2.75

現状領域企画 RNN G Nプロ企画G RAN G 斡旋開発G 集客編集G RFD G

R T R T R T R T R T R T①RIN D 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00②CALIB 3.00 1.00 2.00 1.00 1.00 1.00 2.56 2.00 2.28 1.00 1.00 1.00③Hadoop 1.33 1.67 1.50 1.00 1.00 1.00 1.43 1.43 1.43 1.00 1.20 1.10 1.00 1.00 1.00 1.38 1.50 1.44④SC 1.00 1.00 1.00 1.00 1.00 1.00 0.00 0.00 0.00 1.20 1.60 1.40 1.00 1.00 1.00 1.75 2.50 2.13

G AP領域企画 RNN G Nプロ企画G RAN G 斡旋開発G 集客編集G RFD G

R T R T R T R T R T R T①RIN D 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00②CALIB 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00③Hadoop 0.00 0.00 0.00 0.00 0.00 0.00 -1.14 -0.57 -0.86 -0.20 -0.40 -0.30 0.00 0.00 0.00 -0.25 -0.88 -0.56④SC 0.00 -1.00 -0.50 -0.43 -1.00 -0.71 0.00 0.00 0.00 -0.20 -0.20 -0.20 -0.17 -0.33 -0.25 -0.38 -0.88 -0.63

最後に

⾚の⼥王仮説その場にとどまるためには、全⼒で⾛り続けなければならない。

⾃然選択進化して、進化して、進化してやっと現状維持。

natural selection

⾃ら機会を創り出し機会によって⾃らを変えましょう

(^ⅴ^)

ご清聴ありがとうございました!

原⽥ 博植

株式会社 グラフ