米国におけるデータサイエンスの動向 〜学生の目から見た …...26 sas global...

39
米国におけるデータサイエンスの動向 〜学生の目から見た SAS Global Forum 〜 慶應義塾大学大学院 健康マネジメント研究科 西村 志織 林 亮子 2017/7/14 データビジネス創造コンソーシアム 9回勉強会資料 1

Upload: others

Post on 19-Sep-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

米国におけるデータサイエンスの動向

〜学生の目から見た SAS Global Forum 〜

慶應義塾大学大学院健康マネジメント研究科

西村志織

林亮子

2017/7/14 データビジネス創造コンソーシアム

第9回勉強会資料

1

Page 2: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

全体の流れ

1. 自己紹介、SAS Global Forum の感想

2. SAS Global Forum を通して私が感じたこと

〜データのビジュアル化と利用者のデータリテラシー〜

スピーカー:林 亮子

3. 米国のデータサイエンティストを取り巻く環境と自身への影響

スピーカー:西村 志織

2

Page 3: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

1. 自己紹介、SAS Global Forum の感想

2. SAS Global Forum を通して私が感じたこと

〜データのビジュアル化と利用者のデータリテラシー〜

スピーカー:林 亮子

3. 米国のデータサイエンティストを取り巻く環境と自身への影響

スピーカー:西村 志織

3

Page 4: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

自己紹介

所属

慶應義塾大学大学院

健康マネジメント研究科

医療マネジメント専修 修士2年

これまでの経歴

慶應義塾大学 看護医療学部 卒業

(看護師免許)

現在の研究内容

レセプトデータを用いた

糖尿病患者の予後に関する研究

関心領域

データサイエンス 医療政策 医療経営

Global Forumに参加した動機

• 「今しかできないことに挑戦したい!」

• 「本場米国の医療分野のDSの取り組みをこの目で見てみたい!」

データサイエンスとのかかわり

• 大学では疫学のみ

• 大学院で初めてデータサイエンスの授業を受ける

今後の進路

将来はデータに基づいて医療分野の課題を解決したい

林 亮子

4

Page 5: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

自己紹介

所属

慶應義塾大学大学院

健康マネジメント研究科

医療マネジメント専修 修士2年

NPO法人 STEM Leaders

これまでの経歴

早稲田大学 政治経済学部 経済学科卒

現在の研究内容

レセプト・健診結合データを用いた双極性障害に関する研究

関心領域

データサイエンス メンタルヘルス

SAS Global Forumに参加した動機

• 海外で学びを得る機会

• データサイエンスの活用範囲をみてみたい

データサイエンスとのかかわり

• 大学院でデータサイエンスの授業、TA

• 現在の研究

• NPOでの活動(6月より)

• データビジネス創造コンテスト

今後の進路

ヘルスケア領域の

データサイエンティスト

西村志織

5

Page 6: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

SAS Global Forumに参加して感じたこと

SAS Global Forum全体を通じて

• 想像以上に華やか、祭典

• 5,000人規模の参加者みんながデータサイエンス関連の人

• ネットワーキング促進のための配慮

• 企業が主催するカンファレンスに学生登壇のセッションがある

社会課題への適用も

• 音でグラフを人に伝える機能

• 学生発表テーマの一つに「銃」問題

6

Page 7: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

SAS Global Forumに参加して感じたこと

データサイエンス・ビッグデータの活用範囲

• 身の回りにあふれていることに驚き

• 企業の収益向上だけでなく社会貢献(Data for Good)できることは

興味深い

ヘルスケア領域のデータ利活用促進

• データ利活用の日米差について考えさせられた

• 米国での取り組み

7

Page 8: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

8

Page 9: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

医療関連データの日米比較<米国>

Environmental

Exposure Data

Medical

History Genetic Data

Survey Data

Birth Data

Cancer Registry

Data

Mortality Data

Biologic Samples

Immunization

Data

Pharmacologic

Data

Mobile

Computing

Inpatient and

Outpatient Care

「Using Proc (Survey)Logistic and Weighting of Public Use Data in the Classroom」より作成.

Demographic Data

9

Page 10: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

医療関連データの日米比較<日本>

医療用ID

(マイナンバー制度のインフラ活用による)

特定健診・保険指導

介護レセプトデータ

調剤データ医科レセプトデータ

今後➢ 2020年~本格運用予定

現状

「日本再興戦略」2016より作成. 10

Page 11: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

1. 自己紹介、SAS Global Forum の感想

2. SAS Global Forum を通して私が感じたこと

〜データのビジュアル化と利用者のデータリテラシー〜

スピーカー:林 亮子

3. 米国のデータサイエンティストを取り巻く環境と自身への影響

スピーカー:西村 志織

11

Page 12: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

アジェンダ

1. データサイエンスの活用領域紹介

-SAS Global Forumで聞いたセッションをもとに-

2. 特に興味深いと思った事例紹介

「GatherIQ」

「Reemo」

3. 参加したことで私が影響を受けたこと

12

Page 13: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

SGFで見聞きした、データサイエンスの活用領域まとめ

領域 事例

Healthcare • ウェアラブルデバイス「Reemo」で生活の質を向上• 公的データで慢性疾患と精神疾患との併発率に関する研究

Service• Airbnbの価格最適化• 気象データを用いて、Uberアプリのタクシー利用率を向上

Finance • 顧客の解約リスクを予測

Sports • バスケットボールの試合結果の予測

Manufacturering

Insurance

Education

データサイエンスの活用領域は、多岐に渡る

13

Page 14: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

ビジュアル化 ×人道支援

事例1 『GatherIQ』

14

Page 15: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

事例1 一般市民が人道的問題を解決

「GatherIQ」

移民や災害など人道的課題解決のためのクラウドソーシング

• 国際移住機関(IOM): データ提供

• SAS: SAS Visual Analytics※の提供

• 一般市民: これらを活用して、知恵を出し合う

💡興味深いと思った点

Point1. インタラクティブなやり取り

Point2. データ分析をより手軽に

Point3. データが議論を呼び起こす

Point4. データサイエンスによる社会貢献

※ SAS Visual Analytics:データのビジュアライゼーション(視覚化)に特化したデータ分析ツール

15

Page 16: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

事例1 解決のために知恵を出し合う

活用成果• 2013年にフィリピンで起きた台風の襲撃後に、危険な状況にある避難所(過密具合、飲み水の

衛生問題、がれきの処理問題)等をマップ上で確認できるようにしたことで、支援が最も必要とされている地域に、効率的に支援することに貢献した

データ集計

シェア

議論

マッピング

16

Page 17: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

データリテラシー ×ライフログ

事例2 『Reemo』

17

Page 18: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

NEXT GENERATION

GFで聞いたセッションタイトル

「Analytics of Healthcare Things IS THE Next Generation

of Real World Data」

By Joy King, Teradata Corporation

「ヘルスケア業界におけるIoTとアナリティクスの活用によって、

リアルワールドデータが次のステージにすすむ」

18

Page 19: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

事例2 高齢者の生活の質を向上

「Reemo」

高齢者の生活の質向上を目的としたウェアラブルデバイス

• 扱うデータは患者の心拍数、睡眠時間、運動量等

• タブレット端末上で自分のデータを可視化

• メディカルセンターと提携

• Reemoデータをその他の関連データと組み合わせて、

独自のリスク指標を作成、デバイス画面でリスク警告

💡興味深いと思った点

ポイント1. 患者のみならず医師も治療に活用

ポイント2. フィードバックが得られる

出典:https://twitter.com/reemohealth/

status/684414647475163136

19

Page 20: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

事例2 実生活のデータを患者も医療者も活用

データ利活用促進のためには、利用者側にもデータリテラシーが必要では?

http://reemohealth.com/how-reemo-works/ より

20

Page 21: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

SGFに参加して、影響を受けたこと

自身の進路選定へ大きな影響

• 社会貢献というデータ活用目的に共感

• 分析業から、分析結果を現場に活かす職業へと興味関心が移った

データ利活用実現への新たな考え方

• データを ‶分析する側” から ‶活用する側” へ視点の変化

• データのビジュアル化が重要

• 利用者側のデータリテラシーの向上が重要では

• 教育課程でそれを学ぶ機会が必要では

21

Page 22: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

参考

• Reemohealthcare

http://reemohealth.com/

• SAS Visual Analytics

https://www.sas.com/ja_jp/software/business-intelligence/visual-analytics.html

• 日本再興戦略2016

http://www.kantei.go.jp/jp/singi/keizaisaisei/pdf/2016_zentaihombun.pdf

22

Page 23: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

1. 自己紹介、SAS Global Forum の感想

2. SAS Global Forum を通して私が感じたこと

〜データのビジュアル化と利用者のデータリテラシー〜

スピーカー:林 亮子

3. 米国のデータサイエンティストを取り巻く環境と自身への影響

スピーカー:西村 志織

23

Page 24: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

米国のデータサイエンティストをとりまく環境と自身への影響慶應義塾大学大学院健康マネジメント研究科

西村志織

24

Page 25: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

アジェンダ

1. SAS Global Forumで印象に残ったセッション

2. データサイエンス教育について見聞きしたこと

3. まとめ・SAS Global Forumが自身へ与えた影響

25

Page 26: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

印象に残ったセッション

変化する環境に適応する力を身につけないと生き残れない

大学としてサポートできること

専門スキル:数学、統計学、コンピュータサイエンス など

潜在的なスキル:複雑な問題の解決に役立つ思考スキル

→変化し続ける環境に適応する能力につながる

民間セクターと大学のコラボレーションの重要性

学問分野においてデータサイエンスはどのようにして発展しているかーまたは消滅の危機に瀕しているかー

Jennifer Lewis Priestley, Ph.D. Kennesaw State University

26

Page 27: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

SAS Global Forumに参加する際の問題意識

1.データサイエンスの活用フィールドは?→林さんからの事例紹介

2.アメリカがデータサイエンス先進国なのはなぜなのか?

参加するに際して、興味深いチャートをみつける

27

Page 28: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

データ分析のトレーニングを受けた大学卒業生の数(2008年)

1.25

1.84

3.32

3.4

4.9

4.97

7.77

8.34

8.78

10.09

12.3

13.27

17.41 24.73

0 5 10 15 20 25

オランダ

トルコ

ドイツ

日本

イタリア

ルーマニア

フランス

イギリス

ポーランド

ブラジル

ロシア

インド

中国

アメリカ

Mckinsey Global Institute “Big data The next Frontier for innovation, competition, and productivity” より作成

米国では約25,000人

日本では約 3,400人↓

データ分析のトレーニングを受けて大学を卒業している

単位:1,000人

その差は約7倍

なぜこんなにも差がある(あった)のか?28

Page 29: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

なぜこんなにも差がある(あった)のか?

Global Forum セッション登壇の先生に

「なぜこんなにも日本とアメリカでの差が広がったのか」

をたずねた

子供(小学生)の学校では

毎週プログラミングコードを書かせている。

日本のことはよくわからないけど、アメリカには

トレーニングの機会がたくさんあることが一因なのでは?

きっとこの統計には、海外から来た留学生も含まれているよ、

日本人もね。

29

Page 30: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

米国のSTEM教育

30

STEMの領域※

• 化学、工学、数理科学、生命科学、地学、物理学および天文学、計算機科学および情報科学

• 社会科学(人類学・経済学・心理学・社会学)

• STEM領域の教育・学習に関する研究

✓ 1990年の全米科学財団のSTEM提唱(1990年当時はSMET)

✓ 2009年のオバマのSTEM教育に関する宣言によって、ふたたび脚光を浴びる

(ソース:堀田のぞみ「科学技術政策と理科教育―初等中等段階からの科学技術人材育成に関する欧米の取組み―」)

✓ 日本でいうところの「理系」人材を国をあげて育てていこうとしていた

✓ STEM教育は幼稚園から高等教育まで行われている

※全米科学財団(NSF)より

Science

(科学)

Technology

(技術)

Engineering

(工学)

Mathematics

(数学)

POINT 1 高等教育のみならず、初等教育からの積み重ねが重要なのでは?30

Page 31: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

「データサイエンティストとして成功するためには」

米国SAS本社のRadhika Kulkarniさんから

(アナリティクス製品開発責任者)

教えていただいたこと

The Burtch Works Study – Salaries of Data Scientists April 2016 より作成

大学での専攻:数学やコンピュータサイエンストレーニング:統計学や関連する分野

アメリカでの学位:数学・統計学・OR・生物統計学など

“Ability to Learn (学習する力)”

31

Page 32: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

出典:Celebrating Women’s Day: 33 Women in Data Science from around the World & AV Community

「世界のアナリティクス・データサイエンスで

地位を築いてきた女性33人」のうちの一人

32

Page 33: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

「データサイエンティストとして成功するためには」

米国SAS本社のRadhika Kulkarniさんから

(アナリティクス製品開発責任者)

教えていただいたこと

POINT 2「理系」の専門スキル と “Ability to Learn(学習する力)”

この2つがデータサイエンティストとして活躍する上では重要かもしれない

The Burtch Works Study – Salaries of Data Scientists April 2016 より作成

大学での専攻:数学やコンピュータサイエンストレーニング:統計学や関連する分野

アメリカでの学位:数学・統計学・OR・生物統計学など

“Ability to Learn (学習する力)”

33

Page 34: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

教育機関と企業のトレーニング機会の比較(SAS社員の方へのヒアリングをもとにまとめてみました)

POINT 3 教育と企業でそれぞれトレーニングの役割があるのでは?教育:理論的な知識の取得と分析のトレーニング企業:OJTを通じたビジネスへの適用、価値を創出するためのアウトプット力

高等教育(米国の統計学部) 企業(SAS Japan)

データサイエンスと機械学習についての様々な統計モデルの知識

分析内容をお客様に説明するために自身もより深い理解

データクリーニングのスキル統計学コア科目

1-2年 3-4年

統計関連の他の領域科目

統計学選択科目

理論

データサイエンス

環境保健科学

+ 大学院副学長のStudent Assistantとして大学院提供データの分析

・授業でのプロジェクト経験・分析コンペ

On the Job Training で得たこと

「アメリカでは統計学部は経済学部並みにメジャーな学部」

34

Page 35: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

参考:日本の高等教育機関の動向

2017年4月まで、統計学部やデータサイエンス学部のような学部はなかった

滋賀大学データサイエンス学部開設

横浜市立大学データサイエンス学部開設(予定)

2017年4月

2018年4月

出典:滋賀大学ホームページ

出典:横浜市立大学ホームページ35

Page 36: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

「データビジネス創造コンテスト」:分析の実践

36

Page 37: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

POINT1:高等教育のみならず、初等教育からの積み重ねが重要なのでは?

→初等教育から手を動かす経験

POINT2:①「理系」の専門スキル ②”Ability to Learn(学習する力)”

この2つがデータサイエンティストとして活躍する上では重要?

→統計検定やe-learningの活用、複雑な問題を解決できる思考スキル

POINT3:教育と企業でそれぞれトレーニングの役割があるのでは?

→日本で教育と企業で育成を担うのはどちら?

日本でデータサイエンティストを育成するのに(目指すのに)必要な積み重ねとは?

仮説と問題提起

37

Page 38: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

SAS Global Forumが自身に与えた影響

データサイエンスへのイメージの変化

参加前: 分析のイメージ

参加後:「上流から下流まで」それぞれデータサイエンティストの仕事がある

今の自分に必要なスキルの意識への変化

スキル=顕在的なスキル+潜在的なスキル

顕在的なスキル→ 理論的な統計学や数学などの専門スキル

潜在的なスキル→ 複雑な問題(答えがない、もしくは2つ以上)を

解決するための思考スキル≒学習する力

データサイエンティストの「レイヤー」についての深い考察

レイヤーによって必要なスキルの割合も異なる

38

Page 39: 米国におけるデータサイエンスの動向 〜学生の目から見た …...26 SAS Global Forum に参加する際の問題意識 1.データサイエンスの活用フィールドは?→林さんからの事例紹介

ご清聴ありがとうございました

39