データサイエンティスト 育成ネットワークの形成...2017/02/22  ·...

18
データサイエンティスト 育成ネットワークの形成 文部科学省 科学技術試験研究委託事業 「ビッグデータ利活用によるイノベーション人材 育成ネットワークの形成」 研究期間:平成252013)年7月~平成28年(2016)年3統計数理研究所 樋口 知之 丸山 東京大学大学院情報理工学系研究科 竹村 彰通 資料3-9 科学技術・学術審議会 情報科学技術委員会 (第97回) H29.1.27

Upload: others

Post on 22-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

データサイエンティスト育成ネットワークの形成

文部科学省 科学技術試験研究委託事業

「ビッグデータ利活用によるイノベーション人材育成ネットワークの形成」

研究期間:平成25(2013)年7月~平成28年(2016)年3月

統計数理研究所 樋口 知之

丸山 宏

東京大学大学院情報理工学系研究科 竹村 彰通

資料3-9科学技術・学術審議会情報科学技術委員会(第97回) H29.1.27

Page 2: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

事業の目的と概要

目的:ビッグデータを利活用しイノベーションを促進する人材を育成するネットワークを形成する

概要:– 人材としては修士課程学生、博士課程学生、ポスドク、社会人を主な

対象とし、東京大学情報理工学研究科、総合研究大学院大学やその他の協力機関と連携して人材育成に取り組むとともに、データサイエンティスト育成教材のパッケージ化と利用の促進を行う。データサイエンティスト利活用の場としては産学官それぞれの場を対象とし、最適な人材育成の現状を調査してベスト・プラクティスに纏める。

– 様々な人材育成ネットワークをつなぎ、形成したネットワークが自律的かつ継続的に成長するような情報収集・発信及び交流の仕組みを検討するとともに、海外機関とも連携してデータサイエンティスト資格の国際標準化についても検討を行う。

– 以上の成果に基づき、我が国におけるデータサイエンティストと、その育成のための「あるべき姿」について提言を行う。

2

Page 3: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

データサイエンティストの育成基盤・環境整備の必要性

• 米国においてはデータサイエンティストが「21世紀の最も魅力的な職業である」と喧伝されているが、我が国においてのデータ分析専門家の育成や活用をどうすればよいのか、経験や知識が十分に集積されていない。

• 本事業では、データサイエンティスト育成を行う教育機関、データサイエンティストを活用する企業や組織、それにデータサイエンティストのスキル認定機関等間の緊密なネットワークを形成し、「我が国におけるデータサイエンティスト像のあるべき姿」を提案する。

3

Page 4: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

事業の理念

1. スケーラビリティ– 最終的に数万人規模のデータサイエンティストの育成が必要であっ

たとしても、一つの機関ないしはプロジェクトがこれらの人材を輩出することはできない。

– 本プロジェクトではデータサイエンティスト育成に熱意を持つ教育機関と、データサイエンティストのスキルを利用したい企業・組織を広くネットワークし、それらの間で知識・経験を共有することで、多くのデータサイエンティストが育成され、有効に活用されることを狙う。

2. 出口戦略– データサイエンティストとしてのキャリアパスは何か、その青写真まで

含めて、データサイエンティストのエコシステム全体を考える。

3. 我が国の実情に即した方略– 米国と日本では、産業構造、労働市場、教育の仕組みや国民のメン

タリティなどが異なる。

– 米国の事情は参考にするが、単に米国発のトレンドの後追いをするのではなく、我が国の実情に即した「あるべき姿」を追求する。

4

Page 5: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

実施目標

① ビッグデータ利活用イノベーション人材の認知度向上・啓発産学官の主要ステークホルダからの意見を聴取しつつ、成果に基づいて我が国におけるデータサイエンティスト育成の「あるべき姿」を提言し、情報の発信・共有を行う。

② ベスト・プラクティスの調査データサイエンティストの仕事内容及び育成の実態について、データサイエンティスト利活用側の取組を含め調査する。また、統計検定受験者に対してのアンケート調査を行い、統計検定の結果が実業でどのように活かされているか、また統計にかかわる教育・学習がどのように行われているかの実態を調査する。これらの成果をデータサイエンティスト育成の「あるべき姿」を纏めるための資料とする。

③ データサイエンティスト育成教材の開発オンライン教材を制作するとともに、データサイエンティスト育成に関連する講座・教育プログラムについて調査し、利用ガイドラインを整備する。

④ 人材のローテーションインターンシップのパイロットから得られる知見、ならびに我が国のデータサイエンティスト類型に基づくインターンシップ・プログラムを展開するとともに、プログラムの有効性や改善点等について検討する。この課題実施によって得られる知見をデータサイエンティスト育成の「あるべき姿」を纏めるための資料とする。

⑤ 海外との連携及び標準化の検討海外での人材ローテーションを視野に入れた連携を目指し、海外の大学ならびに認定機関等との関係構築のために視察する。得られた知見に基づいて国内関連機関と意見交換を行い、我が国のデータサイエンティストの資格化、あるいは国際標準化を目指す。

5

Page 6: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

実施体制

全体の監督・実施:樋口知之 (ISM)

運営委員会:運営委員所属機関• 松竹株式会社• 株式会社アカリク• 統計検定センター• 株式会社ブレインパッド• 京都大学• 情報サービス産業協会• 国立天文台• 海洋研究開発機構• データサイエンティスト協会• 国立遺伝研究所• 日本経済新聞社• 統計数理研究所• 東京大学

ビッグデータ利活用イノベーション人材の認知度向上・啓発:丸山 宏 (ISM)

ベストプラクティス調査:丸山 宏 (ISM)

データサイエンティスト育成教材の開発:丸山 宏 (ISM)

人材のローテーション:丸山 宏 (ISM)竹村彰通(東大)

海外との連携及び標準化の検討:丸山 宏 (ISM)竹村彰通(東大)

事業全体に関する意見交換ならびに成果共有:• 文部科学省 科学技術試験研究委託事業「スキルと実践を重視したビッグデータ・イノベーション人材育成プログラム」• 文部科学省 委託事業「数学・数理科学と諸科学・産業との協働によるイノベーション創出のための研究促進プログラム」(数学協働プログラム)• 文部科学省 大学間連携共同教育推進事業「データに基づく課題解決型人材育成に資する統計教育質保証」統計教育大学間連携ネットワーク• 文部科学省 情報技術人材育成のための実践教育ネットワーク形成事業「分野・地域を越えた実践的情報教育協働ネットワーク」データサイエンティスト活用(雇用)に関するベスト・プラクティス調査、人材のローテーション事業実施:• 一般社団法人データサイエンティスト協会• データエクスチェンジコンソーシアム• 一般社団法人情報処理学会• 一般社団法人情報サービス産業協会• 日本ソフトウェア科学会• 佐賀県データサイエンティスト認定・標準化に関する意見交換:• 一般社団法人データサイエンティスト協会• 一般財団法人統計質保証推進協会

6

Page 7: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

予算(執行額)の変遷

単位(:千円)

物品費人件費・

謝金旅費 その他 間接経費 計 合計

平成25年度(統数研) 307 2,672 1,026 3,981 2,407 10,186

13,582(東大) 105 1,312 847 348 784 3,396

平成26年度(統数研) 1,130 3,534 1,162 1,903 2,318 10,047

14,425(東大) 88 3,050 0 230 1,010 4,378

平成27年度(統数研) 292 3,462 67 3,824 2,294 9,939

13,177(東大) 148 1,969 209 165 747 3,238

合計 2,205 16,347 2,736 10,392 9,504 41,184

7

Page 8: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

H25年度の主要な成果

8

インターンシップ・パイロットプログラム• 東大学生4名

オンライン教材の作成• 「データサイエンティスト・クラッシュコース」

③ プロダクト(米国) vs サービス(日本)

• データサイエンティストは全人的能力

• 発注側のリテラシーも重要

④ スキル志向(米国) vs キャリア志向(日本)

ビジネス課題

見つける

分析問題

解く

数値解

使わせる

ビジネスの意思決定

真のデータサイエンティスト

狭い意味での分析者(=モデラ―)

データサイエンティスト現状調査• 統計検定合格者に対するアンケート調査

• 「20名の『データサイエンティスト』に対する聞き取り調査」と「米国シリコンバレーにおける現状調査」

① 自然科学出身(米国)vs 様々なドメイン出身(日本)② 個人(米国) vs チーム(日本)

VS

プロダクトサービス

Page 9: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

H26年度の主要な成果

9

データサイエンティストの「あるべき姿」に関する提言日本学術会議 情報学委員会E-サイエンス・データ中心科学分科会提言「ビッグデータ時代に対応する人材の育成」 (平成26年9月11日)

インターンシップ・プログラムの展開• インターシップ説明会(6/15/2014)• 民間(株式会社アカリク)のノウハウの活用• 11社、学生70名(アンケート回答者は63名)• 3種類のインターンシップ類型をデザイン• インターシップ参加学生からの聞き取り調査

ベスト・プラクティスの調査• 2つの組織(佐賀県・松竹(株))における追跡調査

• クラウドソーシング利用に関する調査

いかに受注者のスキルを見極めるか?

オンライン教材の公開YouTube上での公開

Page 10: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

H27年度の主要な成果

10

データサイエンティストのスキルレベル定義• データサイエンティスト協会のスキルレベル定義に

あたり、日本学術会議 提言「ビッグデータ時代に対応する人材の育成」、その他関連情報提供

• データサイエンティスト協会のスキルチェックリストの事前確認

• データサイエンティスト協会のスキルチェックリスト公開 (11/13)

DS育成関連データベースの作成・公開教材271コース、コンテスト37

我が国におけるDS人材育成施策に関する提言大学共同利用機関法人情報・システム研究機構 ビッグデータの利活用に係る専門人材育成に向けた産学官懇談会 「ビッグデータの利活用のための専門人材育成について」 (平成27年7月30日)

海外連携の検討及び標準化の検討• 英国Warwick大学訪問 (9/11)他• 海外のデータサイエンス教育プログラム数の推移海外のデータサイエンス教育プログラム

185 (2014年4月)→279 (2015年7月)→505 (2016年2月)

US GB IE FR NL ES Others Total

Bachelors 25 5 1 1 0 0 3 35

Masters 266 38 7 6 7 7 33 364

Doctorate 15 1 0 0 0 0 3 18

Certificate 86 0 1 0 0 0 1 88

Total 392 44 9 7 7 7 40 505

US: United States, GB: Great Britain, IE: Ireland, FR: France, NL: Netherlands,ES: SpainWeb公開情報による

Page 11: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

11

Page 12: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

東京大学大学院情報理工学系研究科・領域知識創成教育研究プログラム(東京大学データサイエンティスト養成講座)

12

Page 13: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

H27年度の主要な成果

13

データサイエンティストのスキルレベル定義• データサイエンティスト協会のスキルレベル定義に

あたり、日本学術会議 提言「ビッグデータ時代に対応する人材の育成」、その他関連情報提供

• データサイエンティスト協会のスキルチェックリストの事前確認

• データサイエンティスト協会のスキルチェックリスト公開 (11/13)

DS育成関連データベースの作成・公開教材271コース、コンテスト37

データサイエンス・リサーチプラザ設置

我が国におけるDS人材育成施策に関する提言大学共同利用機関法人情報・システム研究機構 ビッグデータの利活用に係る専門人材育成に向けた産学官懇談会 「ビッグデータの利活用のための専門人材育成について」 (平成27年7月30日)

海外連携の検討及び標準化の検討• 英国Warwick大学訪問 (9/11)他• 海外のデータサイエンス教育プログラム数の推移海外のデータサイエンス教育プログラム

185 (2014年4月)→279 (2015年7月)→505 (2016年2月)

US GB IE FR NL ES Others Total

Bachelors 25 5 1 1 0 0 3 35

Masters 266 38 7 6 7 7 33 364

Doctorate 15 1 0 0 0 0 3 18

Certificate 86 0 1 0 0 0 1 88

Total 392 44 9 7 7 7 40 505

US: United States, GB: Great Britain, IE: Ireland, FR: France, NL: Netherlands,ES: SpainWeb公開情報による

インターンシップ・プログラムの展開• 説明会実施

(5/30)• 異分野・異業種

交流会@東大(1/31)

• DSハッカソン(2/20-21)

Page 14: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

スキルレベルと育成人数/年の目標の設定

5人

50人

5,000人

5万人

データサイエンティスト協会が公開したスキルレベル (平成26年12月)

1.業界を代表するレベルSenior Data Scientist

2.棟梁レベル(full) Data Scientist

3.独り立ちレベルAssociate Data Scientist

4.見習いレベルAssistant Data Scientist

500人

新入大学生

50万人データリテラシー

RSS/JSS

1級

準1級

2級

3級

統計検定のレベルとの対応

14

Page 15: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

データサイエンティスト育成のあるべき姿と実現に向けた仮説の提示

育成が遅れ、最も欠けている棟梁レベル(左)と育成実現時の波及効果(右)

500人/年

10倍以上

5~20人

現在 効果

棟梁レベル(full) Data Scientist

世界的トップタレントの輩出抜けている。スケールアウトしない原因

トップ研究教育機関が小規模に育成

3,400人 (2008年時。MGI report

Deep Analytical Talent)

US: 25,000人中国: 17,000人インド: 13,000人

1~3人

15

Page 16: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

今後の展望、予想される効果・効用

• 今後我が国におけるデータサイエンティストの育成は大きくスケールアップしていく必要があるのは明らかである。

• そのための戦略として、「ビッグデータの利活用に係る専門人材育成に向けた産学官懇談会」にもあるように、複数の分野を俯瞰的に見てデータ分析の活用を戦略的に考えることができる「棟梁クラス」の育成が急務である。

• そのために、本事業で得られたネットワークやスキル定義、インターンシップ・プログラム、ハッカソン・プログラムなどが利用できると考えられる。

16

Page 17: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

データサイエンティスト育成の具体的施策「我が国におけるデータサイエンティスト像のあるべき姿」を提案する。

これらの施策は個別に実施すべき性質のものではなく、適切に組み合わせることで量と質の双方を担保した適切なポートフォリオを考えるべきである。

• 社会全体のデータリテラシーやアウェアネスの向上– 教養教育の実施、コンテストの開催、MOOC (Massive Open Online Course)などのオンライン

教材や映像素材の充実などに取り組む。

– 高校教育・大学教養での講義において、世界がデータとその利活用で大きく変わっている重大性を教える。

– 大学基礎教育にデータサイエンスを取り入れる。

• 見習いレベルの育成(5万人規模)– MOOC(Massive Open Online Course)を積極的に利用すると共に、コンテンツを充実させ、

コース終了証を発行する。

– 社会人に対しては、特に機械学習など新技術に関して、ミドルマネジメント層を含む広い対象に、全国的に再教育プログラムの提供。

– 学部・大学院におけるデータサイエンスの教育カリキュラムに関しては、統計教育参照基準・情報教育参照基準に相当するものを早急に作成する。

– 大学院に、ダブルディグリー・ジョイントディグリー の考え方を導入し、専門科目と共にデータサイエンスを副専攻などの形で学べるようにする。

17

Page 18: データサイエンティスト 育成ネットワークの形成...2017/02/22  · データサイエンティストの 育成基盤・環境整備の必要性 • 米国においてはデータサイエン

データサイエンティスト育成の具体的施策(続き)「我が国におけるデータサイエンティスト像のあるべき姿」を提案する。

• 独り立ちレベルの育成(5000人規模)– 企業との連携を通してPBLやインターンシップ・プログラムの実施

– 問題設定能力、問題解決のための戦略立案能力、データの収集・キュレーション能力、データ分析結果の業務や事業への実装能力、異分野研究者や事業者との連携・コミュニケーション能力、研究倫理、情報セキュリティの能力を備え、独立してデータサイエンスを推進できるレベルを目指す。

• 棟梁レベルの育成(500人規模)– 科学の諸分野において、既にビッグデータを活用した研究方法論をある程度身につけた人

材(博士号取得者等)に対して、産業界やアカデミアにおいて活躍できるキャリアパスを見据えた再教育。

– データサイエンティストとしての実務経験のある社会人に対する集中的プログラム。最先端の手法をPBLを通して実地で経験し、各応用領域での最新の成果をケーススタディとして学ぶと共に、拠点の特質を活かして棟梁レベルデータサイエンティスト間の人的ネットワークも形成する。

• 指導的データサイエンティストの育成(50人規模)– 世界最先端の手法・応用の研究・開発を推進することによって、指導的データサイエンティス

トが生まれる土壌を醸成する。

– ポテンシャルを持つ者を若いうちに、発掘し、十分な機会を与える必要がある。①定期的なデータサイエンス・ハッカソンを実施する。②才能のある若い者にメンターをつけ、資金等の援助を与えると共に人脈を形成する機会を提供する。

18