データ駆動型材料科学概論2020/08/26  · 小口多美夫...

34
小口 多美夫 大阪大学 産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回) 「データ駆動型材料科学の基礎と記述子設計技術」 2020年8月26日 AIRC データ駆動型材料科学概論

Upload: others

Post on 03-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

小口 多美夫

大阪大学 産業科学研究所産業科学ナノテクノロジーセンター

産業科学AIセンター

兵庫県マテリアルズ・インフォマティクス講演会(第4回)「データ駆動型材料科学の基礎と記述子設計技術」

2020年8月26日

AIRC

データ駆動型材料科学概論

Page 2: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

アウトライン

1. 序

2. マテリアルズ・インフォマティクス

3. 第一原理計算

4. データ駆動型材料研究

5. ツール紹介

Ø CrySPY:結晶構造予測

Ø LIDG:線形独立記述子生成

2

Page 3: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

観測データの収集 à 経験則 à 普遍的原理 à 演繹的理論手法

Tycho Brahe (1546-1601)惑星運動の観測

𝑭 = 𝑮𝑴𝒎𝒓𝟐

Isaac Newton (1643-1727)万有引力の法則 à 運動の法則

https://en.wikipedia.org/wiki/Tycho_Brahehttps://en.wikipedia.org/wiki/Johannes_Keplerhttps://en.wikipedia.org/wiki/Isaac_Newtonhttps://en.wikipedia.org/wiki/Kepler%27s_laws_of_planetary_motion

𝒂𝟑

𝑻𝟐=𝑮(𝑴 +𝒎)

𝟒𝝅𝟐

Johannes Kepler (1571-1630)惑星運動の経験則

序:科学の進展

3

Page 4: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

The 5th Solvay Conference 1927.10“Electrons and photons”

4

https://en.wikipedia.org/wiki/Solvay_Conference

Page 5: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

序:理論から計算へ

5

“quantum mechanics can explain most of the phenomena of physics and all of the phenomena of chemistry.”

Paul A. M. Dirac 1902-1984

“You can not understand it, until you know how to calculate it.”

John C. Slater 1900-1976

https://en.wikipedia.org/wiki/Paul_Dirac

http://www.nasonline.org/publications/biographical-memoirs/memoir-pdfs/slater-john.pdf

Page 6: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

序:科学の進展

計算機能力の飛躍的発展→ 計算科学への寄与

ビッグデータの加速化と一般化:IoT

データ科学手法の進展

https://www.xenonstack.com/blog/log-analytics-with-deep-learning-and-machine-learning

https://pr.fujitsu.com/jp/news/2020/06/22-1.html

6

Page 7: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

...........................

...........................

DEC. 14, 2009

7

Page 8: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

実験

科学のパラダイム

理論

計算データ

帰納的手法 演繹的手法

"The Fourth Paradigm: Data-Intensive Scientific Discovery"“ 第4のパラダイム:データ集約型科学的発見 ”

8

Page 9: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

マテリアルズ・インフォマティクス

材料科学 データ科学

材料設計指針

9

Page 10: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

https://www.whitehouse.gov/mgi

Materials Genome Initiative

10

https://www.mgi.gov

Page 11: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

情報科学・データ科学との統合により

n物質・材料科学の研究が加速化

Ø 探索・最適化:仮想スクリーニング

Ø DB・ツール・ワークフロー連携:自動化・ハイスループット

マテリアルズ・インフォマティクス

n新しい展開

Ø 思いがけない物質・材料の発見:セレンディピティ

Ø 物性の起源に関する異なる観点からの解釈:法則性

11

Page 12: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

材料科学:物質・材料の探索・最適化

元素

組成

合成 評価

xi Pi

(x1,P1)(x6,P6)

(x5,P5)

(x9,P9) (x11,P11)

(x4,P4)

(x12,P12)

(x10,P10)(x7,P7)

(x8,P8)

(x3,P3)(x2,P2)

12

物性

機能

Page 13: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

材料科学:物質・材料の探索・最適化

元素

組成

物性

機能

順問題

逆問題

xi Pi

{ xi, Pi } P(x) x = P-1(P)

相関関係・因果関係の発見

データ科学

合成 評価

探索

13

Page 14: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

機械学習

データからターゲットに対するモデルを求める

記述子

データ

予測

法則

モデル

https://www.xenonstack.com/blog/log-analytics-with-deep-learning-and-machine-learning 14

Page 15: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

実験

探索・最適化:スクリーニング

直接スクリーニング

物質群物性・機能

順問題

実験

仮想スクリーニング

物質群

物性・機能順問題

仮想順問題

有効モデル

機械学習

トレーニング

セット

15

Page 16: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

n 物質の性質の多くは量子論に従う電子の状態によって支配

n 具体的な物質系に対して、種々の性質が電子論に基づき第一原理から計算し、予測することが可能となり、新たな順問題の道を拓いている

n 電子論は性質 P を表現する新たな軸(記述子) x を与えている

n 第一原理計算は、物質の性質や機能に関する重要な情報(発現機構等)を提供し、不安定な物質や存在し得ない物質の情報も与えてくれる

物性・機能

第一原理計算の役割

物質

順問題

16

実験+理論・計算

Page 17: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Rapid Growing of First-Principles Calculations

17

Page 18: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Materials Database by First-Principles Calculations

https://materialsproject.org

https://nomad-coe.eu

http://oqmd.org

http://aflowlib.org

18

Page 19: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

First-Principles Calculations

Elements & Composition

Structure (Atomic Configuration)

First-Principles Calculations

Property

AmBn…X

19

Page 20: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Flow of Data-Driven Materials Research

Data Generation & Collection Data Mining

Property DBStructure DB

Structure Search for Unknown

Materials

First-Principles Calculations

Synthesis and Measurements

Materials Exploration

High-Level Verification

Machine LearningDeep Learning

CrySPY

LIDG

20

Page 21: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Crystal Structure Prediction ToolCrySPY

Page 22: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Keys of Structure Prediction

l Explorationü to search the structure space as globally as possible

l Exploitationü to search the structure space without missing important

minima

22

Page 23: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Algorithm of Structure Predictionl Random Search

ü Random selection of lattice constants and atomic positions

l Evolutional-type Searchü Evolutional algorithm(USPEX)ü Particle swarm optimization(CALYPSO)

l Learning-type Searchü Bayesian optimization

Ø Optimization for global search of an unknown function

23

Page 24: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Development of Crystal Structure Prediction

24

CrySPY

Page 25: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Bayesian Optimization

BO enables to balance trade-off between exploration and exploitation of the search algorithm.

A sequential design strategy for global optimization of black-box functions that doesn't require derivatives. [Wikipedia]

25

Page 26: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Examples of Structure Prediction

Na8Cl8 crystal

Comparison between random search and Bayesian Optimization (BO)

Y2Co17 crystal

Phys. Rev. Materials 2, 013803 (2018). 26

Page 27: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Schematic Image of LAQA Algorithm

Standard Method

27

Page 28: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Local Optimization by LAQA Method

Ordinary Method91400 steps

npj Computational Materials 4, 32 (2018).

DFT calculations for Y2Co17Total number of assumed structures: 700

LAQA3300 steps

28

Page 29: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Descriptor Generation ToolLIDG

Page 30: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Materials Functions

No Direct Route by ML

Regression by MLData for ML

Selec

tion

of D

escr

ipto

rsDe

scrip

tor t

o Mat

erial

s

KNOW

LEDG

E OF

MATER

IALS

SCI

ENCE KNOW

LEDGE OF

DATA SCIENCE

Descriptors

Well-known Physical Quantities

記述子 Descriptor

30

Page 31: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Descriptors for Structure Stability in Binary Compounds

• Empirical descriptors by van Vechten and Phillips

• Atomic number is not so good.

J.A. van Vechten, PR (1969).J.C. Phillips, RMP (1970).

L.M. Ghiringhelli et al. PRL (2015)

■ Rock Salt◆ Zinc Blende/Wurtzite

31

Page 32: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Good Descriptors

• A descriptor di uniquely characterizes the material i as well as property-relevant elementary processes.

• Materials that are very different (similar) should be characterized by very different (similar) descriptor values.

• The determination of the descriptor must not involve calculations as intensive as those needed for the evaluation of the property to be predicted.

• The dimension of the descriptor should be as low as possible (for a certain accuracy request).

• 説明変数(explanatory variable)、特徴量(feature)

L.M. Ghiringhelli et al. PRL (2015)

32

Page 33: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Linearly Independent Descriptor Generation

LIDG https://github.com/Hitoshi-FUJII/LIDG

• Algorithmü Generation of higher-order descriptors by productsü Symmetrization of descriptors with RDBü Detection and removal of multi-collinearity

• Advantages in applicationsü Step by step generation of descriptors in regressionü Construction of simple, interpretable model with

sparse modeling methodü Usable as a preprocessing of machine learning

33

33

Page 34: データ駆動型材料科学概論2020/08/26  · 小口多美夫 大阪大学産業科学研究所 産業科学ナノテクノロジーセンター 産業科学AIセンター 兵庫県マテリアルズ・インフォマティクス講演会(第4回)

Flow of Data-Driven Materials Research

Data Generation & Collection Data Mining

Property DBStructure DB

Structure Search for Unknown

Materials

First-Principles Calculations

Synthesis and Measurements

Materials Exploration

High-Level Verification

Machine LearningDeep Learning

CrySPY

LIDG

High-Throughput

Experiments

High-Throughput

Mining

High-Throughput

Computing

34