データ駆動型材料科学概論2020/08/26  · 小口多美夫...

Post on 03-Oct-2020

1 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

小口 多美夫

大阪大学 産業科学研究所産業科学ナノテクノロジーセンター

産業科学AIセンター

兵庫県マテリアルズ・インフォマティクス講演会(第4回)「データ駆動型材料科学の基礎と記述子設計技術」

2020年8月26日

AIRC

データ駆動型材料科学概論

アウトライン

1. 序

2. マテリアルズ・インフォマティクス

3. 第一原理計算

4. データ駆動型材料研究

5. ツール紹介

Ø CrySPY:結晶構造予測

Ø LIDG:線形独立記述子生成

2

観測データの収集 à 経験則 à 普遍的原理 à 演繹的理論手法

Tycho Brahe (1546-1601)惑星運動の観測

𝑭 = 𝑮𝑴𝒎𝒓𝟐

Isaac Newton (1643-1727)万有引力の法則 à 運動の法則

https://en.wikipedia.org/wiki/Tycho_Brahehttps://en.wikipedia.org/wiki/Johannes_Keplerhttps://en.wikipedia.org/wiki/Isaac_Newtonhttps://en.wikipedia.org/wiki/Kepler%27s_laws_of_planetary_motion

𝒂𝟑

𝑻𝟐=𝑮(𝑴 +𝒎)

𝟒𝝅𝟐

Johannes Kepler (1571-1630)惑星運動の経験則

序:科学の進展

3

The 5th Solvay Conference 1927.10“Electrons and photons”

4

https://en.wikipedia.org/wiki/Solvay_Conference

序:理論から計算へ

5

“quantum mechanics can explain most of the phenomena of physics and all of the phenomena of chemistry.”

Paul A. M. Dirac 1902-1984

“You can not understand it, until you know how to calculate it.”

John C. Slater 1900-1976

https://en.wikipedia.org/wiki/Paul_Dirac

http://www.nasonline.org/publications/biographical-memoirs/memoir-pdfs/slater-john.pdf

序:科学の進展

計算機能力の飛躍的発展→ 計算科学への寄与

ビッグデータの加速化と一般化:IoT

データ科学手法の進展

https://www.xenonstack.com/blog/log-analytics-with-deep-learning-and-machine-learning

https://pr.fujitsu.com/jp/news/2020/06/22-1.html

6

...........................

...........................

DEC. 14, 2009

7

実験

科学のパラダイム

理論

計算データ

帰納的手法 演繹的手法

"The Fourth Paradigm: Data-Intensive Scientific Discovery"“ 第4のパラダイム:データ集約型科学的発見 ”

8

マテリアルズ・インフォマティクス

材料科学 データ科学

材料設計指針

9

https://www.whitehouse.gov/mgi

Materials Genome Initiative

10

https://www.mgi.gov

情報科学・データ科学との統合により

n物質・材料科学の研究が加速化

Ø 探索・最適化:仮想スクリーニング

Ø DB・ツール・ワークフロー連携:自動化・ハイスループット

マテリアルズ・インフォマティクス

n新しい展開

Ø 思いがけない物質・材料の発見:セレンディピティ

Ø 物性の起源に関する異なる観点からの解釈:法則性

11

材料科学:物質・材料の探索・最適化

元素

組成

合成 評価

xi Pi

(x1,P1)(x6,P6)

(x5,P5)

(x9,P9) (x11,P11)

(x4,P4)

(x12,P12)

(x10,P10)(x7,P7)

(x8,P8)

(x3,P3)(x2,P2)

12

物性

機能

材料科学:物質・材料の探索・最適化

元素

組成

物性

機能

順問題

逆問題

xi Pi

{ xi, Pi } P(x) x = P-1(P)

相関関係・因果関係の発見

データ科学

合成 評価

探索

13

機械学習

データからターゲットに対するモデルを求める

記述子

データ

予測

法則

モデル

https://www.xenonstack.com/blog/log-analytics-with-deep-learning-and-machine-learning 14

実験

探索・最適化:スクリーニング

直接スクリーニング

物質群物性・機能

順問題

実験

仮想スクリーニング

物質群

物性・機能順問題

仮想順問題

有効モデル

機械学習

トレーニング

セット

15

n 物質の性質の多くは量子論に従う電子の状態によって支配

n 具体的な物質系に対して、種々の性質が電子論に基づき第一原理から計算し、予測することが可能となり、新たな順問題の道を拓いている

n 電子論は性質 P を表現する新たな軸(記述子) x を与えている

n 第一原理計算は、物質の性質や機能に関する重要な情報(発現機構等)を提供し、不安定な物質や存在し得ない物質の情報も与えてくれる

物性・機能

第一原理計算の役割

物質

順問題

16

実験+理論・計算

Rapid Growing of First-Principles Calculations

17

Materials Database by First-Principles Calculations

https://materialsproject.org

https://nomad-coe.eu

http://oqmd.org

http://aflowlib.org

18

First-Principles Calculations

Elements & Composition

Structure (Atomic Configuration)

First-Principles Calculations

Property

AmBn…X

19

Flow of Data-Driven Materials Research

Data Generation & Collection Data Mining

Property DBStructure DB

Structure Search for Unknown

Materials

First-Principles Calculations

Synthesis and Measurements

Materials Exploration

High-Level Verification

Machine LearningDeep Learning

CrySPY

LIDG

20

Crystal Structure Prediction ToolCrySPY

Keys of Structure Prediction

l Explorationü to search the structure space as globally as possible

l Exploitationü to search the structure space without missing important

minima

22

Algorithm of Structure Predictionl Random Search

ü Random selection of lattice constants and atomic positions

l Evolutional-type Searchü Evolutional algorithm(USPEX)ü Particle swarm optimization(CALYPSO)

l Learning-type Searchü Bayesian optimization

Ø Optimization for global search of an unknown function

23

Development of Crystal Structure Prediction

24

CrySPY

Bayesian Optimization

BO enables to balance trade-off between exploration and exploitation of the search algorithm.

A sequential design strategy for global optimization of black-box functions that doesn't require derivatives. [Wikipedia]

25

Examples of Structure Prediction

Na8Cl8 crystal

Comparison between random search and Bayesian Optimization (BO)

Y2Co17 crystal

Phys. Rev. Materials 2, 013803 (2018). 26

Schematic Image of LAQA Algorithm

Standard Method

27

Local Optimization by LAQA Method

Ordinary Method91400 steps

npj Computational Materials 4, 32 (2018).

DFT calculations for Y2Co17Total number of assumed structures: 700

LAQA3300 steps

28

Descriptor Generation ToolLIDG

Materials Functions

No Direct Route by ML

Regression by MLData for ML

Selec

tion

of D

escr

ipto

rsDe

scrip

tor t

o Mat

erial

s

KNOW

LEDG

E OF

MATER

IALS

SCI

ENCE KNOW

LEDGE OF

DATA SCIENCE

Descriptors

Well-known Physical Quantities

記述子 Descriptor

30

Descriptors for Structure Stability in Binary Compounds

• Empirical descriptors by van Vechten and Phillips

• Atomic number is not so good.

J.A. van Vechten, PR (1969).J.C. Phillips, RMP (1970).

L.M. Ghiringhelli et al. PRL (2015)

■ Rock Salt◆ Zinc Blende/Wurtzite

31

Good Descriptors

• A descriptor di uniquely characterizes the material i as well as property-relevant elementary processes.

• Materials that are very different (similar) should be characterized by very different (similar) descriptor values.

• The determination of the descriptor must not involve calculations as intensive as those needed for the evaluation of the property to be predicted.

• The dimension of the descriptor should be as low as possible (for a certain accuracy request).

• 説明変数(explanatory variable)、特徴量(feature)

L.M. Ghiringhelli et al. PRL (2015)

32

Linearly Independent Descriptor Generation

LIDG https://github.com/Hitoshi-FUJII/LIDG

• Algorithmü Generation of higher-order descriptors by productsü Symmetrization of descriptors with RDBü Detection and removal of multi-collinearity

• Advantages in applicationsü Step by step generation of descriptors in regressionü Construction of simple, interpretable model with

sparse modeling methodü Usable as a preprocessing of machine learning

33

33

Flow of Data-Driven Materials Research

Data Generation & Collection Data Mining

Property DBStructure DB

Structure Search for Unknown

Materials

First-Principles Calculations

Synthesis and Measurements

Materials Exploration

High-Level Verification

Machine LearningDeep Learning

CrySPY

LIDG

High-Throughput

Experiments

High-Throughput

Mining

High-Throughput

Computing

34

top related