データ駆動型材料科学概論2020/08/26 · 小口多美夫...
TRANSCRIPT
小口 多美夫
大阪大学 産業科学研究所産業科学ナノテクノロジーセンター
産業科学AIセンター
兵庫県マテリアルズ・インフォマティクス講演会(第4回)「データ駆動型材料科学の基礎と記述子設計技術」
2020年8月26日
AIRC
データ駆動型材料科学概論
アウトライン
1. 序
2. マテリアルズ・インフォマティクス
3. 第一原理計算
4. データ駆動型材料研究
5. ツール紹介
Ø CrySPY:結晶構造予測
Ø LIDG:線形独立記述子生成
2
観測データの収集 à 経験則 à 普遍的原理 à 演繹的理論手法
Tycho Brahe (1546-1601)惑星運動の観測
𝑭 = 𝑮𝑴𝒎𝒓𝟐
Isaac Newton (1643-1727)万有引力の法則 à 運動の法則
https://en.wikipedia.org/wiki/Tycho_Brahehttps://en.wikipedia.org/wiki/Johannes_Keplerhttps://en.wikipedia.org/wiki/Isaac_Newtonhttps://en.wikipedia.org/wiki/Kepler%27s_laws_of_planetary_motion
𝒂𝟑
𝑻𝟐=𝑮(𝑴 +𝒎)
𝟒𝝅𝟐
Johannes Kepler (1571-1630)惑星運動の経験則
序:科学の進展
3
The 5th Solvay Conference 1927.10“Electrons and photons”
4
https://en.wikipedia.org/wiki/Solvay_Conference
序:理論から計算へ
5
“quantum mechanics can explain most of the phenomena of physics and all of the phenomena of chemistry.”
Paul A. M. Dirac 1902-1984
“You can not understand it, until you know how to calculate it.”
John C. Slater 1900-1976
https://en.wikipedia.org/wiki/Paul_Dirac
http://www.nasonline.org/publications/biographical-memoirs/memoir-pdfs/slater-john.pdf
序:科学の進展
計算機能力の飛躍的発展→ 計算科学への寄与
ビッグデータの加速化と一般化:IoT
データ科学手法の進展
https://www.xenonstack.com/blog/log-analytics-with-deep-learning-and-machine-learning
https://pr.fujitsu.com/jp/news/2020/06/22-1.html
6
...........................
...........................
DEC. 14, 2009
7
実験
科学のパラダイム
理論
計算データ
帰納的手法 演繹的手法
"The Fourth Paradigm: Data-Intensive Scientific Discovery"“ 第4のパラダイム:データ集約型科学的発見 ”
8
マテリアルズ・インフォマティクス
材料科学 データ科学
材料設計指針
9
https://www.whitehouse.gov/mgi
Materials Genome Initiative
10
https://www.mgi.gov
情報科学・データ科学との統合により
n物質・材料科学の研究が加速化
Ø 探索・最適化:仮想スクリーニング
Ø DB・ツール・ワークフロー連携:自動化・ハイスループット
マテリアルズ・インフォマティクス
n新しい展開
Ø 思いがけない物質・材料の発見:セレンディピティ
Ø 物性の起源に関する異なる観点からの解釈:法則性
11
材料科学:物質・材料の探索・最適化
元素
組成
合成 評価
xi Pi
(x1,P1)(x6,P6)
(x5,P5)
(x9,P9) (x11,P11)
(x4,P4)
(x12,P12)
(x10,P10)(x7,P7)
(x8,P8)
(x3,P3)(x2,P2)
12
物性
機能
材料科学:物質・材料の探索・最適化
元素
組成
物性
機能
順問題
逆問題
xi Pi
{ xi, Pi } P(x) x = P-1(P)
相関関係・因果関係の発見
データ科学
合成 評価
探索
13
機械学習
データからターゲットに対するモデルを求める
記述子
データ
予測
法則
モデル
https://www.xenonstack.com/blog/log-analytics-with-deep-learning-and-machine-learning 14
実験
探索・最適化:スクリーニング
直接スクリーニング
物質群物性・機能
順問題
実験
仮想スクリーニング
物質群
物性・機能順問題
仮想順問題
有効モデル
機械学習
トレーニング
セット
15
n 物質の性質の多くは量子論に従う電子の状態によって支配
n 具体的な物質系に対して、種々の性質が電子論に基づき第一原理から計算し、予測することが可能となり、新たな順問題の道を拓いている
n 電子論は性質 P を表現する新たな軸(記述子) x を与えている
n 第一原理計算は、物質の性質や機能に関する重要な情報(発現機構等)を提供し、不安定な物質や存在し得ない物質の情報も与えてくれる
物性・機能
第一原理計算の役割
物質
順問題
16
実験+理論・計算
Rapid Growing of First-Principles Calculations
17
Materials Database by First-Principles Calculations
https://materialsproject.org
https://nomad-coe.eu
http://oqmd.org
http://aflowlib.org
18
First-Principles Calculations
Elements & Composition
Structure (Atomic Configuration)
First-Principles Calculations
Property
AmBn…X
19
Flow of Data-Driven Materials Research
Data Generation & Collection Data Mining
Property DBStructure DB
Structure Search for Unknown
Materials
First-Principles Calculations
Synthesis and Measurements
Materials Exploration
High-Level Verification
Machine LearningDeep Learning
CrySPY
LIDG
20
Crystal Structure Prediction ToolCrySPY
Keys of Structure Prediction
l Explorationü to search the structure space as globally as possible
l Exploitationü to search the structure space without missing important
minima
22
Algorithm of Structure Predictionl Random Search
ü Random selection of lattice constants and atomic positions
l Evolutional-type Searchü Evolutional algorithm(USPEX)ü Particle swarm optimization(CALYPSO)
l Learning-type Searchü Bayesian optimization
Ø Optimization for global search of an unknown function
23
Development of Crystal Structure Prediction
24
CrySPY
Bayesian Optimization
BO enables to balance trade-off between exploration and exploitation of the search algorithm.
A sequential design strategy for global optimization of black-box functions that doesn't require derivatives. [Wikipedia]
25
Examples of Structure Prediction
Na8Cl8 crystal
Comparison between random search and Bayesian Optimization (BO)
Y2Co17 crystal
Phys. Rev. Materials 2, 013803 (2018). 26
Schematic Image of LAQA Algorithm
Standard Method
27
Local Optimization by LAQA Method
Ordinary Method91400 steps
npj Computational Materials 4, 32 (2018).
DFT calculations for Y2Co17Total number of assumed structures: 700
LAQA3300 steps
28
Descriptor Generation ToolLIDG
Materials Functions
No Direct Route by ML
Regression by MLData for ML
Selec
tion
of D
escr
ipto
rsDe
scrip
tor t
o Mat
erial
s
KNOW
LEDG
E OF
MATER
IALS
SCI
ENCE KNOW
LEDGE OF
DATA SCIENCE
Descriptors
Well-known Physical Quantities
記述子 Descriptor
30
Descriptors for Structure Stability in Binary Compounds
• Empirical descriptors by van Vechten and Phillips
• Atomic number is not so good.
J.A. van Vechten, PR (1969).J.C. Phillips, RMP (1970).
L.M. Ghiringhelli et al. PRL (2015)
■ Rock Salt◆ Zinc Blende/Wurtzite
31
Good Descriptors
• A descriptor di uniquely characterizes the material i as well as property-relevant elementary processes.
• Materials that are very different (similar) should be characterized by very different (similar) descriptor values.
• The determination of the descriptor must not involve calculations as intensive as those needed for the evaluation of the property to be predicted.
• The dimension of the descriptor should be as low as possible (for a certain accuracy request).
• 説明変数(explanatory variable)、特徴量(feature)
L.M. Ghiringhelli et al. PRL (2015)
32
Linearly Independent Descriptor Generation
LIDG https://github.com/Hitoshi-FUJII/LIDG
• Algorithmü Generation of higher-order descriptors by productsü Symmetrization of descriptors with RDBü Detection and removal of multi-collinearity
• Advantages in applicationsü Step by step generation of descriptors in regressionü Construction of simple, interpretable model with
sparse modeling methodü Usable as a preprocessing of machine learning
33
33
Flow of Data-Driven Materials Research
Data Generation & Collection Data Mining
Property DBStructure DB
Structure Search for Unknown
Materials
First-Principles Calculations
Synthesis and Measurements
Materials Exploration
High-Level Verification
Machine LearningDeep Learning
CrySPY
LIDG
High-Throughput
Experiments
High-Throughput
Mining
High-Throughput
Computing
34