熱電変換材料の実験値データベース構築と 実験値マ...

19
熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス [1] P. Gorai et al., Comp. Mat. Sci. 112 (2015) 368‐376. [2] J. Yan et al., Energy Environ. Sci. 8 (2015) 983‐994. ○⼩⾕拓史 1,3 , 桂ゆかり 1,3 , 熊⾕将也 2 , 今井庸⼆ 3 , 郡司咲⼦ 3 , ⽊村薫 1 1 東京⼤学⼤学院新領域創成科学研究科物質系専攻 2 理化学研究所⾰新知能統合研究センター 3 物質・材料研究機構物質・材料統合研究拠点 ⽇本⾦属学会2017

Upload: others

Post on 17-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

熱電変換材料の実験値データベース構築と実験値マテリアルズ・インフォマティクス

[1] P. Gorai et al., Comp. Mat. Sci. 112 (2015) 368‐376. [2] J. Yan et al., Energy Environ. Sci. 8 (2015) 983‐994.

○⼩⾕拓史1,3, 桂ゆかり1,3, 熊⾕将也2, 今井庸⼆3, 郡司咲⼦3, ⽊村薫1

1東京⼤学⼤学院新領域創成科学研究科物質系専攻2理化学研究所⾰新知能統合研究センター

3物質・材料研究機構物質・材料統合研究拠点⽇本⾦属学会2017秋

Page 2: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

試料依存性同じ物質名でも、試料の個体差が⼤きく、特性が何桁も異なることも多い↓

ドーピングによる試料特性の変化を考慮した分析が必要↓

第⼀原理計算だけでは情報が不⾜しており、実験データを使⽤したMIが必要

論⽂中の実験データを⼤規模に収集・分析する⽅法が必要

無次元性能指数𝑍𝑇𝜎𝑆𝜅 𝑇

𝑆:ゼーベック係数𝜎:電気伝導度𝜅:熱伝導率

G. J. Snyder and E. S. Toberer, “Complex thermoelectric materials.,” Nature Materials, 7, 2 (2008) p105-114.

熱電材料特性の複雑さ熱電材料特性の複雑さ

Page 3: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

試料依存性同じ物質名でも、試料の個体差が⼤きく、特性が何桁も異なることも多い↓

ドーピングによる試料特性の変化を考慮した分析が必要↓

第⼀原理計算だけでは情報が不⾜しており、実験データを使⽤したMIが必要

論⽂中の実験データを⼤規模に収集・分析する⽅法が必要 G. J. Snyder and E. S. Toberer, “Complex thermoelectric

materials.,” Nature Materials, 7, 2 (2008) p105-114.

熱電材料特性の複雑さ熱電材料特性の複雑さMg2Siのドーピングによる実験値の変化

Page 4: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

熱電材料における既存の実験値データベース熱電材料における既存の実験値データベース

Materials Research Laboratory (MRL)• 約100論⽂からの実験値を収集(共同研究者6名)• 1材料系につき数試料のデータを収録• 既存の実験値を材料系ごとに⽐較

M.W. Gaultois et al. Chem. Mater. 25.15 (2013) 2911‐2920.

Page 5: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

熱電材料に関する論⽂上の実験データを効率的にデータベース化する⼿法を開発すること

⼯程 通常の⼿作業 ⼿作業の効率化 完全⾃動化(理想)論⽂ダウンロード

⼿作業で1本ずつ

リストに従って⼿動ダウンロード(無料)

⾃動ダウンロード(TDM‐API)

グラフ抽出 ⼿作業を効率化する半⾃動化ソフトで研究者が情報⼊⼒

画像認識で⾃動抽出情報⼊⼒ テキストマイニングで

内容と⽂脈を⾃動抽出作業者 研究業務員 研究業務員+研究者 情報科学者

対応論⽂数 数百本 数千〜数万本? 制限なし準備期間 1〜2年? 3〜5年?コメント

⼤変すぎる情報量が最⼤化

早くMIが始められる情報量が少なく不正確チェックで⼆度⼿間

完全⾃動化は理想だが、論⽂やグラフのフォーマットがばらばらすぎて困難→専⾨家の論⽂読解⼒を有効活⽤する枠組みが必要

材料研究者の内在的知識を

活⽤

未確⽴の技術

⼿作業の効率を10倍にすればいい

本研究の⽬的・⽅針本研究の⽬的・⽅針

Page 6: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

論⽂実験値の収集論⽂実験値の収集

論⽂PDFのダウンロード

論⽂のグラフ画像抽出

サンプル情報記⼊特性値データトレース

ターゲット材料熱電材料としてよく研究されている

PbTe系半導体(NaCl構造のPbTe, PbSe, PbS, SnTe)

Te site

Pb site

Pb site:Pb or SnTe site:Te, Se, or S

作業を分割して⾏うことで効率化できる

Page 7: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

論⽂PDFのダウンロード‘’thermoelectric materials’’で検索した18,471の論⽂リストからPbTe系材料に関する254件の論⽂PDFをダウンロード

list of 18,471 papers

論⽂実験値の収集論⽂実験値の収集

PDFの名前はリスト番号_DOIにして保存

Page 8: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

論⽂のグラフ画像抽出σ, S, κの温度依存性に関するグラフを論⽂から抽出

Starrydata StationMade by 桂助教

物理量と図表番号をクリックするだけで、ファイル名⾃動設定&画像保存

論⽂実験値の収集論⽂実験値の収集

画像ファイル名をリスト番号_DOI_図表番号_物理量にして保存

Page 9: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

サンプル情報記⼊特性値データトレース

453試料の実験値の数値データを収集しcsv形式で保存。論⽂・図・試料組成に関する情報をファイル名にして管理

Traced by Webplotdigitizer Copyright © 2010‐2017, Ankit Rohatgi

論⽂実験値の収集論⽂実験値の収集

txtファイルを画像ファイル名_試料組成にして保存

Page 10: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

PbTe系材料453サンプルの収集データPbTe系材料453サンプルの収集データ

• 23種類の置換元素Na, K, Mg, Ca, Sr, Ba, Al, Ga, In, Si, Sb, Bi, Cl, I, Cr, Mn, Zn, Ag, Cd, Hg, La, Ce, Yb

• 特性に⾮常に広い幅があるこのプロットから傾向を判断するのは難しい

⇒特性間の相関の傾向を分析

Temperature dependence plot of S, σ, κ

Page 11: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

S ‐ log(σ) 相関プロットS ‐ log(σ) 相関プロット

• 伝導帯は主にPbのs-pバンドから成るanionの種類によるSの変化がない

• 価電⼦帯は主にanionのpバンドから成るanionの種類によるフェルミ⾯付近の状態密度変化がSに影響

軽いanionほどSが⼩さくなる (Te > Se > S)Te

Page 12: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

S ‐ log(σ) 相関プロットS ‐ log(σ) 相関プロット

• 伝導帯は主にPbのs-pバンドから成るanionの種類によるSの変化がない

• 価電⼦帯は主にanionのpバンドから成るanionの種類によるフェルミ⾯付近の状態密度変化がSに影響

軽いanionほどSが⼩さくなる (Te > Se > S)Se

Page 13: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

S ‐ log(σ) 相関プロットS ‐ log(σ) 相関プロット

• 伝導帯は主にPbのs-pバンドから成るanionの種類によるSの変化がない

• 価電⼦帯は主にanionのpバンドから成るanionの種類によるフェルミ⾯付近の状態密度変化がSに影響

軽いanionほどバンド端が低くなる (Te > Se > S)→バンド端縮重が少なくなる

軽いanionほどSが⼩さくなる (Te > Se > S)S

Page 14: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

S ‐ log(σ) 相関プロット(過去のデータベース)S ‐ log(σ) 相関プロット(過去のデータベース)

p‐typeS with heavier anion  >  S with lighter anion

n‐type anionの種類によるSの違いが⾒られない

過去の実験値データベースでは1つの材料に対するデータが少なくて⾒えなかった傾向が⾒えた

MRLデータベースカルコゲナイド系

Page 15: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

κ – σ相関プロットκ – σ相関プロット

κ with heavier anion <  κ with lighter anionκ with mixed anions  <  κ with single anion

まだデータの傾向に幅が⼤きい→ cationの種類や微細構造の違いによる分類が必要

原⼦量 Te > Se > S

Page 16: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

ZT ‐ log(σ) 相関プロットZT ‐ log(σ) 相関プロット

G. J. Snyder and E. S. Toberer, “Complex thermoelectric materials.,” Nature Materials, 7, 2 (2008) p105-114.

• Anionの種類によってZTのピーク位置と⼤きさが異なる• 計算から導かれるZTの依存性と整合性がある→データ収集により物質ごとの最適な電気伝導率σを推定することができる

Te site

Pb site

Page 17: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

Starrydata2Starrydata2

⽇本熱電学会 熱電特性データベースWG(since 2015 Dec.)で論⽂リスト・実験値データの共有⾃分の好きな材料系でのデータ収集や実験値分析の補助を⽬的とする

Page 18: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

まとめまとめ

• データ収集今回提案したデータ収集⽅法により個⼈でPbTe系の453試料のデータを収集することができた材料系を絞っていても幅広い温度依存性を持つデータが得られた

• データ分析Anionの違いによる熱電特性間の相関の違いを観察することができた→様々な条件での分類から更に傾向を観察できる幅広いキャリア濃度を持つ試料のデータがあるため第⼀原理計算の結果を補正して正しい電⼦構造を導くことに利⽤できると期待される

本研究は、科学技術振興機構 (JST) のイノベーションハブ構築⽀援事業の「情報統合型物質・材料開発イニシアティブ (MI2I)」から⽀援を受けた。

Page 19: 熱電変換材料の実験値データベース構築と 実験値マ …...熱電変換材料の実験値データベース構築と 実験値マテリアルズ・インフォマティクス

統計学・経験則の証明・新法則の発⾒

機械学習(変数選択・スパースモデリングなど)・実験値の予測・電⼦構造の逆算・新規材料の探索

シミュレーションの深化・第⼀原理計算と

実験値の整合性の確認・フィッティングによる

未知パラメータの導出

グラフ型データベースの共有

データ科学の導⼊により研究者に新しい知⾒をもたらし材料の研究開発を⼤幅に加速する

今後の展望今後の展望• 熱電特性データベースWGでStarrydata2を⽤いて実験値データベースを⼤規模化