大型研究施設/ソフト・データ MI2I拠点における物質科学データの整備と普及

MI2I(情報統合型物質・材料開発イニシアティブ)は、物性研究者やデータ科学研究者が参加するマテリアルズインフォマティクス(MI)の研究推進および体制構築プロジェクトです。
MI研究を進める上で重要なものは材料データベースです。MI2Iは、NIMSが運用してきた大規模な材料データベースMatNaviをベースにしていますが、MatNaviは人が参照することを前提につくられているため、現在、ソフトウェアから呼 び 出 すた め のAPI(Application Program Interface)を開発しています。最近の成果としては、ベイズ最適化手法を用いた化合物半導体の熱物性設計や、ベイズ推論による新規化合物探索などがあります。
バイオ分野に比べて材料のデータは少ないのですが、材料科学の強みは、実験データがなければ基礎方程式をコンピュータで解くことによってデータをつくり出せることです。そのためMatNaviも含めて、計算データベースをつくる動きは世界中にありますが、そこでは近似手法等をそろえたデータをきちんと用意することが極めて重要です。
固体・材料では、同一組成でもプロセスが異なれば得られる特性は異なるので、プロセスに関するデータも収集する必要があります。ここでは研究者が日々研究室で得ているデータをいかにして収集するかが鍵になります。NIMSでは、そのようなデータをデータベース化する事業を昨年から始めました。重要なことは、研究者に大きな負担をかけずにデータが集められる方法を開発することと同時に、誰が見ても意味がわかるようにしておくことです。また、データ科学に基づくスペクトル解析などの付加価値をつけるなど、データの高付加価値化によってデータ収集のインセンティブとすることを考えています。
SPring-8やJ-PARCのような大型研究施設とも連携してデータを取り込んだり、論文や機関リポジトリから材料データを収集する仕組みも考えています。産業界はそこから手法を学び、“本番のデータ”を活用してビジネス展開につなげてもらえればと思います。各企業のもつ“本番のデータ”はすぐには世の中には出てこないでしょうが、産業界の特許の情報が、いずれデータプラットフォームに入ってくるだろうと考えています。そのような仕組みをこの4月から本格的に設計・開発していこうとNIMSでは考えているところです。

次世代材料データプラットフォーム構想

伊藤 聡

国立研究開発法人物質・材料研究機構