ニュース・イベント

プレスリリース

科学的発見を加速するAI活用フレームワークを開発 ~データとAIが抽出した分野横断的知識を統合し、未知の高エントロピー合金の予測を可能に~

北陸先端科学技術大学院大学HPCシステムズ株式会社 北陸先端科学技術大学院大学
HPCシステムズ株式会社

科学的発見を加速するAI活用フレームワークを開発
~ データとAIが抽出した分野横断的知識を統合し、
未知の高エントロピー合金の予測を可能に ~

【ポイント】

  • データと専門家知識を統合する新たな材料探索フレームワークを開発:材料データベースに蓄積された実験的・計算的データと、大規模言語モデル(LLM)を用いて科学文献から抽出した専門家知識を、証拠理論に基づいて統合。従来の機械学習では困難だった「未知領域への探索」を可能に。
  • 分野横断的な知識統合を実現:腐食科学・材料力学・冶金学・固体物理学・材料科学の5分野から専門家知識を抽出・統合。各知識源の信頼性を自動評価し、対象とする材料特性に応じた適切な重み付けを実現。
  • 不確実性を明示的に扱う枠組み:Dempster-Shafer理論(証拠理論)により、「分かること」と「分からないこと」を区別して表現。予測の根拠と限界を明確に示すことで、信頼性の高い意思決定を支援。
  • 訓練データにない元素を含む未知合金系への外挿的予測を実現:本フレームワークは86~92%の予測精度を達成し、多種元素を含む広大な組成空間からの効率的な高エントロピー合金(HEA)発見を可能に。
  • AI for Scienceの新たな研究パラダイムを提示:AIを知識抽出ツールとして活用し、人間が蓄積してきた専門知識とデータを統合することで、科学的発見を加速する方法論を実証。

 北陸先端科学技術大学院大学 共創インテリジェンス研究領域のDAM Hieu-Chi(ダム ヒョウ チ)教授、HA Minh-Quyet特別研究員、LE Dinh-Khiet大学院生(博士後期課程)、HPCシステムズ株式会社のNGUYEN Viet-Cuong氏、統計数理研究所の木野日織教授、米国Duke大学のStefano Curtarolo教授らの国際共同研究チームは、材料データベースから得られるデータと、AIを活用して科学文献から抽出した分野横断的な専門家知識を統合する新たなフレームワークを開発し、高エントロピー合金(HEA)[用語解説1]の発見を加速することに成功しました。
 本研究では、GPT-4o、GPT-4.5、Claude Opus 4、Grok3といった大規模言語モデル(LLM)[用語解説2]を知識抽出ツールとして活用し、科学文献に蓄積された専門家の知見を体系的に取り出すことに成功しました。抽出された知識は、Dempster-Shafer理論(証拠理論)[用語解説3]に基づいて材料データと統合されます。このフレームワークにより、従来の機械学習手法が苦手としてきた「外挿」-- すなわち訓練データに含まれない新規の合金系への予測-- が可能となり、材料探索の新たな地平を切り拓きました。本成果は、AIを活用して科学的発見を加速する「AI for Science」の具体的な方法論を示すとともに、複数の学問分野からの知識を統合し、人間が蓄積してきた専門知識とデータを融合させる知識科学研究の成果です。

【研究背景】

 高エントロピー合金(HEA)は、5種類以上の元素をほぼ等原子比で含む新しいタイプの合金であり、優れた機械的特性、熱安定性、耐食性を示すことから次世代材料として注目されています。しかし、その広大な組成空間と相形成メカニズムの複雑さから、望ましい特性を持つ安定な組成を見つけ出すことは極めて困難です。
 従来のデータ駆動型手法は、訓練データに類似した組成の予測(内挿)には優れた性能を発揮しますが、訓練データに含まれない元素を含む新規な合金系への予測(外挿)は苦手としてきました。このことは、材料探索において「既知の領域の最適化」はできても「未知の領域への探索」が困難であることを意味し、革新的な新材料の発見を阻む大きな障壁となっていました。
 一方、材料科学者は長年の研究を通じて、元素間の置換可能性[用語解説4]に関する豊富な知見を蓄積してきました。この専門知識は科学文献に散在していますが、これを体系的に抽出し、データと統合して活用する方法は確立されていませんでした。

【研究内容】

 本研究では、「元素置換原理」を中心概念として、データと専門家知識を統合する新たなフレームワークを開発しました。
1. AIによる分野横断的な専門家知識の抽出
 GPT-4o、GPT-4.5、Claude Opus 4、Grok3の4種類のLLMを知識抽出ツールとして活用し、腐食科学・材料力学・冶金学・固体物理学・材料科学の5つの専門分野の観点から元素の置換可能性を問い合わせます。これにより、科学文献に蓄積された分野横断的な専門知識を体系的に抽出します。抽出された知識は、確立された経験則(Hume-Rothery則)と86%の一致率を示し、さらに文献で報告されている経験則では捉えられない置換パターンについても、捕捉できることを確認しました。
2. 証拠理論に基づく知識統合
 Dempster-Shafer理論を用いて、材料データベースからの実験的・計算的データと、AIが抽出した専門家知識を統合します。この理論的枠組みは、各情報源の信頼性を評価したうえで証拠を組み合わせ、「確信度」と「不確実性」を明示的に区別して表現することができます。これにより、予測の根拠と限界を明確に示すことが可能となります。
3. 適応的な信頼性評価
 各知識源の信頼性は、対象とする材料特性との整合性に基づいて自動的に評価されます。関連性の高い知識源には高い重みが、関連性の低い知識源には低い重みが付与され、不適切な知識の混入を防ぐ仕組みとなっています。

検証実験の結果

- 外挿性能:訓練データにない元素を含む未知の合金系への予測において、本フレームワークは86~92%の予測精度を実現しました。従来手法では困難であった未知領域への探索を可能にし、多種元素を含む広大な組成空間からの効率的なHEA発見の道を拓きました。
- 実験データでの検証:文献から収集した55種類の実験的に確認された4元系合金に対し、本フレームワークは従来の経験則や自由エネルギーモデルを上回る予測性能を示し、計算コストの高い手法に匹敵する精度を達成しました。
- 高エントロピーホウ化物への適用:異なる材料系である高エントロピーホウ化物(HEB)に対しても、最先端の計算手法との高い相関(相関係数0.81)を示し、フレームワークの汎用性を実証しました。

pr20260213-11.jpg

【図1】 本研究で開発したフレームワークの概略図

 本成果は、2025年12月19日に科学雑誌「Digital Discovery」誌(Royal Society of Chemistry社発行)のオンライン版で公開されました。

【付記】

 本研究は、科学技術振興機構(JST) CREST[革新的計測解析](JPMJCR2235)、科研費 基盤研究C(20K05301、20K05068、23K03950)、科研費 新学術領域研究(JP19H05815)、科研費 特別研究員奨励費(23KJ1035)、科研費 特別推進研究(JP23H05403)、米国国防総省 海軍研究局 MURI(N00014-21-1-251)、及びJST ASPIRE Program「International Collaborative Research Network for Advanced Atomic Layer Processes」の支援のもと行われました。

【今後の展開】

 本研究で開発したフレームワークは、高エントロピー合金の探索に限らず、広大な組成空間とデータの希少性という課題を共有する様々な材料系への適用が期待されます。機能性セラミックスや触媒材料など、複雑な多成分系材料の設計への展開が見込まれます。
 また、本フレームワークは「AI for Science」における一つのモデルケースを提示しています。AIを知識抽出ツールとして活用し、人間が蓄積してきた専門知識とデータを統合しながら、不確実性を明示的に扱うことで、科学的発見を加速する新たな研究パラダイムの確立に貢献することが期待されます。
 今後は、能動学習や強化学習との組み合わせにより、限られた実験資源のもとで最適な候補材料を選択する意思決定支援システムへの発展を目指します。

【論文情報】

掲載誌 Digital Discovery(Royal Society of Chemistry社)
論文題目 Beyond interpolation: integration of data and AI-extracted knowledge for high-entropy alloy discovery
著者 Minh-Quyet Ha, Dinh-Khiet Le, Viet-Cuong Nguyen, Hiori Kino, Stefano Curtarolo, Hieu-Chi Dam
DOI 10.1039/D5DD00400D
掲載日 2025年12月19日

【用語解説】

※1高エントロピー合金(HEA):High-Entropy Alloyの略。複数の主要元素を高濃度で含む合金。高い配置エントロピーにより単相固溶体が安定化され、従来の合金にない優れた特性を示すことがあります。
※2大規模言語モデル(LLM):Large Language Modelの略。膨大なテキストデータから学習し、自然言語の理解・生成を行う人工知能技術。GPT-4oやClaude等が代表例であり、本研究では科学文献に蓄積された専門家知識を抽出するツールとして活用。なお、記載されている製品名は、各社の商標または登録商標です。
※3Dempster-Shafer理論(証拠理論):不確実性を扱うための理論的枠組み。従来の確率論とは異なり、「分からない」という状態を明示的に表現でき、複数の情報源からの証拠の矛盾を考慮しながら統合することができます。
※4元素置換可能性(元素置換原理):化学的に類似した元素は、材料中で互いに置き換えても同様の特性を維持できるという原理。合金設計において、既知の安定な組成から新たな候補組成を導出する際の指針となります。

令和8年2月13日

PAGETOP