機械学習によるヨウ素の結合エネルギーの予測

このエントリーをはてなブックマークに追加
国立大学法人千葉大学
従来法の1.3億倍のスピードでの予測に成功

 千葉大学大学院薬学研究院 中島誠也 助教及び根本哲宏 教授は、超原子価ヨウ素(注1)と呼ばれるヨウ素含有分子の結合エネルギーを人工知能により算出する予測モデルの構築に成功しました。 分子は原子と原子が結合して成り立っています。その結合の強さを表す値、すなわち結合エネルギーの算出は、分子の安定性や反応性の指標となる重要なパラメーターです。この方法によって、従来の計算方法(DFT計算(注2))に比べ、1.3億倍ものスピードで結合エネルギーを算出することが可能となりました。 この研究成果は、2021年10月12日にネイチャー・リサーチ社のオープンアクセス学術誌である「Scientific Reports」に掲載されました。



研究の背景


図1 結合エネルギー算出方法
 千葉県は世界のヨウ素生産量のうち25%を占めており、ヨウ素は日本が有する貴重な天然資源です。ヨウ素は体内で甲状腺ホルモンの合成、またはうがい薬などの消毒薬に用いられたりしますが、産業界においても重要な元素です。ヨウ素と原子の結合は比較的弱く、容易に切断することが可能なため、酸化反応やアルキル化反応など様々な物質変換に用いられます。超原子価ヨウ素と呼ばれるヨウ素原子を含有する分子は特にその結合力が弱く、多彩な化学反応を起こすことが知られています。
 結合の強さは、その結合の切断に必要なエネルギーの値である「結合エネルギー」として数値で表すことができます。古くは実際の分子を用いて実測されてきましたが、近年はコンピュータの発展により、量子化学計算(主にDFT計算)によってシミュレーションすることが可能となりました (図1)。DFT計算では分子を実際に用意する必要がないため、架空の分子などの結合エネルギーも算出することが可能です。しかし、DFT計算では、3次元的な分子の最安定構造をコンピュータ上で算出し、その構造をもとに結合エネルギーを導くため、1つの分子の結合エネルギーの算出には数時間~数日の計算時間が必要であり、分子の大きさが大きくなるほど、指数関数的に所要時間も膨れ上がります。そのため、DFT計算による結合エネルギーの算出には、高性能なコンピュータや高価なソフトウェア、そして計算に関する専門知識やノウハウが必須です。
 そこで、誰でも簡単に結合エネルギーを算出できる方法論を開発することを目標とし、人工知能(AI)を用いる算出方法を着想しました。もし3次元的な構造を必要とせず、分子の構造を表す名前のような文字列から結合エネルギーが算出できれば、上記のすべての問題点が解決できると期待できます。

研究成果1- 超原子価ヨウ素の結合エネルギー予測モデルの構築


図2 予測モデルの構築方法
 研究グループはまず、超原子価ヨウ素の結合エネルギーの予測モデルを構築するべく、DFT計算により約700種の超原子価ヨウ素の結合エネルギーの算出を行いました(図21.)。
 次にその75%を、分子の構造名と結合エネルギーの値をセットで機械学習を行い、結合エネルギー予測モデルを構築しました(図22.)。
 その後、残りの25%を用いて、実際に結合エネルギーの算出(AI予測値)を行い、AIによる予測値と、DFT計算による正解値を比較することで、予測モデルの精度を評価しました(図23.)。
 様々な手法で予測モデルを構築し、合計36個のモデルでの精度を比較した結果、最も高精度な予測モデルでは、僅かな平均誤差 (1.58 kcal/mol)での予測が可能でした。

研究成果2- 学習モデルの適応範囲の調査

 続いて、上記の評価において比較的高い精度を示した16個の予測モデルを用い、適応範囲の調査を行いました。適応範囲の調査では、学習データに含まれていない超原子価ヨウ素の結合エネルギーの予測が、どの程度の精度で可能かを調査しています(図3)。4つの分類に分けられた適応範囲の調査の結果、学習データに完全に含まれていない超原子価ヨウ素においても比較的小さい平均誤差(5.97 kcal/mol)で予測可能な予測モデルを1つ決定することができました(図3D)。
 適応範囲の調査では561種の超原子価ヨウ素の結合エネルギーをDFT計算によって算出し、AIでの予測値との比較によって精度の評価を行っています。この561種のDFT計算を1コア(1つのパソコンの1つの脳)で計算する場合に必要な時間は、4,272日、すなわち約12年間ですが、構築したAIによる予測では、561種すべての結合エネルギーを算出するのに、わずか2.9秒しか必要としませんでした。これは、従来のDFT計算よりも1.3億倍速いということになります。
 以上のように、高性能なパソコンも高価なソフトウェアも専門知識を必要とせず、一般的に流通する個人のパソコン上で、分子の構造名を入力するだけで超原子価ヨウ素の結合エネルギーを算出する学習モデルの開発に成功しました。
図 3 適応範囲の調査結果


研究者のコメント(千葉大学大学院薬学研究院 中島誠也 助教)

 今回の研究によって、誰でも簡単に超原子価ヨウ素の結合エネルギーを瞬時に算出することが可能となりました。この方法論は超原子価ヨウ素のみならず、学習データの種類を増やせば、あらゆる分子における結合エネルギー予測が可能と期待できます。従来は科学者が実測を行ってきた結合エネルギーの算出ですが、現在ではコンピュータ上でのDFT計算によって算出されています。よく「AIによって人間の仕事が奪われる」という話を耳にしますが、本研究では、AIは高性能コンピュータからも仕事 (DFT計算) を奪っています。今後、様々な研究分野において、この結合エネルギー予測モデルが用いられ、そして、化学とAIが結びついた研究がより発展することを期待しています。



研究プロジェクトについて

 本研究は、「2020年度AI研究助成 (千葉大学)」、「2021年度ポストコロナ社会における課題解決 (千葉大学)」、千葉大学グローバルプロミネント研究基幹の支援により遂行されました。


論文情報

・ 論文タイトル:Machine Learning Enabling Prediction of the Bond Dissociation Enthalpy of Hypervalent Iodine from SMILES
・ 雑誌名:Scientific Reports
・ DOI: https://doi.org/10.1038/s41598-021-99369-8

用語解説

注1)超原子価ヨウ素:オクテット則を超え、高い価数、複数の結合を有するヨウ素含有分子。
注2)DFT計算:密度汎関数理論(Density Functional Theory)。電子密度やエネルギーなどの分子や原子の物性を計算することが可能。
企業プレスリリース詳細へ
PR TIMESトップへ