AIで熱中症発症数を高精度に予測、世界初の研究結果

このエントリーをはてなブックマークに追加

画像はUnsplashより

気温と湿度と日射量を複合したWBGT(湿球黒球温度)は、気候条件から熱中症リスクを示す指標として広く使用されているが、WBGTで熱中症リスクを評価すると、日本の7月〜8月の多くの日がハイリスクとなり、熱中症リスクの詳細な評価が困難だった。

国立循環器病研究センターの予防医学・疫学情報部の尾形宗士郎氏、西村邦宏氏らの研究グループは、機械学習を用いて、気象データなどから熱中症発症数を高精度に予測するAIモデルを作成したと発表した。同成果は世界初としており、7月28日に学術雑誌『Nature Communications』誌に掲載された。

研究グループは尾形宗士郎氏、西村邦宏氏らのほか、関西大学の環境都市工学部の尾﨑平氏、北詰恵一氏らと、国立環境研究所の山崎新氏、山形与志樹氏らで構成される。

本AIモデルの特徴は以下のとおり。

  • 熱中症による救急搬送の全症例件数と中等症以上症例件数(入院診療、長期入院、死亡例)のそれぞれを、12時間ごとに市町村単位で予測できる。
  • 熱中症発症数が急上昇する日(ピークの日)も高精度に予測できる。
  • 天気情報と暦情報と市町村の統計情報(人口、高齢化率など)といったルーティンで収集されている情報をAIで扱うことで、熱中症発症数を予測できる。本AIモデルの実装に求められる情報は多くの地域で収集しているので、実装は比較的容易としている。

本研究では、市町村の消防署より提供を受けた匿名化済みの熱中症搬送情報、The Weather Company社による高解像度気象データ、機械学習を用いて、12時間ごとの市町村単位の熱中症発症社数を高精度に予測するAIモデルを作成した。

データセットや特徴量は以下のとおり。

  • データセット:訓練データセットは近畿地方16市町村の2015、2016、2017年の6月〜9月のデータ(熱中症による救急搬送の全症例件数=11349件)、検証するためのデータセットは2018年の6月〜9月のデータ(熱中症による救急搬送の全症例件数=7513件)
  • 特徴量:天気情報を暦情報と公開されている市町村の統計情報(人口、人口男女比、高齢化割合、緑地面積など)
  • 教師データ:熱中症による救急搬送の全症例件数と中等症以上症例件数(入院診療、長期入院、死亡例)

これらのデータセットや特徴量のもと、複数の学習アルゴリズム(一般化線形モデル、一般化加法モデル、ランダムフォレスト、勾配ブースティング)でAI予測モデルを作成した。

市町村単位の12時間ごとの予測精度は二乗平均平方根誤差(RMSE)で評価し、熱中症発症数が多い日の全市町村の1日単位の予測精度は平均絶対パーセント誤差(MAPE)で評価した。RMSE、MAPEともに低いほど予測精度が高いことを示す。

熱中症による救急搬送の全症例件数に対して、従来の予測モデルでは、RMSEが3.73(件数)、MAPEが43.0%だった。一方で、本AIモデルではRMSEが2.97(件数)、MAPEが14.8%だった。

また、熱中症による救急搬送の中等症以上症例件数(入院診療、長期入院、死亡例)に対して、従来の予測モデルでは、RMSEが1.14(件数)でMAPEが37.7%だった。一方で、本AIモデルではRMSEが0.83(件数)でMAPEが10.6%となり、予測精度が高いことがわかった。

黒色と赤色の線が近いほど予測精度が良いことを示す

従来の熱中症発症数ピーク時の予測精度は低かったが、本AI予測モデルではピーク時も含めて観測件数と予測件数が非常に類似しており、予測精度が高くなっていることがわかった。

本AIモデルはルーティンで収集されている情報を用いて予測するため、社会実装が比較的容易にできるという。熱中症アラートを高精度に発信し、熱中症予防につながることが大いに期待される。

>>ニュースリリース