日本は地震大国だ。世界で発生するマグニチュード6以上の地震の約2割が日本周辺で発生しており、今後30年以内に「南海トラフ巨大地震」「首都直下型地震」の2つの大きな地震がくることが予測されている。
今回話を聞いた地層科学研究所は、ソニーが提供する画像判別ソリューション「ELFE」を用いたPoCを行うコンテスト「エルコン」に参加。地震波形の誤検知判定を行うべく、波形を画像に変換した上で、地震波形の判別が可能か検証を行うPoCを実施した。
本PoCの内容について、同社のAIエンジニアである岩永昇二氏に、ELFEの企画・設計を担うソニーネットワークコミュニケーションズの成瀬禎史氏を交えてインタビューを行った。
自社サービスでの誤検知をなくすためにAI活用へ
地層科学研究所は、コンピュータ技術を用いて、地質学・岩盤工学などの知識や理解に基づき、人間と地層との関わり合いで生じる防災・環境問題など、さまざまな問題解決に取り組んでいる。
「解析」「地質・計測」「開発」の3つのチームからなり、地下の3次元可視化技術を基盤とする先端技術を使い、地盤防災や地下環境保全へ取り組んでいるという。
今回エルコンに参加した岩永氏は、組織の中でも唯一のAIエンジニアだ。参加したきっかけは、同僚からのある相談だった。
「当社は、建物の揺れを計測し、さまざまな情報を分析する『Geo-Seismo(ジオ・サイズモ)』というサービスを提供しています。そのサービスでは日々加速度波形を計測しているのですが、まれに地震による波形と区別しにくい波形に遭遇する場面があり、担当していた同僚から、AIでなんとかできないかという声をもらったのです」
ジオ・サイズモではキャッチした加速度にしきい値を設け、しきい値に達した場合は異常と判断し、地震としてユーザーに通知している。地震による振動ではない場合に通知すれば、サービスの信頼性にも影響する。
当初は自身でAI開発に取り組もうとしていた岩永氏だが、時間もなくなかなか取り組むに至らなかった。そのタイミングでエルコンの存在を知り、参加を決めたという。
「画像を扱うコンテストでしたが、当社では波形を画像にしたデータは持っていませんでした。しかし、波形を画像に変換して学習させる手法にある程度確信を持っていたので、なんとかできるだろうと思い参加を決めました」
波形データを画像に変換して学習
波形を画像に変換すると聞くと、イメージがつきにくいかもしれない。
まず、岩永氏はAIモデルに与える学習データとして、国立研究開発法人 防災科学技術研究所がオープンデータとして公開している地震波形データを使用した。しかし、ほとんどは正常波形のデータであり、異常波形のデータは限りなく少なく、分類タスクに用いられるほどの量ではなかった。
詳細はこちら:国立研究開発法人 防災科学技術研究所がオープンデータとして公開している地震波形データを使用
「そこで、波形の振幅の大きさを変えたり、ランダムノイズを付加してデータの水増しを行ったりして、疑似波形を作成しました。これにより、異常波形も正常波形と同じくらいのデータ量を確保することができました」
加えて、エルコンは画像判別ソリューションであるELFEを用いる特性上、画像データが必要となる。波形データは確かに画像ではあるが、そのまま使うとスパイク(急上昇する部分)の位置に引きずられ、波形のパターンを認識できない可能性が出てくる。また、同社内で以前、波形データをそのまま使用したこともあったが、当時は精度が出なかったという。そのため、なんらかの方法で波形データを画像にする必要があった。
「画像データに変換するため、テキストデータである波形データを音声データに変換し、スペクトル分析にかけました。そうすることで周波数的な特性が出るグラフになり、特徴のある画像として使えるようになりました」
最初は異常データ、正常データそれぞれを500枚ほど用意し学習させたところ、いきなり分類ができたという。そこで、さらに画像を増やし、使用するAIモデルも※遺伝的アルゴリズムやVAE(Variational Autoencoder)やCNN(Convolutional Neural Network)など複数を試し、ケース数を増やした。
- ※編集部注…画像判別ソリューションであるELFEでは、遺伝的アルゴリズムとディープラーニングからAIモデルを選択可能
「ケース数を増やした結果、ケースごとの傾向は掴めました。ELFEはノーコードツールで、データだけ用意すれば実装の必要もありません。データ収集から結果をまとめるまで3週間程度で行うことができ、非常に便利でした」
さまざまなデータ、モデルで検証を続けたい
今回、地層科学研究所は特別賞を勝ち取った。特別賞への選定理由について、ELFEの企画・設計を担うソニーネットワークコミュニケーションズの成瀬氏はこう語る。
成瀬氏:最上段左から3番目
「まず、異常データを自前で作られたこと、画像がないからといって諦めずに画像データを作成されたところが特別賞の大きな理由ですね。AIの肝であるデータの重要性をご理解いただいていると感じました。
その上で、今後の発展性が著しいと感じたことも理由のひとつです。今回はオープンデータを使われていましたが、ジオ・サイズモのセンサーモジュールで取得している実データを使ったモデルも見てみたい。私もAIという言葉が一般的になる以前、加速度やジャイロセンサーを使ったUIデバイスを研究していたことがあるのですが、意味のある波形とノイズが識別しづらかった経験があります。
建物のモニタリングサービスであるジオ・サイズモのデータを使う場合、床や道の振動や風によるビルの揺れといったノイズも多そうで、ノイズ識別と機械学習にも親和性があると感じます。波形の可視化というタスクにおいて、どのツール、アルゴリズムを使うか以前にできることがまだまだありそうで、今後が非常に楽しみです」
岩永氏も、今回のPoCを踏まえた上での今後の展開への期待を語る。
「成瀬さんの仰るとおり、今回はオープンデータを使ったので、実際に取得した波形データを用いて今後検証していきたいです。また、今回VAEやCNNを含めた4つの手法は試したのですが、ResNetやInceptionV3、VGCといった有名どころのモデルを見落としており、これらのモデルを使った検証もしてみたいと思っています。ELFEでは波形データをCSVフォーマットのまま学習できるそうなので、CSVでもトライしたいと考えています。
今後社内のデータ活用は激化していくと思うので、自分が皮切りとなって本PoCの成果を社内にアピールしていきたいです。ゆくゆくは、このデータでこういうことできない?と周りから気軽に相談される状態を目指したいですね。
データを収集するのは大変ですが、人に聞くとなんだかんだ集まったりします。今後AIへ取り組まれる方々へは、社内の横のつながりは大事にしたほうがいいと伝えたいです」
取材に同席した、ソニーネットワークコミュニケーションズでELFEの開発を担う北畑智貴氏も、今後AI開発に取り組む方々へのメッセージを語った。
「今回は地震波形の異常データが集まりづらいというお話も出ましたが、今後AIに取り組まれる方々には、データは集まりづらいものと認識し、持っているデータを大切に保管してほしいと思います。データを取得しておけば、今後データ活用の機会は無数に出てきます。
AIモデルの作成はELFEなどのツールを活用いただくことで簡単にできるので、ぜひさまざまな会社様のサービスに活用していただきたいと思います」
今回の岩永氏によるPoCをきっかけに、地層科学研究所内ではAI活用がさらに加速するだろう。地震という、全国民が切っても切り離せない自然災害に挑む同社のAI活用に、今後も注目したい。