Unsplashより
AIと聞いて皆さんは何を思い浮かべるでしょうか。
Amazon AlexaやGoogle アシスタントなどを搭載するAIスピーカー(スマートスピーカー)や、2020年10月に初の国内初の摘発があり、話題となったディープフェイクなど、AIが用いられた技術にはさまざまのものがあります。
AIは、画像をみて、それが何であるか判断しようとする画像認識や、人の話を聞いて理解しようとする自然言語処理など、人間にできることを機械に実現させようという方向性で使われます。ほかにも、膨大なデータ(ビッグデータ)を分析して物事の関係性を明らかにしたり、未来を予測したりするなど、人間の処理能力では不可能なことを実現するためにも用いられます。
この記事では、AIによる予測について掘り下げていきます。
AI予測とは
AI予測とは、AIを用いてデータから未来の物事の発生や未来の値の予測をするものです。
編集部で作成
AI予測の意義
AI予測の活躍の場は多岐にわたります。
たとえば、商品の需要を予測できれば、供給不足・過多を防止し、人材やコストの無駄を最小限にできます。機械の故障の発生を予測できれば、適切なタイミングでメンテナンスを実施し、故障による損失を防げます。病気の発生を予測できれば、病気が進行する前に、治療を受け健康でいられる期間を延ばせます。
AIを用いる前、未来の予測は人間の「経験」や「勘」に頼る場合が多くありました。長年業務に従事している人であれば、その日の商品の需要を”過去の同じような日にはたくさん売れたな”といった記憶から予測することも可能でしょう。
しかし、完全に属人的な予測は、経験を積んでいる人でなければ難しい、感覚的なものであるため後輩に教えることが難しいといった課題があります。とくに今の日本は少子高齢化による後継者不足で、ノウハウや技術の伝承の危機に瀕しています。
また、AIは人間が考慮できる要因数(その日の天気・気温など)や、データ数(過去の記憶)よりもはるかに多くを処理できるため、より高精度な予測を実施できる可能性が高いです。
完全に属人的な予測の回避のためにも、より精度の高い予測を目指すためにも、AI予測は注目されています。
AI予測の事例
AI予測は実際どのようなことに、どのような目的で用いられているのでしょうか。本章ではLedge.aiの過去の記事をもとに、いくつか事例を紹介します。
未来の物事の発生を予測する事例
AI予測は、さまざまな物事の発生の予測に用いられています。
- 水道管路の劣化予測
- インフルエンザの流行予報
- 不整脈の発症予測
年数だけでなく周囲の環境の影響も考慮するため、AIを用いて水道管路の劣化状況を予測。水道配管の破損確率を高精度に把握・分析可能なので、水道配管の交換における優先順位が明確となり、更新計画を最適化できます。
インフルエンザの予防に役立てるため、今週〜4週間後までのインフルエンザの流行度合いを0~3のレベルで予測します。
日常生活での数分の検査で心房細動などの不整脈を検出し、早期診断による適切な治療を実現することで、脳梗塞による寝たきりを予防します。
未来の値を予測する事例
物事の発生以外にも、需要予測や価格予測など値の予測にAI予測は用いられています。
- 10年後の不動産資産価値の予測
- 新幹線車両の着雪量予測
将来の不動産資産価値をAIで予測することで、顧客の物件選びをサポートします。
北陸新幹線は冬の走行中に、車両の下部に雪が付着します。雪が固まり、ある程度の大きさになると、線路に落下する場合もあり、線路に敷かれている砂利が飛散すると周囲に危険が及びます。雪を取り除くためには大量の人員を必要とするため、雪落とし、作業の要否の目処をつける必要があり、AIでの着雪量予測を活用しています。
上記で紹介したものはほんの一部です。AI活用事例の検索プラットフォームe.g.ではほかにもさまざまなAI活用事例が紹介されています。
また、Ledge.aiの予測技術に関する記事一覧ページからも事例を確認できます。
予測の技術
予測と一言にいっても、アルゴリズムにはさまざまなものがあります。本章では予測のアルゴリズムをいくつか簡単に紹介します。
線形回帰
たとえば、コンビニの肉まんの販売個数を予測する際に、「気温が下がると、肉まんの販売個数が増加する」というような直線的な関係を仮定し、予測するものです。
編集部で作成
このとき、予測したい変数(この例では肉まん)を「目的変数」、予測に用いる変数(この例では気温)を「説明変数」と言います。
説明変数が1つだけのものは「単回帰」、複数のものは「重回帰」と呼ばれます。
線形回帰は単純で、どの説明変数との関係を重視した予測になっているか解釈が容易です。一方で、直線的な関係を仮定しているため、複雑な関係性は反映できないという欠点があります。
決定木
以下の図のように、説明変数の値にしたがってデータを振り分けていく構造をとる「決定木」というモデルを作成し、分類予測や回帰予測をします。
編集部で作成
分類予測用の決定木を「分類木」、回帰予測用の決定木を「回帰木」といいます。説明変数と目的変数の直線的でない関係も反映できます。複数の決定木をもちいて予測結果を導出する方法に、ランダムフォレストや勾配ブースティング木などがあります。
ニューラルネットワーク
ニューラルネットワークは以下の図の丸で示される複数のニューロンからなり、「入力層」「中間層(隠れ層)」「出力層」という部分に分かれています。
編集部で作成
入力層で入力される気温、天候といった説明変数の情報を中間層として介して統括し、出力層で最終的な判断をするような仕組みです。分類予測にも回帰予測にも用いることができます。中間層の数や(中間層が複数になったものはディープラーニングとなります)ニューロンの数により、モデルの複雑さを調節できます。どの変数がとくに重要などの解釈は難しいです。
時系列に着目したアルゴリズム
予測に用いられるデータの多くは、時間とともに値が変化する時系列データです。時系列データの場合、予測対象の値は自身の過去の値に影響されるという前提を置いたアルゴリズムを用いることも多いです。
自身の過去の値に影響される例としては、株価があります。株価は「最近、安値だ」「高値だ」などの状況をみて売り・買いする人がおり、その影響で価格が変化するため、未来の値は過去の値に影響されています。
ここでは、時系列に着目したアルゴリズムを2つ紹介します。
自己回帰モデル
「今日の株価は安いので、明日も安いだろう」というような、過去の値との直線的な関係を仮定し、予測するものです。先ほど紹介した線形回帰の説明変数に、目的変数の過去の値をあてがったものとも言えます。線形回帰に重回帰があったように、自己回帰モデルも過去の複数の値との関係を考慮することが可能です。
再帰型ニューラルネットワーク(RNN)
RNNは、予測対象の値は過去の値に影響されるという前提を反映できるニューラルネットワークです。通常のニューラルネットワークとは中間層の構造が異なっており、前時刻の中間層の出力を次の時刻の予測の際にも用いる仕組みとなっています。自然言語処理や音声処理でも用いられます。
上述したものは予測に用いられるアルゴリズムのごく一部です。
「ブラックボックスなモデルでもよいので高精度な結果を得たい」「人間にも理解可能なモデルで結果を得たい」など、予測を使う目的により予測へ求める要件は変わっていきます。また用いることのできるデータの状況も異なります。
求められる要件を満たせる適切なアルゴリズムを選ぶことが必要です。
予測の無料ツール
ここまで、予測の活用事例やアルゴリズムについて紹介してきました。本章では、実際に予測を試せる無料ツールを紹介していきます。
Prediction One(SONY)
CSVファイルで学習用のデータを与え、予測したい変数を選択するだけで予測結果を取得できます。予測に寄与した変数などの分析結果も自動で出してくれるため、どの変数を重視して予測したか理解できます。未来の物事の発生の予測にも値の予測も対応しており、幅広い対象に適応可能です。サイト上から登録可能で、30日間は無料体験できます。
未来予測ツール(User Local)
時系列データの予測ツールです。フォーム入力、またはCSV・TSV・Excel(.xlsx)ファイルをアップロードし、予測結果を取得できます。何時刻先まで予測するか、曜日や季節の影響を考慮するかといったカスタマイズも可能です。サイト上から無料で利用できます。
この記事では、AI予測の意味、事例、技術、無料ツールについて紹介しました。未来の物事の発生や値の予測などでもAIは活躍しており、多様な事例があります。データを用意するだけで予測結果や分析結果を取得できるツールも登場しています。無料ツールに限らなければ、さらに多くの予測・分析ツールを見つけられます。予測のハードルが低下し、活用が当たり前になることで、予測の活用による計画の効率化や行動の最適化は当然のこととなっていくでしょう。
「AIを使うこと」を目的に無理に予測を導入する必要はありません。ただ「予測を導入する価値がありそうな部分」があるならば、ハードルが下がりつつある今、後れを取らないためにも、AI開発やツールの導入を積極的に検討すべきと言えるのかもしれません。