米スポーツメディアESPNが約600万記事以上をIBM Watsonで解析・結果予測 ── 13勝0敗という驚異の実績

このエントリーをはてなブックマークに追加

リオデジャネイロ・オリンピックでVR観戦がおこなわれたり、サッカー・ワールドカップでNHKがマルチアングルを取り入れて話題になったり。技術の進化に伴ってスポーツの楽しみ方はより多様なものになってきています。

そんなスポーツ観戦の世界に、AIによる試合予測で新たな楽しみ方を提供する実験がおこなわれています。

今回は、試合内容を予測することによって楽しむゲーム「ESPN Fantasy Football」に使われるIBM Watsonの予測AIについて紹介します。

IBM Watsonによる試合予測を取り入れたESPN Fantasy Football

ESPN Fantasy Footballは、アメリカで人気を誇るアメリカンフットボールのバーチャルリアルゲームです。

ESPN Fantasy Football
NFLの全チームから好きな選手を選びオリジナルチームを編成し、実際におこなわれた試合の活躍に応じてポイントが加算され、ポイントの多いチームが勝利。NFLの実際の試合と連動するバーチャルリアルゲームです。

IBMのWatsonは、NFLの試合を予想し、Fantasy Footballのユーザーがどの選手を使うべきかの決断を助けています。

AIを用いた予測は昨年からおこなわれていましたが、2018シーズンはこの技術・予測の提供にさらに本腰をいれているそうです。

IBM Watsonがプレーやケガを細かく予想

IBM Watsonは、さまざまな情報をもとに選手のプレー内容コンディションケガなどを予想することができます。

スポーツの試合では、専門家の予想を大きく覆す試合内容・結果になることがありますが、果たしてAIによる試合予測は可能なのでしょうか。

実際の例を見てみましょう。

予測例①: New England Patriotsのクォーターバック、Tom Brady選手(2018年9月10日 New England Patriots対Houston Texans戦)

  • 獲得ヤード:284.3ヤード
  • タッチダウン:2.1回
  • インターセプト:0.6回
  • ファンタジーポイント:19.4ポイント
  • 好調(23.8ポイント以上)の確率:29%
  • 不調(12ポイント以下)の確率:12.2%
    *ファンタジーポイント・・・Fantasy Footballのゲーム内で、選手の活躍によってつけられる値。

獲得ヤード、タッチダウン、インターセプトの回数、そしてそれらをもとにFantasy Football上でもらえるファンタジーポイントが予測されています。

さらに、好調であるか、不調であるかも確率で予測されています。

結果内容

  • 獲得ヤード:277ヤード
  • タッチダウン:3回
  • インターセプト:1回
  • ファンタジーポイント:21.3ポイント

獲得ヤード、タッチダウン、インターセプト、ファンタジーポイントどれも予想と近い値が出ています。

別の例も見てみましょう。

予測例②: Pittsburgh Steelersのランニンングバック、James Conner選手(2018年10月28日 Pittsburgh Steelers対Cleveland Browns戦)

  • 獲得ヤード:119.0ヤード
  • タッチダウン:1.1回
  • インターセプト:0回
  • ファンタジーポイント:22.3ポイント
  • 好調(23.8ポイント以上)の確率:11.3%
  • 不調(12ポイント以下)の確率:7.3%

結果内容

  • 獲得ヤード:212
  • タッチダウン:2回
  • インターセプト:0回
  • ファンタジーポイント:38.2ポイント

獲得ヤード、タッチダウンの回数ともに現実がAIの予想を上回る結果を出しています。やはりスポーツには、コンディションや相性などさまざまな要素が絡むため一筋縄ではいかないようです。

こうしたWatsonの試合予測は、毎週以下のようにwebサイトに公開されています。

膨大な情報が蓄積されているスポーツメディアの活用

今回の予測ではIBM Watsonを使っていますが、注目すべき点は非構造化データに着手し、予想をおこなっている点です。

構造化データと非構造化データ

  • 構造化データ
    CSVファイル・固定長ファイル・Excelファイルといったデータベースに格納し活用できるデータ

  • 非構造化データ
    文書データ・電子メール・写真・動画といった定型的に扱えないデータ。


構造化データは、集計・比較などデータ分析に適している一方、非構造化データはそのままデータ分析することができずデータ処理が必要である。現在では、非構造化データの割合が増え、データ分析に非構造化データを扱う場面が増えている。

競馬競艇などではすでに高い精度で予測ができていますが、それは基本的に過去の試合の結果や会場、天候のデータであり、構造化データです。

一方で、今回の予想では、より複雑に要素が絡み合うアメフトであるため、構造化データだけではなく過去に投稿された記事やブログなどの非構造化データも用いて、細かい選手の状態や相性を解析しています。

非構造化データは価値ある情報をたくさん含んでいますが、そのままでは定型的に扱うことができません。

そこで導入されたのがIBM Watson。

IBM Watsonはシーズンで600万以上の記事、毎時3000記事もの新たなソースから学習し、常に情報を最新に保っています。

非構造化データの解釈を具体的に学習させる方法としては、2つのDoc2Vecモデル(文章をベクトルで表示)を採用しているそう。

  • 過去の記事(非構造化データ)
  • 定義やルール(構造化データ)

これら2つを合わせることで予想をおこなっています。

実際、WatsonのAnalogy Test(類推テスト)での正解率は97.96%、少し難易度があがるKey Word Test(キーワードテスト)でも76.01%の正解率を出しています。

こうして読み取ったデータをもとに好調、不調、怪我などさまざまな要素を予想しているそう。

実際に、予測を元にFantasy Footballをおこなったユーザーはレギュラーシーズンで13勝0敗という圧倒的な結果を残したようです。

アメフトの予測においてAIは人間(一般的の人)を超えていると言えるのではないでしょうか。

市場規模が大きいスポーツ分野におけるAIの可能性

今回紹介したAIによる選手データの収集と試合予測、バーチャルリアルゲームでのユーザーへのアドバイスとして使われていましたが、多岐にわたる応用が考えられます。

たとえば、スポーツメディアが試合予想にAIを活用したり、スポーツゲームに最新情報を反映させることで、ゲーム内世界をよりリアルなものにしたりできるでしょう。

また、多くの専門家がスタメンや試合結果などの予想をおこなっていますが、AIもいち専門家として用いられるようになるかもしれません。

ほかにも、情報を整理し公平な視点で知見を引き出すことで、監督への戦術立案支援や、実況者・解説者への情報支援もユースケースとして考えられます。

監督や実況者、解説者がAIのアシストを受けることで、より高いレベルの指揮、実況、解説を実現できる可能性は高まりそうです。

スポーツ市場は規模が大きいことから、新技術の導入スピードも速い特徴があります。AIがスポーツの世界で存在感を発揮し始めるのも、もうすぐなのかもしれません。