JR西日本「ベンダーの提案すら理解できない素人だった」新幹線の“着雪量予測”データサイエンスコンペ開催までの「奮闘」

このエントリーをはてなブックマークに追加

北陸新幹線に乗ったことがあるだろうか。上信越、北陸地方を経由し、東京と金沢を結ぶ新幹線だ。

冬に金沢から北陸を通って東京を目指す際には、走行中に車両の下部に雪が付着する。雪が固まり、ある程度の大きさになると軌道に落下する場合もあり、軌道に敷かれているバラストと呼ばれる砕石が飛散し周囲に危険が及ぶ。雪を取り除くためには大量の人員を必要とするため、あらかじめ着雪量を予測し、雪落とし作業の要否の目処をつける必要がある。

▲雪落とし作業の様子 出典:JR西日本提供資料

JR西日本は、2019年から新幹線の着雪量予測にAIモデルの試行を開始した。このAIモデルは、データサイエンスコンペティションであるSIGNATE(外部サイト)でのコンペによって生み出されたという。

AIモデル作成に、なぜコンペという方法を選んだのか? そもそも、重厚長大な鉄道会社が、どのようにしてコンペ開催まで至ったのか? コンペによってどのような成果が得られたのか? JR西日本 鉄道本部 技術企画部 データソリューション 兼 海外鉄道事業推進室 担当課長の宮崎祐丞さんに話を聞いた。

データを駆使して一日で数百万円を救える可能性

JR西日本は2018年3月に技術ビジョンを策定し、「持続可能な鉄道・交通システムの構築」の実現に向けて取り組みを開始。そのための施策のひとつとして、データサイエンスによる業務改革を推進している。

宮崎さんは、2017年5月末まで黄色い新幹線「ドクターイエロー」で知られる新幹線の線路保守を担当する部署に所属。2017年6月の技術企画部内の「データ戦略・CBM専任グループ」発足を機に、同グループのビジネス担当のリーダーとしてアサインされた。

データサイエンスによる業務変革を促進するための、成功事例創出の必要性から、冒頭の着雪量予測に取り組むこととなったという。

JR西日本 鉄道本部 技術企画部 データソリューション 兼 海外鉄道事業推進室 担当課長 宮崎祐丞氏

――宮崎
「前部署に在籍していたときから車両の着雪量を調べたりしていたため、AIプロジェクトを開始するために必要なデータがあるのは分かっていました。コンペが開催できるギリギリのデータ量でしたね」

冒頭で紹介した通り、冬季に新幹線が金沢から関東に来る際は、雪が落下することによる危険を回避するため、車両に付着した雪を落とす必要がある。そこで、気象会社から提供される着雪量の見込みをもとに、翌日の雪落としの要否を判断していた。

しかし、従来手法では精度が低く、予測がかなり外れてしまっていたという。その結果、雪落としの出動指示が出たにも関わらず、現場に来てみると雪がそれほど付着していていない事態が発生していた。

――宮崎
「北陸新幹線は通常12両編成で、1両に台車が2つ付いているので24台車あります。1両に2名の人員を付ける場合、24名をアサインする必要があるので、予測精度が上がれば最低でも一日で数百万円の人件費を救える可能性があったのです」

データサイエンスコンペの存在を知る

そもそもデータ戦略・CBM専任グループ発足時、グループ内にデータサイエンス分野の知見・経験はまったくなかった。そのため、ブレーンとしての社外の分析ベンダーの選定を開始した宮崎さん。

しかし、ベンダー各社のプレゼンを聞いただけでは、選定が難しかったという。

――宮崎
「10社ほどのベンダーに話を聞きましたが、似たようなパワポとプレゼンをいただいてもベンダーの実力はその時点では把握できなかったんです。何より、私たちも当時はド素人だったので理解できないのは当然でした

そのほか、共同研究という名目で大学教授などにアプローチするも、スピード感が折り合わなかった。

そんなとき、転機が訪れた。宮崎さんの大学時代の研究室の同級生がGiXoというデータ分析・コンサルティング会社を立ち上げており、相談を持ちかけたところ、Kaggle(外部サイト)などのデータサイエンスコンペティションの存在を知ったという。

Kaggleとは
機械学習・データ分析のコンペティションプラットフォーム。
――宮崎
「コンペという存在をそこで初めて知りました。データサイエンスの実力を測定できる場所があったのか、と。とはいえ、最初からKaggleコンペ開催はハードルが高い──。

そう思っていた折に、たまたまSIGNATEの齊藤代表と話す機会がありました。弊社のデータを見せたところ、このデータならコンペをできる、ぜひやろう、という話になったんです」

コンペ開催までの奮闘

社内にコンペ開催を提案したところ、予想したほどの反対はなかったという。しかし、「社内には賞金を懸けてのコンペにとまどいも見て取れた」と宮崎さんは語る。

――宮崎
「鉄道会社は車両開発をはじめ、自前でなんでも作るのが当然という文化でした。しかし、データサイエンスは伝統的な鉄道工学分野とはワケがちがう。GAFAをはじめ、技術が社外で恐ろしいスピードで発展し続けているので、自前主義を貫くのが無理なのは社内のみんなが薄々感じていました。

例がよくないかもしれませんが(笑)警察庁は指名手配犯に懸賞金をかけている。昔から官庁ですらオープンイノベーションをやっているのに、ウチもやらなくてどうする! と引き合いに出し、社内の説得を試みました。たとえコンペでデータを社外に公開しても、雪の量などのデータを見られたところで害はないですしね」

中でも、一番丁寧に説明したのが、雪落としの現場を抱える支社だったという。

――宮崎
「前任から着雪量の予測に携わっていたので、自分としては当事者のつもりだったのですが、意義と効用を十分に伝えきれず、支社の事情を考慮していないプロジェクトと受け止められ、理解してもらうのに相当な時間がかかりました。説明をし始めたのがプロジェクト開始のわずか1ヶ月前だったので、遅すぎたのは否めませんが(笑)。

しかし、完成したAIモデルを使った着雪量予測の精度が出た瞬間に、好意的に受け止めてもらいました。やっぱり動く現物を見てもらうのが説得には一番だと感じましたね

コンペの結果、思わぬ副産物も

社内の説得に奔走し、ようやくコンペの開催が決まった。コンペ開催の目的は2つあったという。

――宮崎
「一つ目は、社内でまずは一回でもデータサイエンス・AIプロジェクトの成功体験をつくること。二つ目はベンダーの実力を把握することです」

宮崎さんは、まずは成功体験を作ることで、社内でデータサイエンスを推進しやすくなると考えた。一方、ベンダー各社は実力把握のためのコンペを開催することに、どう対応したのだろうか。

――宮崎
ベンダーには、匿名アカウントを作ってもらいコンペに参加してもらいました。社内にも参加募集の告知を行い、結果的に社内外含め400人ほどが参加してくれましたね」

コンペ開催側の見返りとして、SIGNATE側から上位3位までのソースコードが譲渡される。結果、コンペによって予測精度の高いモデルを得ることができ、現在は着雪量予測AIとして稼働中だという。

しかし、もっと驚くべき「副産物」があったと宮崎さんは言う。

――宮崎
「JR西日本社員が4名参加しており、しかも上位に入賞したんです。当初ノーマークだった社員が3位、8位に入り、話を聞いていたベンダーよりも社員のほうが順位が高いという結果になりました

上位入賞した2名は、それぞれ趣味でデータサイエンスに取り組んでおり、1人は自動改札機のメンテナンス部署に所属し、もう1人は新幹線の運転士だった。今ではそれぞれの部署から異動し、宮崎さん率いる技術企画部データソリューショングループに所属。自らAIモデルを構築・ビジネス実装を手がけ、ベンダーとも対等に会話できる即戦力として活躍しているという。

また、コンペに参加したベンダーはモデルの精度が低かったわけではなく、実際に上位入賞もしていた。現在では、自社で対応するのが難しい課題についてはいつでも相談できる体制を作り、すばやく精度を確認したい場合は、コンペを通じてパートナーとして選定し、資本業務提携を交わしたGiXoに相談する役割分担の体制を敷いているという。

――宮崎
「開発を完全に外注しては、ノウハウが社内に蓄積しません。プロジェクト初期は外部パートナーと連携し、ある程度社内にノウハウが貯まったのちに内製を進めるオープン&クローズ戦略がベストだと思います

「具体的な課題認識」を社内研修でも徹底

モデルと優秀な人材を手にしたJR西日本。「ほかにも重要な学びがあった」と宮崎さんは話す。

――宮崎
「初動時にベンダーの話を聞いても理解できなかった理由として、現場でどう使われるかというユーザーニーズを考慮できていなかったのに加え、何より現場を巻き込めていなかったのが反省点だと感じていました。反省点からの学びを社内の人材教育に活かしています」

そういって宮崎さんが見せてくれたのは、以下のシートだ。誰がどう困っているのか、具体的にどのくらいの効果が見込めるのかを明確にするためのものだという。

出典:JR西日本提供資料

宮崎さんのチームも活動初期は、上記のシートを漠然とした粒度でしか埋められなかった。しかし、今では数字やどのデータを使うかの戦略まで含めた、具体的な粒度でシートを埋めることができるようになったという。

――宮崎
「コンペを通して、具体的な課題設定をすることの重要性を痛感しました。みんな、なんとなく業務上困っていること・課題だと感じていることはわかっていても、具体的・定量的に表現するのは意外と難しいのです。とはいえ、データ分析を価値あるものとするためには非常に重要なポイントなので、ここで妥協してはいけません」

データソリューショングループの社員が講師をつとめる社内のデータサイエンス研修では、このシートを埋める作業を行い、課題感を明確にすることでプロジェクト成功時のイメージをつかんでもらうという。もちろん、宮崎さんのチームがつきっきりだ。

重厚長大産業でも見えたAI活用の可能性。コンペもひとつの選択肢

コンペを経て、データサイエンス組織へと脱皮しようとしているJR西日本は、今後どのようなポジションを目指すのか。

――宮崎
「結局、AI・データサイエンスは着手したもの勝ちな部分があります。オープン&クローズ戦略や人材育成など、他社が簡単には真似できないJR西日本のコアコンピタンスをさらに強化していきます。西日本というひとつの課題先進地域として、顕在化している課題に一番最初に手を付け、先例を示し続ける使命がある、と思っています」

鉄道会社などの“モノ”を持つ産業では、どのようにデータを取得し、どこにデータ貯めるかなどのIoT戦略が重要となる。将来的には、JR西日本社内のそれらを担う現場に対して、よりAI・データサイエンスを普及させていきたいと宮崎さんは語る。

――宮崎
「データをどこにあるどのデバイスから取得し、どのようにデータを貯めるかの戦略立案には、時間もお金もかかります。鉄道会社という重厚長大なビジネスだからこそ、IoT戦略を適切に理解し立案できる、現場やビジネスサイドにデータサイエンスを浸透させていきたいと思います」

Ledge.aiでは過去にAI導入事例を何度も取材してきたが、成功している企業に共通するのは、担当者が現場のニーズを正しく理解しようとしていることだ。導入ありきで適切な課題設定をせずに、現場でAIがどう使われるのかを理解していなければ、AI活用は成功しないと言っていい。

AIの精度を上げる手段としてデータサイエンスコンペを活用するには、プロジェクトの目的を理解し、課題認識の粒度を向上させる必要がある。だからこそ、JR西日本のようにデータサイエンスコンペを準備する段階で自社の課題に対しての理解が進むのだろう。

今回のように、社内に眠る「隠れデータサイエンス人材」も発掘できる可能性がある。“使えるデータ”を持っている企業であれば、データサイエンスコンペの開催はひとつの有力な選択肢かもしれない。