「産学の垣根を取り払う」日本のデータサイエンティスト育成に足りないもの

このエントリーをはてなブックマークに追加

CEO認定書を受賞した学生達

国内で25万人のAI人材を育成すると政府が掲げたのは記憶に新しい。日本の強みはリアルデータ(バーチャルデータ:インターネット上のデータに対して、リアルデータ:現実世界で取得できるデータ)だと言われており、データを適切に活用できるデータサイエンティストの育成が急務となっている。

参考記事:経産省が進める“課題解決型”の人材育成「AI Quest(エーアイ・クエスト)」、その全貌

そのデータサイエンティスト人材を認定する「CEO(サーキュラーエコノミー推進機構)認定書」の授与式が、5月20日に開催された。当日の登壇者が語ったことを抜粋する。

CEO(サーキュラーエコノミー推進機構)とは?

CEOは、IoT、ビッグデータ、モバイル、クラウド、AI領域の人財育成をはじめ、情報提供や提案などを行うために設立された組織だ。

主に問題意識の高い大学、研究機関がアドバイザリーボードとして参画しており、理事会員にも名だたる上場企業が揃う。

出典:CEO公式サイトより

会の冒頭、望月 晴文代表理事は、設立にあたり「企業とアカデミアのギャップ」に対する問題意識があったという。

――望月
「学生は現場で使われる実データに触れる機会がなく、企業にはデータがあっても使いこなせる人材がいません。そこで、両者をつなげるネットワークの役割を持つのがCEOです」

出典:CEO公式サイトより

個々の企業が個別にビッグデータ活用の取り組みをしても、世界での競争力は弱いままだ。そこで企業とアカデミアが共同で行うことで問題を解決したいという。

来賓として登壇した経済産業省大臣官房長の糟谷 敏秀氏は、「産学が連携したデータサイエンティスト育成が急務」と語った。

――糟谷
「第4次産業革命のもとではデータがあらゆる付加価値の源泉になります。GAFAの登場でネット上の勝敗は決しました。一方で、第2幕では、良い現場に根ざしたリアルデータを持っている日本の番だという議論があります。

しかし、日本にはまだデータを使いこなせる人材が多くありません。大学では文理という壁に阻まれ、学部を超えたコースがなかなか生まれず、横断的にデータサイエンスを学べる環境が存在しません。データサイエンスに必要な知識である統計学は経済学の分野ですし、コンピューターの知識は理学部や工学部で学ぶことが中心です」

これらは大学のみで閉じた議論をするだけでは解決しない。社会人になった人にどうデータサイエンティストになってもらうかも重要な議論となる。そのような議論をしていくうち、生まれたのがCEOの構想だという。

CEOを取り巻く世界の状況

CEO設立から1年を振り返った北川 高嗣理事は、CEOが設立された背景に、「企業とアカデミアのギャップがある」と語った。

――北川
「企業とアカデミアのギャップは、それぞれが危機的な状況にあり、早急に解決しなければなりません。

ここで重要な議論は、そもそもデータサイエンスは何をもってサイエンスなのか? という疑問です」

北川氏によれば、科学は以下の4つの順番で発展してきた。

  • 経験科学:実際の事象を観察して研究する
  • 実験科学:仮説を立てて理論を実証する
  • コンピューターサイエンス:人間が創り上げた方程式をコンピューターに埋め込み、仮想的な現象を作りシミュレーションを行う
  • データインテンシブサイエンス:データを分析して新しい発見を見つける

データインテンシブサイエンスという言葉は、2009年ごろに生まれた。2010年代にデータを蓄積できる環境が整ってきたことによって急激に発展した分野であるという。

――北川
「たとえば梶田先生(東京大学)は、スーパーカミオカンデのデータを分析することで、ニュートリノに質量があることを発見し、ノーベル物理学賞を受賞しました。2000〜2010年代にかけて、データは科学として価値を生み出せることがわかってきました」

また、アルファ碁の登場で、特定の状況ではAIが人間の能力を超えることもわかってきた。主に画像認識、音声認識、言語処理の分野で人間以上の能力を発揮できることが顕著になってきた。

一方、企業の側でもデータの重要性が説かれてきたという。2013年にゼネラルエレクトリックが「ソフトウェア会社への転換」を発表したのを皮切りに、数多くの企業がデータの活用が最重要課題だとの立場をクリアにしてきた。

今後は、UberやAirBnBをはじめとしたビッグデータを活用できる企業が、GAFAより大きなトレンドを生み出していくと北川氏は言う。

では、これらのバックグラウンドがあったうえで、CEOはどうしていくのか。

――北川
「CEOのキックオフでも言ったことですが、『説明変数と評価関数がほぼ確立している学術領域の研究者は全員AIに代替可能』というインサイトがあります」

説明変数とは、「目的のためにどのようなデータを使うのか」を表す。SNS、センサーデータ、他社データなど、現代では使えるデータは多種多様になっている。そのうえで、評価関数は「設定した目的をどの程度達成しているか」という評価の部分だ。

これらの「意思決定」に関わる部分は、今のところAIでは代替するのは簡単ではない。企業のトップに求められていくのは、ビジョンを執行する、そのための意思決定をすることだ。それを成すために、北川氏は「CEOはアカデミアとインダストリーの垣根を取り払うために行動していく」と語った。