「AI導入は当たり前。最高のマシンが必要になる」DataRobotのデータサイエンティストら語る未来

このエントリーをはてなブックマークに追加

DataRobot Japan 株式会社は11月19日(金)、同社のプライベートイベント「AI Experience Virtual Conference 2021」を無料開催した。

AI Experienceは2017年に日本で始まり、現在ではグローバルで開催している。今回のテーマは「THE NEXT GENERATION OF AI〜拡張知能によってあらゆる人にビジネス革新を〜」だ。

この記事では、DataRobot, Inc. データサイエンス ディレクターの小川 幹雄氏、DataRobot, Inc. AIエバンジェリストの松舘 学氏が登壇し、DataRobotの進化と今後について語った「DataRobot 基調講演」をレポートする。

DataRobot, Inc. データサイエンス ディレクター 小川 幹雄氏
DataRobot Japan 3番目のメンバーとして参画。現在は、金融業界を担当するディレクター兼リードデータサイエンティストとして、金融機関のお客様でのAI導入支援からCoE構築の支援を行いながら、イベント、大学機関、金融庁などでの講演を多数実施。

初期はインフラからプロダクトマネジメント業、パートナリング業までDataRobotのあらゆる業務を担当。前職ではデータマネジメント系の外資ベンダーで分析ソリューション・ビッグデータ全般を担当。

DataRobot, Inc. AIエバンジェリスト 松舘 学氏
DataRobot AIエバンジェリスト兼コミュニティマネージャー。オンラインコミュニティや、ユーザー会を担当。

20年に渡り外資系ソフトウェアベンダーでのデータ分析の経験を軸に、エバンジェリスト、Techコミュニティ運営をリード。コミュニティを通じてDataRobotが提供するAugmented Intelligenceを可能にするAIプラットフォームのメッセージを発信中。

「AI導入は当たり前。最高のマシンが必要になる」

小川氏は当初のDataRobotの需要について、「データサイエンティストにDataRobotを気に入っていただいて、彼らがやっていた大変な作業をデータロボットで自動化できるようになりました。私自身も元データサイエンティストなので、最初にDataRobotを見たときに『すごい!こんなに自動化できるなんて』と感動したのを今でも覚えています」と振り返る。

「5年前のDataRobotも単純にCPUパワーでぶん回しているわけではなく、たくさんあるデータサイエンスのステップを自動化しました。これまでデータサイエンスをやってきたわけではない一般の人がDataRobotでパワードスーツを着るように、従来のデータサイエンティストと同じようなスペックで、データサイエンスをすることが可能になりました」(小川氏)

現在、さまざまな企業でAI導入は進んでおり、「AIプロジェクトはスポーツチームに変革した」と小川氏は位置づける。データサイエンティストが中心になり、多数のAIエンジニア、MLOpsデータエンジニア、インフラエンジニアなどが支える状況になったと話す。

「マッキンゼーのレポートでは、実はAIのリーダー企業はそれぞれで大きな差を出していることがわかっています。これまではAIを導入することだけが競争力になっていましたが、今では導入は当たり前です。ものすごく大量にAIに投資をして組織を作り、コミットしているAIリーダーと言われる会社は、投資に対して3.4倍の価値を出しており、8%の営業利益につながっていることが明らかになっています」(小川氏)

小川氏は「ただ、AIを使って車を運転するだけではなく、レースに勝っていくところが重要なポイントです。勝つためには最高のチームワークと、それを支える最高のマシンが必要になります」と前置きした上で、「DataRobot AI Cloud プラットフォーム」を紹介した。

本プラットフォームは、主要な機能としてデータを準備するフローを自動化できる「Data Pipeline」、ノーコードで誰でも簡単にDataRobotのAIモデルを組み込んだアプリを作れる「No Code App Builder」を採用している。

小川氏は「多様なデータソースをビジネス価値にしていくところはもとから変わりませんが、従来はデータサイエンスのエキスパートのためのツールでした。『いかに速く良い機械学習のモデルを作れるか、自動化できるか』が私たちの主軸でしたが、今回はデータサイエンティストだけのためのツールではなく、ITやDevOpsチームにも、ビジネスの意思決定者にも使いやすくしました」と語る。

「従来、私たちのコアバリューだった機械学習だけ使いたい人もいれば、機械学習とディシジョンインテリジェンスを使いたい人、データエンジニアリングと機械学習、MLOpsを使いたい人もいるという形で、モジュール単位でピックアップもできます。まさにDataRobot AI Cloud プラットフォームという名前の由来にもなっています」(小川氏)

「今日公正なモデルも明日には不公正になる可能性もある」

DataRobot AI Cloud プラットフォームには、Data PipelineやNo Code App Builderのほか、データサイエンティストがコードでモデルを構築し、グラフでデータを確認できる「Cloud Hosted Notebooks」、データサイエンティストがAutoMLで自動構築したモデルを独自に編集可能となる「Composable ML」も搭載している。

松舘氏はCloud Hosted Notebooksについて、「コードが大好きなエキスパートデータサイエンティストの方からは『全部、コードを書きたい』といったニーズもあります。高度なデータサイエンティストの方が自由にモデルを構築して、グラフでデータの確認することを全部コードでできるツールです」と説明する。

Composable MLに関しては「事業会社の方からは、自分の業界のドメイン知識でデータを加工したいなどのニーズがあります。Composable MLではAutoMLの自動ですべて作る部分と、少しカスタマイズする部分をデータサイエンティストの方に解放できます。すべて自動かコードかという二者択一ではなく、いいとこどりをしていただけます」と話した。また、AI Cloud プラットフォームのメリットについては「データサイエンティストやビジネスユーザーが好みでツールを選んでも、データとAIプロジェクトを共通基盤上で利用できることです」と続けた。

また、AIのモデルを運用するにあたっては、パンデミックや経済ショックなどの予期せぬ変化への対応を迫られたり、公正性に欠けるバイアスが生まれたり、さまざまな課題がある。

松舘氏は「DataRobotでは『Continuous AI』という機能をリリースします。モデルの再学習ポリシーをある程度設定しておくことで、モデルの精度が閾値(しきいち)より下がってしまった時にアラートを発報できます。今動いているモデルに対してDataRobotのAutoMLを使って、対抗となるモデルを生成する機能も実装しました」とアピールした。

「AIがこれだけ広く社会に受け入れられると、倫理性が問題になってきます。特に採用で性別や年齢などの要素について、何かバイアスがかかる危険性があります。世論の流れで今日公正だと思われているモデルも、明日には世相が変わって、モデルが不公正になる可能性も考えられます」(松舘氏)

松舘氏は「DataRobotでは『バイアスと公平性』という機能を提供しています。公平性の指標をおよそ5つ用意しており、特定のバイアスが発生しそうなモデルについてテストできます。モデルの中にバイアスが存在しないかを常にモニタリングします」と語った。

「今後目指していく先は『融合』と『業界特化』」

最後には、松舘氏からバトンタッチする形で再び小川氏が登場し、DataRobotの今後について「簡単に2つの言葉で表すと、DataRobotが今後目指していく先は『融合』と『業界特化』です」と話した。

DataRobotはさまざまなデータサイエンスの会社を買収しており、ファミリーに迎え入れている。最近では、データ準備はPaxata、コードはZepl、MLOpsはAlgorithmia、最適化はdecision.aiが挙げられる。

小川氏は「ソフトウェア系の会社では買収したけれど、結局プロダクトとしては完全にバラバラで提供していることがよくあります。DataRobotでは将来的に皆さんがDataRobotを触った時に、もともとは別の会社のツールだったことを気づかないレベルで、『融合』させることを目指しています」と語る。

「『業界特化』に関しては、実はすでにDataRobotのチームは金融チーム、流通チーム、製造チーム、ヘルスケアチームなど、顧客のAIを担うチームが分かれています。今後、この部分をさらに細分化していき、製品としてもより皆さんの業界に特化したものを提供することで、皆さんがいち早くDataRobotから恩恵を得られるようにしていきたいと思っています」(小川氏)