データサイエンティストとは | 仕事やスキル、需要、将来性を解説

このエントリーをはてなブックマークに追加

企業のデータ活用を推進する上でデータサイエンティストは大きな役割を果たしています。

社会の情報化が進行し、あらゆることがデータから導かれるようになった現代において、データサイエンティストの注目度は増しています。また、AI技術の急速な発展もデータ活用の需要を後押ししています。

本記事では、データサイエンティストの意味や仕事内容、求められるスキル、将来性を解説します。

データサイエンティストとは

データサイエンティストとは、ビッグデータを分析・解析し、それをビジネスに活用するための知見・情報を引き出す職業を指します。

ビッグデータとは
ビッグデータとは、従来のデータベース管理システムなどでは記録や保管、解析が難しいような膨大なデータ群のことです。データサイエンティストはこのデータ処理や統計処理を行い、得た情報を企業のビジネスへ活用する方法や、事業や企業が利益を生み出す方法を予測します。

データサイエンティスト誕生の背景

データサイエンティストが誕生した要因は2つあります。

クラウド・コンピューティングの広がり、SNS(Social Networking Service)の普及、センサーネットワークやスマートフォンの普及などを背景に、デジタルデータが爆発的に増加しました。このことを「情報爆発」と呼びます。情報爆発に伴い、ビッグデータを用いたデータサイエンスが、ビジネスなど多様多種な業種に変革をもたらすと期待されています。
膨大なデータが至る所に偏在し、誰でもアクセスできる時代に突入した今、データ分析/活用は世界中の企業や社会に革新的なメリットをもたらす可能性があります。このメリットを享受するためには、テクノロジーによって格納される大量のデータを解釈する必要があり、そこで求められるようになったのがデータサイエンティストです。

データサイエンティストが注目される理由

データサイエンティストが注目されている理由として、「ビッグデータ市場の拡大」「AI市場の拡大」が挙げられます。

ビッグデータ市場の拡大に伴う需要の増加

近年は社会の情報化が進み、ビッグデータ市場は拡大しています。本格的なデータ活用に乗り出す企業が急速に増えています。そのためデータ分析・解析を行うデータサイエンティストは企業の競争力を左右する重要な役割を担うことになり、需要が高まりつつあります。

AIを使いこなす人材としての期待

ディープラーニングの登場以降、世界的にAI開発競争が加熱しています。ディープラーニングの精度を上げるためには教材となるビッグデータが必要であり、そのためデータの扱いに長け、AIの開発にも関われるデータサイエンティストの需要が拡大しているのです。

データサイエンティストの年収

データサイエンティストの平均年収はおおよそ650万〜750万のレンジに転ぶといわれています。メガベンチャーや大手企業によっては年収1,000万円以上を提示している場合もあり、データサイエンティストの需要の高さが伺えます。ほかの職種と比べても高水準であるデータサイエンティストですが、専門的なスキルが高いほど高年収が期待される職種です。

現在データサイエンティストは人手不足にあることから、その獲得を巡って企業間の競争が激化しています。データサイエンティストとしての経験はなくとも、必要な知識があると判断された場合であれば採用されることもあるといわれています。

データサイエンティストの仕事内容

データサイエンティストの仕事内容は簡潔にいうと「データを分析し、ビジネスに活用させること」です。

業務内容は課題抽出データ収集・整理データ分析課題解決・提言に大別されます。

課題抽出

「課題抽出」では、ビジネス上の課題に対してデータ分析で解決したい事柄を設定します。
ターゲットにすべき課題と達成目標の明確化、課題の洗い出しと優先順位付け、課題解決のための仮説立案などの作業を行います。

データ収集・整理

「データ収集・整理」では、課題解決に必要となるデータを収集し、保管する環境を整備します。
分析のもととなるデータを業務システムやSNSなどから収集するように環境を構築。収集するだけでなく、扱いやすい形式に変換・統一します。

データ分析

「データ分析」では、分析手法に沿って、収集したデータを分析し、ビジネス上の課題解決につながるような知見をあぶりだします

データを組み合わせて解析し、統計的に有意なデータ項目を特定します。「大量のデータ群から意味のある項目を見つけ出す作業」といえるでしょう。

ここでは、データ分析ソフトウェア(R、SASなど)登場します。データサイエンティストは、行いたい分析手法に対して適切なツールを選んで分析を行います。

課題解決・提言

「課題解決・提言」では、データを分析して得られた知見をビジネス上の課題解決に結び付け、レポートを作成して報告します。

具体例

  • データ分析の結果をレポートにまとめる際に、レポートを見た人が内容を把握しやすいように、図形やグラフィックの形で表現
  • 整理した分析対象となるデータ項目をKPIとして設定し、レポートにまとめ、解決策を提言
  • データサイエンティストに求められるスキル

    データサイエンティストは、データサイエンスに対する理解はもちろんのこと、実際に会社に活かすためのビジネス力も求められます。
    以下に代表的なスキルを抜粋して解説します。

    ◼︎プログラミングスキル(Python、R言語、Javaなど)
    データサイエンティストには、プログラミング言語の知識やコーディングスキルが必須です。データサイエンティストの仕事では、ログ収集のバッチ作成やBI(Business Intelligence)ツールへのデータ挿入など、プログラムを書く機会が頻繁にあります。

    PythonやR言語の需要は高く、とりわけPythonはさまざまなアプリケーション制作にも相性が良く、万能であるためにPythonへの移行が活発化しており注目されています。


    ◼︎データベースに関するスキル(Hadoop、Spark、SQLなど)
    データサイエンティストが扱うデータは基本的にデータベースに格納されています。そのため、分析基盤環境を構築する際だけでなく、利用する際にもデータベースに関する深い知識が求められます。データベースを操作するための言語であるSQLでデータを抽出できることに加え、Hadoop、Sparkの理解も求められます。


    ◼︎データ分析ソフトウェアに関するスキル(Excel、R、SAS、Tableauなど)
    多くのデータ分析手法は途中計算が非常に煩雑なため、基本的にはデータ分析ツールを用いて分析を行います。そのため、データ分析ツールを使いこなせる必要があります。回帰分析など、Excelでも使用できる分析手法もありますが、より専門的なデータ分析手法にはオープンソースソフトウェアであるRなどが用いられます。

    Tableauは、タブローソフトウェア社が販売するBI(ビジネスインテリジェンス)に特化したデータの可視化ツールです。データ分析の専門知識がなくても、マウス操作で簡単にデータ分析ができるソフトウェアです。


    ◼︎データ分析手法に関する知識(統計学、データマイニング、数学など)
    データ分析では、データの統計処理や数理モデルを作成することで、分析を進めています。そのため、統計処理手法やデータマイニング手法について理解しておく必要があります。

    たとえば、売上に関係するユーザー属性を特定するためには重回帰分析、課金ユーザーと無課金ユーザーの行動の違いを分析するためには決定木分析、ユーザーをセグメントに分割するためにはクラスター分析を用います。このように、自らが必要とする結論を出すためにどのような分析手法を用いればよいのか知っておく必要があります。

    また、データ分析の共通語である数学の知識も必要です。データ分析の書籍にもほぼ必ず数学が登場します。そのため、最低でも高校卒業程度の数学(特に確率・統計・微分積分・行列が必要とされる)を身につけておく必要があります。


    ◼︎機械学習に関する知識
    社会の情報化によってデータ量が増加する一方で、それに伴い分析で扱うデータ量も増大しています。そのような時流で、人力での分析はどうしても限界があります。

    そこで登場するのが機械学習です。機械学習とは、コンピューターが大量のデータを学習し、分類や予測などのタスクを遂行するアルゴリズムやモデルを自動的に構築する技術です。機械で自動的に分析することで、短時間でより多くのデータ分析が可能になるため、データサイエンティストに必須の知識です。


    ◼︎ビジネス力(コミュニケーション能力、クリティカルシンキングなど)
    データサイエンティストは、技術的なスキルだけでなくビジネススキルも求められます。

    データの分析に使う統計や人工知能などのスキルは専門性が高いため、提案内容などを説明する際には、専門的な用語を相手に伝わりやすい言葉に置き換えるなど、コミュニケーション能力も重要です。

    また、クリティカルシンキング(批判的思考)も求められるでしょう。データサイエンティストは、膨大なデータの中から問題点や解決策を見つけ出さなくてはなりません。そのためには、問題をあらゆる角度から見て検討するための客観的、批判的な視点や物事の本質を捉える考え方が求められます。

    データサイエンティストのニーズ

    Photo by 200 degrees on Pixabay

    データサイエンティストのブームの一方で「データサイエンティストは消える」と耳にしたことがあるかもしれません。そのように言われる理由を解説します。

    いずれAIに置き換わる可能性がある

    AIがデータサイエンティストに取って代わるとも言われています。AIは既存のデータの分類はもちろん、それに基づいた未来予測もできるようになっています。AIの精度が高まるにつれてデータサイエンティストの仕事の一部をAIが代替することは現実に起こっています。

    そのため、データサイエンティストは機械学習に関する知識も求められているのです。

    人材育成が加速し、人余りの状況になる可能性がある

    データサイエンティストの需要増加を受け、高等教育機関が設置されるなど、日本はデータサイエンティスト人材育成に力を入れ始めています。

    日本国内でもデータサイエンス学部、学科、研究コースなどが増えてきました(たとえば国公立大学では、滋賀大学と横浜市立大学で「データサイエンス学部」が創設され、東京大学でも「数理・データサイエンス教育プログラム」が開設されました)。

    現在データサイエンティストの人材不足は事実ですが、日本も人材育成に力を入れ始めたため、将来的には人あまりの状況になる可能性が考えられます。スキルの低いデータサイエンティストは淘汰されるなど、競争もより激しくなるでしょう。

    今後も求められる人材になるために

    膨大なデータをいかに活かすかがビジネスの鍵を握る時代において、データサイエンティストの必要性は高まっているのは事実です。

    一方で、先に説明したような「AIに置き換わる可能性」や「データサイエンティスト人材の増加による競争の激化」の懸念もあります。

    求められるのは、「より高度なスキルの習得による他データサイエンティストとの差別化」と、「AIに対する正しい理解」です。

    AIに対する正しい理解や知識がないと、AIに任せられる分析などをいつまでも人の手で膨大な時間をかけて取り組むことになってしまい、結果として得られる結果にも差が出てきます。AIの得意分野はAIにまかせ、苦手なところは補うという考え方が必要になります。

    Ledge.aiではAI業界の活性化を目指す活動の一環として、業界のスペシャリストを招き、最先端の情報に触れる機会を提供する「AI TALK NIGHT」や「THE AI」といったイベントを開催しています。またほかにも、人工知能をビジネスに活かすサポートとして、AI活用事例の検索プラットフォーム「e.g.」を提供しています。

    この機会にAIに対する正しい理解を深め、これからの社会で活躍するデータサイエンティストになる第一歩を踏み出すのはいかがでしょうか。