機械学習とは | AI・人工知能・ディープラーニングとの違い・活用事例・学習方法

このエントリーをはてなブックマークに追加

AI(人工知能)の話題になると、必ず登場する「機械学習(マシンラーニング)」。

しかし、機械学習について詳しい知識がない方も多いのではないでしょうか。本稿では機械学習の定義やディープラーニングとの違い、学習方法などを詳しく解説します。

機械学習とは

まずは、機械学習の全体像について解説します。ひとくちに機械学習といっても、学習の手法やアルゴリズムによって、いくつかに分類することができます。

機械学習の意味

機械学習とは、コンピューターが大量のデータを学習し、分類や予測などのタスクを遂行するアルゴリズムやモデルを自動的に構築する技術です。現在のAIの中核技術であり、ディープラーニングも機械学習の一部です。

関連記事:

機械学習の枠組み

Photo by Gerd Altmann on Pixabay

機械学習は、主に「教師なし学習」「教師あり学習」「強化学習」の3種類の枠組みに分けて考えることができます。

教師あり学習

学習データとして入力とその正しい出力が与えられ、ある入力を受けると正しい出力ができるよう学習させるアルゴリズムです。教師あり学習の代表的タスクは「識別」「回帰」です。

「識別」とは、既存のデータをもとに、そのデータが正解データと比べあらかじめ設定したいくつかのクラスに分類するものです。たとえば、迷惑メールを振り分ける処理が該当します。

「回帰」とは、連続する値を予測するときに使用します。「識別」では、データがどの分類(クラス)に帰属するかを学習しますが、回帰では、具体的な数値の予測を行います。
たとえば、売り上げや株価、降水量の予測などを行う処理がここに該当します。

つまり、「教師あり学習」とは、入力データを正解データを参照して識別し、その学習データをもとに回帰を行うことを言います。

教師なし学習

教師あり学習が、「正解」の用意されたデータをもとに学習するのに対し、「正解」データを与えず行うアルゴリズムが「教師なし学習」です。

教師なし学習では、大量のデータを与え、アルゴリズム自身がそのデータを探索することで、データの構造やパターンなどを抽出したり、データを分類します。

強化学習

「強化学習」は、教師なし学習と同じく「正解」データは与えられませんが、データの出力を価値づけし、その価値を最大化するための行動をとるようにアルゴリズムを最適化します。望ましい出力結果に対し報酬を与え、コンピュータに良い出力を学習させます。

たとえば、株式の売買において、もっとも利益を出すためにはどのタイミングで売ればよいかの判断、ゲームでもっとも高いスコアを出すための判断が強化学習に該当します。

AI(人工知能)と機械学習とディープラーニングの違いについて

Ledge.ai編集部にて作成

機械学習とあわせて耳にすることが多い単語が「ディープラーニング」です。混同されたり誤解されやすい両者の違いについて解説します。

AI(人工知能)と機械学習とディープラーニングの違い

まず、AI(人工知能)と機械学習、ディープラーニングの違いですが、これらは別々の概念ではありません。AI(人工知能)の一部として機械学習があり、さらに、その機械学習の一部としてディープラーニングが存在します。

AI(人工知能)と機械学習の違い

まず、AI(人工知能)は、人間のような知能をコンピューターによって実現させる技術をさす広い概念です。

一方、機械学習は、AI(人工知能)を作り出すためのアルゴリズムを、コンピューターがデータから学習するしくみです。

つまり、AI(人工知能)を支える技術が機械学習です。

機械学習とディープラーニングの違い

ディープラーニングは、機械学習に内包される技術です。従来の機械学習では、人間があらかじめデータの*特徴量を定義し、その特徴量をもとにコンピューターが学習を繰り返して、精度を向上させていました。つまり、この学習では、人間の手による特徴量の定義づけが必要です。

一方、ディープラーニングは、学習データからコンピュータが自動で特徴量を抽出し精度を上げることが可能です。そのため、人間による特徴量の定義づけがされていないデータからも学習が可能です。

*学習データにどのような特徴があるかを数値化したもの

機械学習の現場での活用事例

出典:https://ledge.ai/ledge-examples-detail/

機械学習は、さまざまな場面で実際に使われています。ここでは、機械学習のイメージをより明確にするために、機械学習が活用されている事例についてご紹介します。

チャットボット

NTTドコモが開発した『Repl-AI』は、自然言語処理技術を使った問い合わせに対応するチャットボット。ユーザーからの問い合わせを仕分けしオペレーターに引き渡す、もしくはチャットで直接回答することで、効率的な業務遂行を実現しています。

予測技術

ボストン小児病院の研究者が発表した「ARGONet」は、インフルエンザの発生を予測、追跡するシステム。機械学習に、電子カルテなどのデータに加え、近隣地域で広がるインフルエンザの時空間パターンのデータ、インフルエンザに関するGoogle検索をデータを使用することで、従来の予測アプローチより早く正確な予測が可能になりました。

画像処理

電通と電通国際情報サービス、双日が開発した「TUNA SCOPE」は、天然マグロの尾部断面画像から品質判定を行うシステム。マグロの尾部断面の目視により品質判定を行う「尾切り検品」と呼ばれる職人技から得た膨大なデータを、機械学習により実現しています。

音声処理

MicrosoftによるAPI「Speech to Text API」は、オーディオファイルやマイクからのリアルタイム音声を、テキストに変換することが可能です。

データ分析

テレビ番組情報などのデータソースから、ツイッターでの告知に重要な要素を自然言語解析エンジンを活用して、抽出し要約。最適なハッシュタグも選定することで、SNS運用の省力化を実現しています。

テキスト生成

人工知能記者『ワードスミス』は、企業決算記事などの簡単な記事を生成できるシステム。AP通信やヤフーなどで採用されています。

**OCR

『Flax Scanner』は、個別個社に適した機械学習アルゴリズムを用いて、高精度で文字を読み取ることができるサービス。また、各社毎にレイアウトが異なるような非定型書類から必要情報を自動的に読み取ることも可能です。

**手書きや印刷された文字を読みとり、コンピュータが利用できるデジタルの文字コードに変換するシステム

機械学習に取り組むことの重要性

Photo by Gerd Altmann on Pixabay

機械学習は、AI(人工知能)における技術の中核をなします。そのため、AI(人工知能)を知るためには、まずは機械学習を理解することが必要です。

機械学習で広く使われるプログラミング言語として、「Python(パイソン)」が挙げられます。

Pythonは、多数の企業に採用されていることや、コードがシンプルで読みやすいこと、初心者でも比較的習得しやすいことなどのメリットがあります。

Pythonは、オンライン講座を活用することで、独学で学ぶことも可能です。Pythonの学習方法については、以下の記事で詳しく紹介しています。

機械学習についての知識は、ビジネスインパクトを生み出すチャンスになります。この機会に機械学習について学んでみてはいかがでしょうか。