プログラミング不要でモデルの評価までできる! Azure Machine Learning Studioで機械学習をしてみた

このエントリーをはてなブックマークに追加

「Azure Machine Learning Studio (クラシック)」はMicrosoft Azureの機械学習サービスであり、ブラウザ上でさまざまな機械学習のモデルを作成できます。今回は本サービスを使って、ノーコードで機械学習を試してみました。



1.ワークスペースを作成する

まず、Microsoftのアカウントを作成し、Azureにログインします。検索欄に「machine learning」と入力すると候補が出るので、「Machine Learning Studio ワークスペース」を選択します。

ここで、「Machine Learning Studio ワークスペースの作成」をクリックします。


新規CTA

各設定をした後「作成」をクリックします。

作成が完了したら名前の部分をクリックします。

アクセスしたら、「概要」から「View Machine Learning studio [classic]」を選択します。

2.Experimentsを作成する

Machine learning studio (クラシック)にアクセスしたら、左の欄から「EXPEROMENTS」を選び、左下の「NEW」をクリックし、「Blank Experiments」を選択します。

3.機械学習モデルを作成する

機械学習モデルを作成するためには、データが必要です。Azure Machine Learning Studioではさまざまなサンプルデータが用意されています。

今回は、「Saved Datasets」の「Samples」から1番上にある「Adult Census Income Binary Classification dataset」モジュールを選択します。これは、年齢、職業、性別などの値によって、年収が5万ドル以上か、未満かを表すデータです。データをセットするには、右へドラッグ&ドロップします。

右側の「View dataset」をクリックすると、データをダウンロードすることもできます。

機械学習のモデルに学習させるためには、元になるデータを学習用と評価用のデータに分割する必要があります。データを分割するには、「Data Transformation」>「Sample and Split」>「Split Data」モジュールをドラッグ&ドロップします。右から分割する割合も設定できますが、今回は初期設定のままにします。また、モジュールは検索欄から探すこともできます。

「Split Data」をドラッグ&ドロップできたら、「Adult Census Income Binary Classification dataset」の下にあるマルをクリックし、「Split Data」まで矢印を伸ばします。

次は「Train Model」をドラッグ&ドロップし、「Split Data」から矢印を伸ばします。ここで右側の「Selcted columns」から「income」を選択します。これは「データのカラムの中からincomeの値を予測する」という設定です。

次はアルゴリズムの種類を選びます。今回は「年収が5万ドル以上か、未満か」という2つに分類することが目的なので「Two-Class Boosted Decision Tree」を選びます。

次に、「Score Model」をドラッグ&ドロップし、「Split Data」と「Train Model」から、矢印を伸ばします。これは、学習させたモデルで「Split Data」で分けた、学習で使わなかったデータを予測するイメージです。

ここまで終わったら、下にある「RUN」をクリックします。数分経つと、「Score Model」から「Visualize」を選択し、結果を確認できます。

「Scored Probabilities」は確率であり、0.5を境とし、1に近いほど年収が5万ドル以上になる確率が高くなります。

3.モデルを評価する

最後に「Evaluate Model」をドラッグ&ドロップし、「Score Model」の時と同じように「Run」の後に「Visualize」を選択し、結果を確認します。

モデルを評価できました。

最後に

今回は、Azure Machine Learning Studio (クラシック)で、まったくコードを書かずに、機械学習のモデルを作成しました。今回は非常にシンプルな構造にしましたが、さまざまなモジュールを使うことで、不要なカラムを削除するなど、アレンジできます。ぜひ初心者の方も試してみてください。


新規CTA