AutoMLでKaggleに挑戦してみた:キカガクの技術ブログ

このエントリーをはてなブックマークに追加


本稿は株式会社キカガクが運営する「キカガクの技術ブログ」から一部を転載し、掲載しています。
株式会社キカガク
キカガクの技術ブログ

こんにちは!
Microsoft 認定トレーナーの小池です!
本章は下記のような方におすすめです。

  • AI・機械学習に難しそうなイメージを持っている
  • モデルの精度が上がらずに挫折してしまった
  • 手元のデータが機械学習モデルに適したデータなのか整合性を確認したい

皆さんは、Kaggleのタイタニックの問題はご存知でしょうか?
初めて聞いたという方は下記をご確認ください!

昨今、AIや機械学習の領域では自動機械学習というノンコードでだれでも簡単にモデル作成を行えるツールが発展しています。

本記事ではこのタイタニックの生存者予測の問題をこのノンコードの自動機械学習で実装してみます!

タイタニックのコンペティションは今まで14,413名のAI開発者やデータサイエンティストがエントリーをしており、約半分の7,000のモデルの精度は77%程です。

※出典:Kaggle

今回はマイクロソフトのクラウドサービスであるAzure Machine Learning (以下 Azure ML)の Automated Machine Learning (以下 Auto ML) を利用し、ノンコードで精度77%以上のモデルの構築を目指しつつ、自動機械学習の性能についてご紹介していきます。

自動機械学習はデータの前処理・計算手法(アルゴリズム)の選択・ハイパーパラメータの調整などといったことを全てノンコードで実装してくれる便利なツールです。手軽に実装でき、高い精度のモデルを構築することができるのでPoCやデータサイエンティストのいない会社の実務などで幅広く利用されています。

それでは早速Azure MLを使用し、Kaggleのコンペティションに挑戦してみましょう!!

事前準備

今回使用するデータの準備から始めます。

test.csv と train.csv をダウンロードしてください。

こちらではAzureを使用して行きますのでサブスクリプションの登録が必要です。初めて利用する方は無料で使用でき、初めてでない方でも数十円程度で実装できます!

環境構築

リソースの作成

まずはリソースの作成をします。アプリをダウンロードするイメージです。

machine learning と検索して頂き作成を押してください。

リソースの設定は画像の通りです。設定ができましたら作成を押してください。

作成が完了しましたらスタジオの起動を押してください。

起動後、下のような画面に遷移します。こちらがAzure MLのホーム画面です。こちらで機械学習モデルの構築、運用を行うことができ、今回使用する自動機械学習以外にもデザイナー Notebookを使用して機械学習モデルを構築することができます。

それでは自動機械学習を使用して行きましょう。今すぐ開始をクリックしてください。

本稿の続きおよび、転載元の記事は「キカガクの技術ブログ」にてご覧ください。