本連載『文系大学生がAI講座受けてみた』では、大学では文学部で日本語学を専攻する文系の私が無料で学べるAI講座にチャレンジしていきます!
第3回となる今回は、スキルアップAI株式会社が提供する「機械学習のためのPython入門講座」を受けてみました。約8時間の講義ですが、今回ももちろんすべて無料です! 本講座の有効期限は2021年12月31日まで。視聴回数に制限はありません。
「機械学習のためのPython入門講座」は、Python機械学習ライブラリscikit-learnを用いて機械学習モデルを構築することを目標とした講座です。8日間で取り組むようにカリキュラムを組んでいますが、1つの動画は1時間ほどで、自由に進められます。詳しくは以下のとおりです。
- DAY1:実行環境の設備・Python基礎文法①(1時間52分)
- DAY2:Python基礎文法②(48分)
- DAY3:データの整理「NumPy」(1時間15分)
- DAY4:データの整理「Pandas」(42分)
- DAY5:データの可視化「Matplotlib」(1時間6分)
- DAY6:データの可視化「Seaborn」(56分)
- DAY7:データの前処理(56分)
- DAY8:機械学習モデルの構築と評価(45分)
本講座では講義動画と講義資料が与えられるので、講師の説明を聞きながら資料に書き込めます。たくさんの演習問題と解説で理解度を深めていきます。
まず、機械学習の主なタスク「回帰」と「分類」についての説明があり、機械学習でどのようなことが可能か理解できます。実際に機械学習はどのようにすすめていくのかについても言及しています。
(「機械学習のためのPython入門講座」より)
DAY1「実行環境の整備」では、Jupyter Notebookの基本的な使い方を学習します。
本講座では事前準備としてJupyter Notebookのインストールが必要です。私は環境構築に少し苦労しました。使い方としてはGoogle Colaboratoryとほとんど同じようなツールです。
同じくDAY1「基礎文法①」では、変数・データの型・制御文について学習します。
簡潔にまとめられた資料とわかりやすい講師の説明で、つまずくことなく取り組めます。それぞれ説明の後に演習問題が出題され、動画を止めて取り組む形です。その後、解説を聞いて学びを深められます。
演習問題と解説(「機械学習のためのPython入門講座」より)
DAY2「基礎文法②」では、関数・クラスについて学習します。関数の必要性を理解した後に実装するため、便利さがわかりとても感動しました。
クラスは非常に重要で、概念そのものを理解することは難しいですが、機械学習を含むデータサイエンスでは2つのことを理解するだけで良いそうです。2つと言われると、頑張れる気がします!
クラスとは(「機械学習のためのPython入門講座」より)
DAY3からDAY6では、外部ライブラリの使い方を学習します。
NumPyとPandasで「データの整理」、MatplotlibとSeabornで「データの可視化」をしていきます。「ライブラリとは何なのか?」という基本的なところから説明してくれます。各ライブラリでできることを詳しく説明していて、どのようなときにどのライブラリを使うべきか理解できました。
ライブラリのイメージもわかりやすいです。(「機械学習のためのPython入門講座」より)
どんなときにどんなグラフを使えば良いのかわかります。(「機械学習のためのPython入門講座」より)
もちろん、ライブラリに関する演習は基礎文法よりも難しく、間違えることも多かったので、しっかりと解説を聞いて復習する必要がありました。できることが増えるとミスも増えますね。
DAY7「データの前処理」では、Kaggle入門データセットを使って、欠損値処理や不要データを削除します。
今まで学んだ外部ライブラリを使っていきます。(「機械学習のためのPython入門講座」より)
すべて覚えることはできず、ゆっくりしっかり学ぶ必要がありました。正直、まだ慣れていない私は演習問題に取り組むのも少し嫌になってしまうほどでした(笑)。前処理の大変さをしみじみと実感しました。
DAY8「機械学習モデルの構築と評価」では、scikit-learnを使って機械学習モデルを構築していきます。図を使った説明が多くてわかりやすかったです!
(「機械学習のためのPython入門講座」より)
が、scikit-learnはできることが多すぎて、難しく感じる部分もありました。説明をしっかり聞かないとついていけません。私の場合は動画で見たまま手を動かすだけになってしまいましたが、それでも達成感は得られました。手を動かすのが大事だと自分に言い聞かせながら学習を進めました。
本講座では外部ライブラリについて詳しく理解できました。公式サイトには「前提知識は不要」と書いてはいるけど、実際はどうなんだろうと疑問に感じていましたが、本当にゼロの状態からでもPython・機械学習の全体像をつかめたと思います。データの前処理の大変さがわかると同時に、上達したいという欲も湧いてきました。
全体を通して図を使った説明が多いところが、文系の私にはとても助かりました。入門講座でもやはりついていけない私ですが、これからもPythonや機械学習を学んでいきたいと思います。前提知識は必要ないので、Pythonや機械学習に興味がある人はぜひチャレンジしてみてはいかがでしょうか!