文系大学生も理解が深まり勉強になった! 1時間半で機械学習の基本を学べる無料講座を受けてみた

このエントリーをはてなブックマークに追加

『文系大学生がAI講座受けてみた』では、大学では文学部で日本語学を専攻する文系の私が無料で学べるAI講座にチャレンジしていきます!

今回は、株式会社アイデミーが提供する「機械学習概論」を受けてみました。本講座では、AIの注目分野である「機械学習」の基本を習得します。標準受講時間は1.5時間で、前提知識は「Python入門」を学習済みの方とされています。動画や説明文を見て学び、演習問題に取り組みます。

カリキュラムは以下のとおりです。

  • Ch.1 機械学習概論(機械学習概論、機械学習の各手法)
  • Ch.2 機械学習の流れ(機械学習の流れ、学習データの使い方、過学習、アンサンブル学習)
  • Ch.3 性能評価指標(性能評価指標、PR曲線)

チャプター1ではAI・機械学習・ディープラーニングについて学んでいきます。AIはこの図からもわかるように、かなり広義に解釈される言葉であると話しています。

機械学習は「データから反復的に学習し、そこに潜むパターンを探し出すこと」であると定義しています。大きく分けて3分類あり、教師あり学習(分類・回帰)、教師なし学習、強化学習を詳しく学べます。

チャプター2では機械学習のフローを学びます。具体的にどのような流れで機械学習プロジェクトが進んでいくのかわかります。

データがどのくらい必要なのかについては、ケースバイケースで、目安としてディープラーニング(深層学習)の場合は1カテゴリ1000枚以上だと話しています。また、データがない場合の手法も3つ(データを作る・転移学習・API)紹介しています。

ほかにも「機械学習と統計学の違い」や「過学習」についても学びます。

過学習したモデルは使い物にならないので、正則化、ドロップアウト、交差検証法の3つの方法で防ぐと話しています。

チャプター2の演習問題では、複雑なコードに惑わされ難しく感じるものもありましたが、説明やヒントを読めば大丈夫でした。

チャプター3では、精度評価とは何か学びます。精度評価は学習した機械学習モデルの良し悪しを判断するための定量的な指標です。ケースによって適切な「精度評価指数」が変わってくると話しています。

正解率、精度(適合率)、再現率、F値の4つが非常に大切な考え方であると説明があり、どういう場合にどの値を重視するべきかもわかります。

たとえば、がんの検診で「正解率」の指標を使うと危ないという説明がされます。

演習問題はチャプター2と同じく説明とヒントを読んで答えていきます。実装の演習問題は少し難しいです。

本講座では機械学習の基礎を学びました。動画の説明に加えて、図や文章での説明があり、わかりやすかったです。演習問題がたくさん用意されているので、理解が深まり非常に勉強になりました。機械学習ってなんだろう?と興味を持っている方はこの講座にチャレンジしてみてはいかがでしょうか。