東京大学、強化学習と統計的自然言語処理の講義資料が無料公開 サイバーエージェントの講師ら担当

このエントリーをはてなブックマークに追加

画像は「強化学習」講義資料より

東京大学が8月27日~8月29日に開催した「Summer School 数理物理 2021(機械学習の数理)」において実施した講義、「強化学習」および「ノンパラメトリックベイズ統計と統計的自然言語処理」の講義資料が無料公開された。

「Summer School 数理物理」は1987年に第1回目を開催した、これから研究を始めようとしている大学院生や、数理物理の広い分野にわたる(専門外の)研究者を対象にした入門的な講義。主なターゲットは若手研究者や大学院生だが、学部学生や一般社会人を含む幅広い範囲の参加者が集まるという。

今回のテーマは「機械学習の数理」。

講義資料が無料公開された講義のひとつ「強化学習」は、株式会社サイバーエージェントの「AI Lab」に所属する研究員の森村哲郎氏が担当した。

「強化学習」は、意思決定モデルをデータから学習するための方法論。予測モデリングなどの従来の機械学習に比べると、学習に必要なデータをそろえることが難しいことから応用事例は限られていたが、近年、強化学習が重要な役割を果たす事例が医療やマーケティング、自然言語処理などの領域で次々に見いだされている。

本講義では強化学習の原理の理解を目指し、数理的側面を主にし、まずは基礎となるマルコフ決定過程やその解法(プランニング)を説明する。プランニング手法をサンプル近似することで、Q学習などの代表的なアルゴリズムを導出し、応用において要となる関数近似についても解説してくれる。

「ノンパラメトリックベイズ統計と統計的自然言語処理」は、統計数理研究所 数理・推論研究系 准教授の持橋大地氏が担当した。持橋大地氏は自身のTwitterアカウントで「必ずしも機械学習=深層学習ではないという立場から、私の言語に関する研究をいくつか紹介してみました」と述べている。

>>ニュースリリース「東京大学「Summer School 数理物理 2021」に、AI Lab研究員の森村が登壇いたします」