画像は「強化学習」講義資料より
東京大学が8月27日~8月29日に開催した「Summer School 数理物理 2021(機械学習の数理)」において実施した講義、「強化学習」および「ノンパラメトリックベイズ統計と統計的自然言語処理」の講義資料が無料公開された。
「Summer School 数理物理」は1987年に第1回目を開催した、これから研究を始めようとしている大学院生や、数理物理の広い分野にわたる(専門外の)研究者を対象にした入門的な講義。主なターゲットは若手研究者や大学院生だが、学部学生や一般社会人を含む幅広い範囲の参加者が集まるという。
\資料公開/
Summer School 物理数理 2021で#AIlab 研究員の森村が担当した「強化学習」の資料が公開されました。
参加の叶わなかった方や復習をしたいという方はぜひご覧ください!https://t.co/NYFB4XEF6q— CyberAgent AI事業本部広報 (@cyberagent_ai) September 2, 2021
今回のテーマは「機械学習の数理」。
講義資料が無料公開された講義のひとつ「強化学習」は、株式会社サイバーエージェントの「AI Lab」に所属する研究員の森村哲郎氏が担当した。
「強化学習」は、意思決定モデルをデータから学習するための方法論。予測モデリングなどの従来の機械学習に比べると、学習に必要なデータをそろえることが難しいことから応用事例は限られていたが、近年、強化学習が重要な役割を果たす事例が医療やマーケティング、自然言語処理などの領域で次々に見いだされている。
本講義では強化学習の原理の理解を目指し、数理的側面を主にし、まずは基礎となるマルコフ決定過程やその解法(プランニング)を説明する。プランニング手法をサンプル近似することで、Q学習などの代表的なアルゴリズムを導出し、応用において要となる関数近似についても解説してくれる。
歴史のある会にご招待いただき、どうもありがとうございました。数学に近い統数研の方は他に沢山いらっしゃると思いますが、折角ご招待いただいたので、必ずしも機械学習=深層学習ではないという立場から、私の言語に関する研究をいくつか紹介してみました。
— Daichi Mochihashi (@daiti_m) August 29, 2021
「ノンパラメトリックベイズ統計と統計的自然言語処理」は、統計数理研究所 数理・推論研究系 准教授の持橋大地氏が担当した。持橋大地氏は自身のTwitterアカウントで「必ずしも機械学習=深層学習ではないという立場から、私の言語に関する研究をいくつか紹介してみました」と述べている。
>>ニュースリリース「東京大学「Summer School 数理物理 2021」に、AI Lab研究員の森村が登壇いたします」