学術&研究
AIが互いに教え合い連携して学習するオープンソースLLM「WizardLM-2」を開発者が公開 Microsoftからの発表は「待った」
2024年4月15日、AIがお互いに教え合うことで連携して学習する新たなオープンソースの大規模言語モデル「WizardLM-2」を[公開]{target=“_blank”}されている。発表当初は、HggingFaceのMicrosoftコレクションからアクセス可能だったが、数日後削除された。開発者によると、発表前に必要であった毒性テスト(toxicity testing)のプロセスが抜けていたとのことで、近日中に再リリースの予定であるとのこと。 ![wizardlm ai.jpg] :::small 画像の出典:[開発者のX(旧Twitter)アカウントより]{target=“_blank”} ::: ### モデルの特徴と開発背景 [GitHubに公開中]{target=“_blank”}の情報によると「WizardLM-2」は、Microsoftが新たに開発した大規模言語モデルで、8x22B、70B、7Bの3つのバリエーションが含まれている。これらのモデルは、「AI Align AI」(AAA)というフレームワークを通じて互いに教え合うことで、連携して学習する能力を持っている。この技術により、モデルは独自にデータを生成し、それを利用してさらに学習を進めることができるため、連続的かつ効率的な学習プロセスが実現されるという。 ### 性能と評価 同モデルは、複雑な対話、多言語処理、高度な推論タスクにおいて顕著な性能を発揮してるという。特に「WizardLM-2 8x22B」は、オープンソースモデルの中で最も高い性能を持つと評価されており、人間によるブラインドテストや、複数のベンチマークテストにより、プロプライエタリモデルと競合するレベルにあるとのこと。 ![GLN3Z_xawAALilm.jpg] :::small 画像の出典:[GitHub「WizardLM 2」]{target=“_blank”} ::: :::box [関連記事:コーディング特化のAI「WizardCoder 34B」ChatGPT上回る成績 Code Llama強化し達成] ::: :::box [関連記事:Microsoftが新たな小規模言語モデル「Phi-3」を発表 ― 「Tiny but Mighty」―オフラインでも動作するモデルがアプリケーション開発を強力に支援] :::