全12件
ビジネス
2025/1/31 [FRI]

Google、Gemini 2.0 Flashを正式展開—無料版でも高速AIモデルが利用可能に
Google
マルチモーダルAI
基盤モデル
ビジネス
2025/1/31 [FRI]

Alibaba CloudのAI研究チームQwen、DeepSeek-V3を超えるAIモデル「Qwen2.5-Max」とVLM (視覚言語モデル)「Qwen2.5-VL」を発表
アリババ
基盤モデル
マルチモーダルAI
ビジネス
2025/1/4 [SAT]

Alibabaが画像理解と言語処理を統合した新たなマルチモーダルAIモデル「QVQ-72B-Preview」を発表:数学・科学分野の課題解決を目指す
アリババ
基盤モデル
マルチモーダルAI
学術&研究
2024/12/22 [SUN]

動画理解の次世代AIモデル「Apollo」、オープンソースで登場 Metaとスタンフォード大学の研究チーム
Meta
マルチモーダルAI
論文
ラーニング
2024/12/17 [TUE]

簡単に業務効率化アプリを作れるDifyのレシピ紹介|Ledge.ai 年末年始特集「24to25」
AIエージェント
マルチモーダルAI
ノーコード
学術&研究
2024/12/12 [THU]

AIは、時系列データを数値の羅列としてよりグラフにしてみた方が理解が高まる:マルチモーダルLLMで性能を最大150%向上させる新手法ーーGoogleの研究チーム
マルチモーダルAI
Google
ラーニング
2024/12/10 [TUE]

OpenAIが2024年に発表した2つのLLM、GPT-4oとo1は何がすごいのか?押さえておくべき2024年のLLMの進化のポイント|Ledge.ai 年末年始特集「24to25」
基盤モデル
マルチモーダルAI
OpenAI
ビジネス
2024/12/4 [WED]

Amazon、新たな生成AI基盤モデル「Amazon Nova」を発表:マルチモーダル対応と高いコスト効率を実現
Amazon
マルチモーダルAI
基盤モデル
ラーニング
2024/11/25 [MON]

Difyとは|話題のノーコード生成AIアプリ開発プラットフォーム
AIエージェント
マルチモーダルAI
ノーコード
学術&研究
2024/10/26 [SAT]

マルチモーダルAIの500以上の実世界タスクを評価する新ベンチマーク『MEGA-Bench』登場
マルチモーダルAI
論文
学術&研究
2024/10/24 [THU]

Meta、テキストと音声を統合する初のマルチモーダルAIモデル「Spirit LM」を発表
Meta
マルチモーダルAI
基盤モデル
ビジネス
2024/10/7 [MON]

マルチモーダルAI「Molmo」がオープンソースで公開 小型ながらGPT-4oやGemini 1.5 Proに匹敵する性能ーーアレン人工知能研究所
マルチモーダルAI
基盤モデル
アクセスランキング
ソニーCSL、自力の練習では超えられなかった技能の天井を、外骨格ロボットで限界突破する新たなトレーニング手法を発表
従来の1000倍以上の高速化 東京大学とNTT、世界最速の光量子もつれ生成に成功 ー 次世代量子技術の新時代へ
あまりにリアルで詐欺注意!ByteDanceの動画生成AI『OmniHuman-1』が1枚の画像から人物動画を生成
LLMの「ハルシネーション」が創薬研究に貢献—ドレスデン工科大学の研究チームが発表
OpenAI「o1」やDeepSeek-R1の秘密に迫る:少量データとシンプルな制御で推論精度を飛躍的に向上させる新たな「テスト時スケーリング」手法をスタンフォード大研究チームが発表
LoRA(ローラ)とは|今年注目の画像生成AI (Stable Diffusion) のファインチューニングを試してみた
Google DeepMind が「TokenVerse」を発表——AIを活用し複数の画像から要素を抽出・統合し、自然な1枚の画像を生成する手法
カリフォルニア州立大学、50万人にAI導入――米国最大規模の「ChatGPT Edu」全学展開へ
Sakana AI、小規模日本語言語モデル「TinySwallow-1.5B」を公開 :ちょうど良いレベルの教師を設定し、学習効果を最大化する新たな知識蒸留手法「TAID」の提案
石破首相、孫正義氏・アルトマン氏と会談 約77兆円規模の米国AIインフラ整備に関する「スターゲート計画」の日本展開も議題に