エンジニアリング

エンジニアリング
2024/12/27 [FRI]
チューリング、600万フレームの世界最大規模データセットを公開 自動運転研究と開発の標準化戦略に向けた布石のサムネイル画像

チューリング、600万フレームの世界最大規模データセットを公開 自動運転研究と開発の標準化戦略に向けた布石

2024年12月23日、チューリングが、自動運転分野における技術革新を促進する[発表]{target=“_blank”} の全データを公開しただけでなく、このデータセットを活用した世界モデル「Terra」のモデルファイルおよびソースコード、さらには世界モデル評価ベンチマーク「ACT-Bench」を同時に公開した。 ## 「CoVLA-Dataset」 [「CoVLA-Dataset」]{target=“_blank”}は、視覚、言語、行動の三要素を統合した世界最大規模のデータセットである。各シーンのすべてのフレームに、センサ情報や操作データ、シーンの言語キャプション、未来の車の軌跡が網羅されている。 注目すべきは、このデータセットがただ大規模であるだけでなく、その学術的価値が認められ、主要なコンピュータビジョン国際会議「WACV 2025」で採択されている点だ。研究者たちは、これを利用して多様な環境下での自動運転技術の開発を進めることができる。 ## 「Terra」と「ACT-Bench」 [「Terra」]{target=“_blank”}は、現実世界の物理法則や物体の相互作用を理解し、未来軌跡に従った映像を生成できるモデルだ。CoVLA-Datasetを活用した追加学習により、従来モデルに比べて指定された行動指示への追随性が大幅に向上している。今回の公開により、研究者や企業は、この強化された生成モデルを基盤に、より高度な運転システムの開発に取り組みやすくなると期待されている。 「ACT-Bench」は、自動運転の世界モデルが与えられた行動指示にどれだけ正確に従えるかを評価するための新しいベンチマークだ。これまでの評価は映像のリアリティや特定タスクの性能に偏りがちだったが、ACT-Benchは行動指示への追随性能を定量的に評価可能にする。この基準により、モデルの正確さと信頼性を比較しやすくなり、研究開発の透明性と効率を向上させることが期待される。 ![s-1727x1031_v-fms_webp_878e10c8-bd5e-4853-ace8-de6a570a8151_small.webp] :::small 画像の出典:[チューリング]{target=“_blank”} ::: ## 公開の背景と狙い 今回のデータセットとモデル公開には、チューリングが目指す技術標準化の意図が込められている。同社はスタートアップでありながら、重要なデータをクローズドにするのではなく、オープン化することでグローバルなデファクトスタンダードを築くことを目的としている。 自動運転技術が進化するにつれ、生成AIや世界モデルは人間に近い判断力を持つシステムの中核を担うようになる。その未来を見据え、チューリングは映像やセンサ情報だけでなく、言語データを統合したデータセットを公開することで、大規模な自動運転モデルの学習に必要不可欠な基盤を提供している。 ## 「Tokyo30」プロジェクトと公道試験 さらに、チューリングは「Tokyo30」というプロジェクトの一環として、2024年12月から自動運転モデル「TD-1」の公道走行試験を開始した。このプロジェクトでは、2025年までに人間の介入なしで都内を30分間走行可能なシステムを開発することを目標としており、最終的には、2030年までにハンドルのない完全自動運転車の実現を目指している。 :::box [関連記事:チューリング、自動運転関連のAI技術を続々公開 特に日本初のVLA(Vision-Language-Action) モデルデータセット「CoVLA Dataset」に注目!] ::: :::box [関連記事:チューリング、日本初の自動運転向け生成世界モデル「Terra」を開発] ::: :::box [関連記事:チューリングがプレシリーズAで30億円の資金調達、完全自動運転の開発加速] ::: :::box [関連記事:完全自動運転EVスタートアップのチューリングとS.RIDE、自動運転領域での協業を開始 タクシー走行データを活用] :::

エンジニアリング
2024/12/10 [TUE]
企業の実環境でのLLMのSQL生成(Text-to-SQL)能力を評価する新ベンチマーク:Spider 2.0 GoogleDeepMindなどの研究チームが発表のサムネイル画像

企業の実環境でのLLMのSQL生成(Text-to-SQL)能力を評価する新ベンチマーク:Spider 2.0 GoogleDeepMindなどの研究チームが発表

Google
AIエージェント
エンジニアリング
2024/12/3 [TUE]
日本、生成AIプロジェクトで世界9位、2028年には7位に上昇か GitHub年次レポート「Octoverse 2024」発表のサムネイル画像

日本、生成AIプロジェクトで世界9位、2028年には7位に上昇か GitHub年次レポート「Octoverse 2024」発表

プログラミング
エンジニアリング
2024/11/28 [THU]
Anthropic、AIシステムと外部データソースを統合する「Model Context Protocol」を発表のサムネイル画像

Anthropic、AIシステムと外部データソースを統合する「Model Context Protocol」を発表

プログラミング
エンジニアリング
2024/11/11 [MON]
AIが未発見のバグを検出 ─ GoogleがSQLiteにおける脆弱性をAI技術で特定 従来の手法では検出困難のサムネイル画像

AIが未発見のバグを検出 ─ GoogleがSQLiteにおける脆弱性をAI技術で特定 従来の手法では検出困難

Google
プログラミング
エンジニアリング
2024/11/7 [THU]
Googleの新規コードの25%以上がAI生成—ピチャイCEO、第3四半期決算でAI活用による生産性向上を強調のサムネイル画像

Googleの新規コードの25%以上がAI生成—ピチャイCEO、第3四半期決算でAI活用による生産性向上を強調

Google
エンジニアリング
2024/10/9 [WED]
AWS、生成AIを活用したアシスタント機能「AWS re:Post Agent」を発表:クラウド開発者向け技術支援を強化のサムネイル画像

AWS、生成AIを活用したアシスタント機能「AWS re:Post Agent」を発表:クラウド開発者向け技術支援を強化

Amazon
エンジニアリング
2024/10/2 [WED]
富士通が日本語特化の大規模言語モデル「Takane」の提供を開始のサムネイル画像

富士通が日本語特化の大規模言語モデル「Takane」の提供を開始

国内企業事例
エンジニアリング
2024/9/22 [SUN]
テックファーム デジタルヒューマン×生成AIで感情をリアルタイム推定するアバターシステムを開発 認知症予防や介護の負担軽減など様々な分野への導入を目指すのサムネイル画像

テックファーム デジタルヒューマン×生成AIで感情をリアルタイム推定するアバターシステムを開発 認知症予防や介護の負担軽減など様々な分野への導入を目指す

エンジニアリング
2024/9/20 [FRI]
Oracle、リアルなデータセットを模したテストデータを合成する生成AI「Select AI for Synthetic Data Generation」を発表のサムネイル画像

Oracle、リアルなデータセットを模したテストデータを合成する生成AI「Select AI for Synthetic Data Generation」を発表

エンジニアリング
2024/9/19 [THU]
マイクロソフトリサーチが「AutoGen Studio」を公開: マルチエージェントシステム開発をノーコードで実現する新ツールのサムネイル画像

マイクロソフトリサーチが「AutoGen Studio」を公開: マルチエージェントシステム開発をノーコードで実現する新ツール

AIエージェント
Microsoft
エンジニアリング
2024/9/17 [TUE]
2024年版ガートナー「AIコードアシスタント」の評価:主要ベンダーと市場動向のサムネイル画像

2024年版ガートナー「AIコードアシスタント」の評価:主要ベンダーと市場動向

プログラミング
エンジニアリング
2024/9/17 [TUE]
チューリング、自動運転関連のAI技術を続々公開 特に日本初のVLA(Vision-Language-Action) モデルデータセット「CoVLA Dataset」に注目!
のサムネイル画像

チューリング、自動運転関連のAI技術を続々公開 特に日本初のVLA(Vision-Language-Action) モデルデータセット「CoVLA Dataset」に注目!

自動運転
国内企業事例
モビリティ×AI
アクセスランキング
スマホに内蔵されたセンサーとAIだけで「自動日記生成」を実現――写真も音声も不要の新技術「AutoLife」で従来のライフログが大幅に進化
スタンフォード大学、シンプルに論理ゲートのみで構築した超省エネなニューラルネットワークを開発
Genspark、世界初の「協働エージェントシステム」MoAを発表ーー適切なモデルの選択・作業後の振り返り・反映を自動で行う
4
ポーランドの新作映画『プーチン』、AI技術を活用してロシア大統領を描写
5
Microsoftが小規模言語モデル「Phi-4」をHugging Faceで公開、MITライセンスで商用利用が可能に
nocodesymposium2025 rectangle-top
FOLLOW US
各種SNSでも最新情報をお届けしております