Googleが「Open Images V5」を発表。ICCV 2019でOpen Images Challengeも開催

このエントリーをはてなブックマークに追加

Googleの大規模画像データセットOpen Imagesの最新バージョンOpen Images V5が発表された。Open Images自体は2016年に発表されており、今回はそのアップデートとなる。

Open Imagesとは?

Open Imagesは、Googleが2016年に発表した大規模な画像のデータセットだ。900万に及ぶ画像と6000カテゴリから構成される。

その後、数回のアップデートを得て2018年にOpen Images V4を公開。Ledge.aiでも記事にしている。

関連記事:Googleが「Open Images V4」データセットと「Open Images Challenge」を新たに発表

Open Images V5の内容

Open Images V5は、350カテゴリの280万個の物体のラベルを備える。

物体が配置されている領域のみを識別し囲むバウンディングボックスとは異なり、物体のアウトラインが縁取りされ、より詳細に物体を識別している。

たとえば、

  • 猫というラベルに尻尾を含むかどうか
  • ラクダや人が持っているバッグは、人、ラクダのラベルに含むべきか

など、アノテーション(データにラベル付けする作業)においては、基準の一貫性が重要となる。Google AIのチームは、異なる物体に対して一貫した基準でアノテーションすることに尽力してきたという。

トレーニングセット(2億6800万)上のデータは、プロのアノテーターと呼ばれる人材が、セグメンテーション用ニューラルネットワークの出力を繰り返し修正する手法で作成された。人がマニュアルで作業するアノテーションよりも効率的だ。

また、Open Images V5はこれまで公開されているどのデータセットよりも正確にラベル付けされ、広範囲のカテゴリと、より多くの物体総数を誇る

品質を重視し人力でアノテーションした検証用のデータセットとテスト用データセット、合わせて99,000のデータセットも合わせてリリースされた。

上図を見ると、とがった花や人工物の細かい構造など、複雑な物体の境界の細部まで捉えている。

コンピュータビジョンのトップカンファレンスICCVでOpen Images Challengeも開催

合わせて、コンピュータビジョンのトップカンファレンスであるICCV 2019にて、Open Images V5を使ったコンペティション「Open Images Challenge」が開催される。

参加者は機械学習プラットフォームKaggle上で競い合う。詳細はこちらから。