株式会社ABEJAが提供するアノテーションサービスに、領域抽出、動画アノテーション、テキストアノテーションの3つの機能が追加され、2018年9月13日より提供を開始するとのことです。
アノテーションとは
アノテーションとは、データをラベル付け、分類し、ディープラーニングにおける教師データを作るプロセスです。
ABEJAは、ディープラーニングを活用する際に、以下の5つのプロセスを定義。それらのプロセスを包括的におこなうことができる「ABEJA PLATFORM」を提供しており、アノテーションは③の学習の部分にあたります。
- 取得
- 蓄積
- 学習
- デプロイ
- 運用(推論・再学習)
新たに追加された3つの機能
今回追加されたのは、下記の3つのアノテーション手法です。
領域抽出(Image Semantic Segmentation/イメージ セマンティック セグメンテーション)
画像のピクセル単位で領域認識をおこなう。自動運転における道路範囲の検出や、製造業での異常部分のピクセル単位での検出などが可能に。従来の領域抽出は、ピクセル単位でのアノテーションが必要だったため多大な労力を要していたが、本機能により領域の自動検出が可能となり、アノテーションコストを大幅に削減可能に。
動画アノテーション(Scene Recognition/シーン リコグニション)
映像データの特定シーンに対してラベル付けをおこなう。製造業などの工場や店舗で撮影したカメラ映像から連続したシーンの検出、テレビ・映画・オンデマンドストリーミング・SNSへの投稿動画などの放送業界・映像メディアから特定シーンの検出が可能に。
テキストアノテーション(Text Classification/テキスト クラシフィケーション)
テキスト情報に対してラベル付けをおこなう。ブログ本文やSNSの投稿などのテキスト情報の分類や不適切なコンテンツの摘出等が可能に。
「アノテーションツール」「データ作成委託サービス」単体での提供も開始
また、これまでABEJAの「アノテーションツール」及び「データ作成委託」などのアノテーションサービスは「ABEJA PLATFORM」の中でのみ提供されているサービスでしたが、今回それらを単体でも提供開始したとのこと。
アノテーションはコンピューターによる自動化も難しく、人手や工数の確保、それらの管理も必要なため、アノテーション単体でのニーズは必ずあるハズ。今回、アノテーション単体での提供も開始したのは嬉しいニュースですね。
今後は音声アノテーションも?全てのデータに価値がつく時代
また、新たに提供開始した領域抽出・動画・テキストのアノテーション機能も注目です。今後は音声アノテーション(Voice Translation/ボイス トランスレーション)も2018年以内に提供予定とのことです。
ここまでアノテーションに力を入れるのは、データ=価値と認識しているからこそ。全てのデータに価値がつく時代をABEJAが作ってくれるかもしれません。