機械学習で浮世絵から顔を抽出した「ARC浮世絵顔データセット」が公開

このエントリーをはてなブックマークに追加

データセット中で浮世絵の画像がもっとも多い10人の作者(立命館大学アート・リサーチセンター (2020): ARC所蔵浮世絵データベース. 国立情報学研究所情報学研究データリポジトリ. (データセット).



ROIS-DS人文学オープンデータ共同利用センター(Center for Open Data in the Humanities / CODH)は、機械学習を用いて浮世絵から顔領域を自動抽出し、作成した「ARC浮世絵顔データセット」を公開した。

本データセットは、立命館大学アート・リサーチセンター(ARC)が国立情報学研究所の情報学研究データリポジトリ(IDR)で公開する「立命館ARC所蔵浮世絵データベース」を対象に、共同研究グループが作成した。

2021年6月現在、最新バージョン(v1.0)のデータセットは、9203件の浮世絵画像から抽出した1万6653件の浮世絵顔データを提供する。データセットのより詳しい内容や分析結果などについては論文(英語)を参照してほしい。

本データセットは、ARCが抽出元の画像に対して書誌情報(作品名、役者、版元、絵師、上演年など)を含むメタデータを付与した「メタデータ」、共同研究グループが顔領域および顔を構成する部品(目、口、鼻など)の座標データを機械学習で自動抽出した結果をまとめた「アノテーションデータ」の2種類のデータで構成される。

なお、本データセットはクリエイティブ・コモンズ 表示 4.0 国際 ライセンス(CC BY)の下で提供している。CC BYライセンスの「表示」に関しては詳細ページを確認してほしい。

>>詳細ページ