画像の説明文を自動生成するライブラリを提供開始 マクニカとアルベルト

このエントリーをはてなブックマークに追加


株式会社マクニカと株式会社ALBERT(アルベルト)は2月10日、画像キャプション生成の自動化を実現するマルチモーダルAIを活用したライブラリを新たに提供開始した。

マルチモーダルAIとは、画像認識や音声認識などを複合的に処理・判断できるAIのことだ。マルチモーダルAIを利用することで、多様な情報を統合して判断する熟練者の問題処理能力に近づけられると期待されている。

レポート作成業務の時間短縮などで活用

マクニカとアルベルトの本プレスリリースによれば、今回発表したマルチモーダルAIライブラリは、テレマティクス保険やリスクアセスメントなどでのレポート作成業務への活用が期待できるとしている。

テレマティクス保険やリスクアセスメントなどでのレポート作成業務では、収集した動画データを目視で確認して手動によるレポート作成が必要な場合がある。この作業は人手がかかるため、個人の作業に依存する課題があるとしている。そこで、マルチモーダルAIを活用すると、動画データのインプットから状況のテキスト化までを自動化し、レポート作成の業務時間を短縮するなどの効果に期待できるそうだ。



>> プレスリリース

製造業向けにスマートファクトリー化の促進を狙う

ちなみに、マクニカとアルベルトは2019年11月に資本業務提携契約を締結しており、今回提供されるマルチモーダルAIは、両社の共同開発による最初のライブラリ提供となっている。

締結に当たっての記者会見では、製造業向けにAI/IoTを活用したスマートファクトリー化の促進が狙いだと明かされていた。また、将来的には、国際的な競争力を高めるきっかけになりたい、とも話していた。