自社サイトが多言語対応できていれば、思っている以上の成果を生むのでは?
web担当者、webマーケター、あるいはマネージャー的立場からwebサイトの運用や管理を行う方々など、こう考えた経験がある方、多いのではないでしょうか。
コンテンツや商品の紹介ページ、広告用LPなどを見ながら「翻訳して国外にもアプローチしたい」と思うのは当然のこと。上手く行けば、それだけで数倍~数十倍のユーザーにリーチする可能性が出てくるかもしれません。しかし……
多バイト語圏が抱える「画像内テキスト」事情
- webフォントの普及がアルファベット語圏に比べかなり遅かった
- 結果として「画像内文字で訴求する」実装方法が先に普及してしまった
- バナーやボタン、LPなど主要な部分が文字画像だらけに
- いつの間にかCMSやレギュレーションで固められて……
……そんな状況、実際よく見かけます。
どれだけ各種翻訳エンジンの性能が上がろうと、サービスの廉価化が進もうと、
「大事なところが翻訳できない」「別画像をアップして管理するほどの手間をかけるのは難しい」というのがこれまでの常識でした。
常識を変えよう。ディープラーニング技術による挑戦
そこで今回、翻訳・通訳事業や翻訳システム開発事業などを手がけるクロスランゲージとレッジが提携し、サイトの画像内テキストを自動翻訳するディープラーニング活用型新サービスの開発プロジェクトを発足するに至りました。
具体的には以下のような仕組み。現在PoC(コンセプト実証)の第一フェーズをクリア(できることを証明してサービス設計を開始)した段階です。
今のところ、以下の設計(構想)ですが、ここから本格的なサービスインを目指し、さらに開発を進めていきつつ、最適な構造を探っていくフェーズです。
現在の仕様概要(変わる可能性はあります)
- DOMから画像パスを取得
- サイト内全画像情報から「文字情報の含まれるもの」を選定
- 翻訳元として登録された言語以外の要素を排除(※ 日本語 ⇒ 中国語 翻訳を行う場合、翻訳元言語となる日本語表記の画像内テキストのみを抽出)
- ディープラーニング技術を活用し、テキスト情報の取得とセンテンス(文節)エリアの座標特定・修正対応
- 縦書き|横書きを認識・変更対応
- クロスランゲージ翻訳エンジン※ へ原文をパスし、翻訳後の文章を取得
- 対象センテンス領域を背景色で塗りつぶし、フォントサイズを自動調整して文字画像を生成・合成
- 諸々の処理の適用非適用・各種指定変更・差し替えは人間が作業
- 最終的に合成された画像を元々のサイト内画像と置換し表示
※クロスランゲージ社の独自翻訳エンジン。ユーザー辞書登録が可能なため、商品名など個別カスタマイズ必須なものも正しく訳すことができる
わずか数年で10~20倍に?伸び続ける越境ニーズをスルーしないために
改めて見てみると、どこの統計指標も一様に「世界的に見ても越境ECが著しく伸びている」と叫んでいます。(下図は経済産業省のもの)
当然、この流れは日本国内においても起こると言われており、訪日ユーザーの爆買いだけではなく、ECによる国外からの需要が伸びると言われ続けています。
しかし、では今日本企業が積極的に海外向け越境ECへ対応できているのか? というと、疑問符がつく状況のよう。
どの資料も「越境ECが伸びている」と主張し、かつ事業者側でも「重要だ」と分かっていながら、その対応は遅々として進んでいない実情。
現状は既に「偶然アクセスした他言語圏の方に対するおもてなしとして翻訳を……」などと言っている場合ではなく、「積極的に国外にアピールしていかないと成長が止まる未来すらあり得る」といえる状況です。
もちろん、「画像の自動翻訳が可能になったから全部上手くいくはず」は言い過ぎですが、「画像翻訳は手間だから……」などの理由で多くの企業がためらってしまうのは、やはりもったいない。
上記のような理由から、クロスランゲージとレッジは共同研究かつ共同開発という体制で本プロジェクトを開始するに至りました。
実証実験に参加してみたい企業を募集中
基礎的な部分はすでにPoCクリアとなったこのプロジェクト。次なる展開として「実際の事業社と提携し使ってもらう」実証実験を計画している段階です。
- 商品を国外にも売りたいが、LPが画像ばかりで翻訳も難しい
- 運用しているECの商品詳細ページに画像を多用していて、システムの都合で変更もできない
- 既に翻訳ツールは入れているが、主要動線部分が画像で、ここでユーザーを逃してる気がしてならない
もし上記のようなことを考えていて、実証実験に参加したいという企業様がいらっしゃいましたら、ぜひ以下のレッジ内プロジェクト推進チームお問い合わせ先へご連絡ください。
お待ちしております!