疲弊する出版業界に一石を投じる。神保町 × カンボジアのタッグで誕生したAI小説執筆プロジェクト

このエントリーをはてなブックマークに追加

斜陽産業と言われて久しい出版業界。

電子書籍・スマートフォンの台頭により紙の本の市場は縮小。紙の本を読む機会は大きく落ち込み、コンテンツメーカーはますます窮地に追い込まれています。

そんな中、AIが小説を執筆するプロジェクトが、本の町・神保町と、なんと国をまたいだカンボジアで発足。第2フェーズに入ったというプレスリリースが先日発表されました。

そこで、プロジェクトを推進する株式会社Books&Company 代表の野村 衛さんに詳しい話を聞くことに。出版業界の構造的な問題から、プロジェクトの詳細まで語ってもらいました。

紙の本は「贅沢品」になる。紙の本離れで疲弊する出版業界

――初めに、現在の出版業界の状況について教えてください。

――野村
「はっきり言えば不況ですね。紙の本はどんどん読まれなくなっています。1日200点の新刊が発売されますが、納品された書籍のうち、4割が返本される状況です」

出展:みずほ銀行調査より

その一番の理由は、電子書籍、スマートフォンの台頭による、紙の本離れ。一部で売れる本もありますが、大多数の本は売れ残る状況だと野村さんはいいます。

――野村
「本が売れないので、本を運ぶ流通も疲弊しています。売れずに返本される本が大量に発生するので、流通拠点の間でたらい回しにされたり。出版を支える周辺業界にも影響を及ぼしています」

本が売れていた時期は、マーケット調査として本を出版する方法が取られていたそうです。最初からドラマや映画を制作しようとするとお金がかかりますが、本を出版するだけなら相対的に投資が少なくて済みます。

そのため、まずは本を出版してみて、ヒットすれば漫画化・ドラマ化・映画化へと横展開していったんだそう。

――野村
「今はもうその方法は難しくなってきています。文学賞で新人作家が受賞しても、その後に名前を聞くことは稀です。コンテンツを生み出す側も含めて業界全体が弱っているので、いずれは紙の本は贅沢品になるでしょう

AI小説執筆プロジェクトの発足経緯と現状。『象は何のメタファーか?』の質問にAIが答える

――業界全体が苦境なのが伺えます。AI小説執筆プロジェクトは、どのような経緯で始められたのでしょうか?

――野村
「もともと出版社の編集者だったんですが、出版不況があったため、なんとかコンテンツ産業を盛り上げたいと思い起業したのがきっかけです」

起業後、最初に電子書籍のソリューション事業をおこなっていた野村さんですが、これがうまくいかなかったんだとか。そこで、なにかできないかと展示会に足を運んだ際、カンボジアにキリロム工科大学で働く旧知の知人と遭遇。キリロム工科大学は、最先端の技術を教え、高度なIT人材を育てるカンボジアの大学です。

――野村
「その後、大学創設者の猪塚 武さんを紹介され、悩みを相談したところ、じゃあAIで小説を執筆しようという話になって。そこからキリロム工科大学を紹介してもらって、少しずつ話が進みました」

――なるほど。プロジェクトの概要を教えていただけますか?

――野村
「開発はキリロム大学主導でおこない、現在は第一フェーズの検証が終わった段階です。第一フェーズでは、AIが、学習した小説をきちんと『解釈』できているかを検証しました」

AIが物語を解釈可能かどうかの検証では、村上春樹の短編小説『象の消滅(英語版)』を学習。内容について質問したときに、内容を深い部分まで解釈できるのかを検証しました。その結果「正解釈率」が88%、ファクトに関する「正答率」が84%と高精度を記録したといいます。

検証プロセスとしては、以下のようになっているそうです。

  • オープンソースのデータを学習し、文章構造を理解
  • 「象の消滅」を形態素解析し、トレーニングデータを抽出
  • 「象の消滅」を理解・解釈
  • テキストで質問し、回答を生成
――野村
「そのほか、『象は何のメタファーか?』という質問に対して『象は力によって収容されたかつての生活様式や敏感な関係性の象徴となります』ともAIは回答しました」

メタファーは人間でも解釈が人によって分かれます。小説内のファクトの整理も、あいまいなまま読み進めつつ頭の中で補完したりと、人間でもかなりの集中力を必要とします。その両方が80%超え。かなりの精度が伺えます。

AIが小説を書くまでの仕組み。難点は学習データの収集

――AIの仕組みの部分についても教えていただけますか?

――野村
「開発プロセスとしては以下です。

  • データ付与
  • データ分析
  • 解釈
  • 物語の構築
  • 物語の詳細の生成
  • 文章生成
  • 物語の創作

今はこの中の、解釈が可能かどうかの検証フェーズが終了した段階です。ここから、よりAIが物語を“書く”ことにつながる部分を試していきます」

概念図
――野村
「技術としては自然言語処理に相当するもので、非構造化データの自然文を構造化、パターンを学習して自然文を生成していきます。難点としては、著作権の問題で学習データを集めるのが難しいこと。現在存命の作家の著作物は許可がなければ使えませんから」

著作権は通常、作家の死後50年後に効力が切れます(取材時点では50年。2018年12月30日より施行の改正著作権法により死後70年に改定)。そのため、現在の学習では著作権の切れた青空文庫などを学習データとして使用しているとのこと。AIに興味のある小説家を募って、データを提供してもらうことも視野に入れているそうです。

コンテンツ産業をAIが変えるのか?すべてはこれから決まる

――今後の展望を教えてください。

――野村
「まだ始まったばかりで、生成エンジンはこれから構築していきます。そこでどのようなアウトプットが出てくるかを精査し、たとえば短編集にするのか、AIに小説の設定を考えてもらうだけにするのか、などを決めていきます」

まだまだアウトプットとしてはどのような形で出てくるかわからない状態だといいます。直近で生成にトライするジャンルとしては、下記を想定しているとのこと。なかなか面白そうなジャンルです。

  • 夏目漱石や太宰治などの文豪、物故作家が残した作品の「その後」や「続編」
  • 3億円事件やグリコ森永事件など、関心の高い事件をテーマにしたフィクション
  • 戦国時代や明治維新など、日本人に好んで読まれる歴史小説の新分野
――野村
「小説には時代を超えて普遍的に人気を集めるジャンルがあります。大作の続編や、現実の事件を元にしたフィクション、歴史小説などがそれにあたります。ゆくゆくはAIが書いた小説を商業的に出版することも視野に入れているので、まずは手堅くこれらのジャンルで行こうという打算もありますが(笑)」

AIが小説を書くことが可能になれば、小説だけでなく脚本家、ゲームのシナリオライター、漫画原作者、などのストーリーを紡ぐほかの職業にも応用できます。また、ある作家が書いた小説の結末の別バージョンを生成し、どちらが面白いかABテストなども可能になるかもしれません。

そうなればコンテンツを生み出す側の負担は大きく変わるはず。それが良いのか悪いのかは議論の余地がありますが、少なくとも一石を投じることは間違いありません。プロジェクトの行く末が楽しみです。