2023年5月17日、株式会社xenodata labは新たな経済分野特化型言語生成AI「SPECKTLAM(以下スペクトラム)」の発表を行った。スペクトラムは、経済予測プラットフォーム「xenoBrain(ゼノブレイン)」のコンテンツ生成における改善を目指して開発された。xenoBrainは35,000指標の時系列データの1年先までの月次推移の予測を提供する経済分野に特化した汎用時系列データ予測AIである。
注:SPECKTLAM(スペクトラム)は「LAnguage Model SPecific to EConomic Knowledge and Text」の略
スペクトラムは2022年からxenoBrainのコンテンツ生成に適用されていたが、大幅な改善を経て本格的な活用が可能となった。同社は特に、xenoBrainが提供する経済予測の解釈性の向上に焦点を当てている。
また、2023年1月に資本提携契約を締結した野村ホールディングスのグループ会社である野村證券は、スペクトラムを利用したサービス提供に向けた準備を進めているとのこと。
広範な経済データと独自の構造化データを学習し、経済文章を生成
スペクトラムは、広範な経済データとxenoBrain独自の構造化データを学習し、その知識を基にファインチューニングすることで、様々な経済文章を生成できるもの。高速な学習により最新の経済状況を反映した文章を生成することができ、大規模な文章を同時に生成する能力を持つため、例えば毎朝大量のユーザーに対してカスタマイズされた文章を同時に生成することも可能だという。
スペクトラムの学習データは主に「経済データ」「xenoBrainが独自に作成した構造化データ」の2つ。
経済データ
・約2000万本の経済ニュース: ダウ・ジョーンズ社との業務提携を通じて取得した解析可能なニュースデータを10年分学習(無断でのデータ利用は行っていない)
・開示資料: 有価証券報告書や決算短信などの開示資料を10年分学習
・Wikipedia: オープンな情報源としてWikipediaのデータを活用
・企業ウェブサイト: 各企業の公式ウェブサイトから得られる情報も学習データとして活用
・オープンソースの言語資源: 自然言語処理のためのオープンソースの言語資源も利用
xenoBrain独自の構造化データ
・シナリオデータ: 自然言語処理、機械学習、アナリストの手動による調査等の方法で経済事象同士の因果関係を整理し構築されたデータ(現在は500万通りの因果関係データを保有)
・独自の自然言語処理用辞書体系: 自然言語処理を行うための独自の辞書体系を数十万レコードの手動調査により蓄積。同義語辞書や階層構造を定義する辞書などが存在
経済予測と組み合わせ、さまざまなタスクに応用可能
経済事象の解説文や経済文章の要約の生成など、主に経済分野に特化した構造化データ生成と文章生成タスクが実現可能となるスペクトラム。ユーザーが求めるテーマのニュースを検索するクエリを自動生成することができるため、ユーザーが入力した短文を基に関連するニュースを推薦するような機能も実装できるとのこと。
xenoBrainとスペクトラムを組み合わせることで、ユーザーの興味関心や嗜好に合わせた形で、文章による解説を生成することが可能になるという。
ユースケースとして、例えば化学メーカーでナフサの調達を行う担当者は、スペクトラムを利用してナフサ価格の動向を予測し、その要因を解説する文章を生成することができるという。金融機関で運用業務を行う例では、特定の企業の業績変動リスクに関する予測と解説を得られるとのこと。
xenodata labは、今後もAI技術の発展を活用し、経済分析を支えるサービスの提供を目指すとしている。