ついに日本でも! 日経がAIによる『完全自動決算サマリー』をリリース
はい。ついに出ました。AIによる超本格記事自動生成プロダクトです。
僕らデジマラボも昨年11月にはAI新聞記者プロジェクトなどに参画させてもらってましたし、なによりAIライター正式採用webメディアの一つとしてなんとなく感じてはいたんです。
あ、記事生成系AIは上手くやれば充分商業ラインに乗るな
みたいな予感ですね。
とはいえ、世界屈指のややこしさを誇る我らが日本語。とにかく省略多いし掛かり受け多いし…、なにより使う人が少ないもんで学習データが足りない足りない。
英語圏では既にメジャーになりつつある(本格的な)スポーツ速報のAI生成なども、日本においてはまだまだもーちょっとだけ先の話になるんだろうなー。とか思ってたんですよね。(デジマラボでも英語生成 ⇒ 日本語翻訳は人間ですし)
ところが…ですよ。
ILUの巨大知識データ×日経の記事教師データが不可能を可能に
日経がいきなり『やってくれた』みたいです。
とりあえずリリースされた『完全自動決算サマリー』はこちら
いや、すごい。すんごいですこれ。
仕組みとしては…
- 仕組みとしては決算短信のPDFファイルを解析
- まずフレーズ単位でのAIによる係り受け解析を行い
- そこから文と文脈を再分析
- 予め学習させておいた過去の日経サマリー記事情報から生成したパターンから文を選択
- ここに決算短信のサマリ情報XBRLから事業名を補完して文章を生成
- さらにフレーズ解析を行い数字記載を除外
みたいなことをやってるらしいです。
なんと細かなアルゴリズムも同サイトで公開されているので、興味ある方はぜひぜひ。
オールジャパンで実現した座組のスマートさにも注目
今回リリースされ実際の記事もお披露目された『完全自動決算サマリー』ですが、その実現の座組がまたクールだったので触れておこうかなと。
日経がこれまで数十年単位で書き続けてきた『記者の叡智』とも言うべきデータ(こういうときにはこういう書き方で事実をまとめる…といったパターン。多分)を惜しげもなく学習データとして開放。
ここに言語理解研究所(ILU)が30年に渡って研究したおした『文字になっていない文意を理解する技術(知識駆動形AI)』がコアエンジンとして実装。
機械学習による『記者の資料の読み解き方』をAIに学習させる部分では東大松尾研究所が参画したんだとか。
徹底して和製でやったってのが、また痺れます。
何でもかんでもWatson一強じゃ、盛り上がらないですしもんね。やっぱ。
AI時代に必要なのはデータ解析+共有かもしれない
さて、今回はまだプロトタイプということになので、実際導入して効果がどんなもんだったのか?かかった予算は?ROIは?などもろもろ謎な状態なのかですが、業界的にもかなり大きな一歩なんじゃないかと感じています。
これまで多くの企業において、非常にデータ化しにくかった ”コアな価値” の部分。(今回の日経の例で言えば ”記者の執筆ノウハウとかファクト確認からの「らしさ」演出とか” )
それを具体的に学習可能な状態にもっていけるよう解析し、AIに学習させるために開放…というか共有を行い、実際のプロダクトとしてリリースしてみせた。
日本語の難しさ云々を抜きにしても、なんとなくマーケットに『新しい風』が吹いた感を感じずにはいれないわけです。
これからの日経 完全自動決算サマリー の進歩も楽しみですが、この流れそのものが加速してあっちゃこっちゃの市場に波及していくのが、今から楽しみですね。
ではまたー。
「BITA デジマラボ」掲載のオリジナル版はこちらついに日本でも! 日経がAIによる『完全自動決算サマリー』をリリース2017/01/26
ソーシャルもやってます!