サイバーエージェントが日本語に特化したLLM(大規模言語モデル)を開発して活用開始

より自然な日本語の文章生成を実現、国内における自然言語処理技術の発展に貢献

小島昇(Web担編集部)

2023年5月15日 7:01

サイバーエージェントは、独自の日本語LLM(Large Language Model:大規模言語モデル)を開発した、と5月11日に発表した。同社が保有する大規模な日本語データを生かして開発し、より自然な日本語の文章生成が可能だ。LLMの学習規模を示すパラメータ(変数)は130億までの開発を完了し、AI(人工知能)を活用した「極予測AI」「極予測TD」「極予測LP」など広告クリエイティブ制作領域のサービスで活用を始めている。

日本語LLMは広告配信やクリエイティブ制作の技術課題に取り組むAI研究開発組織「AI Lab」と、プロダクト開発チームが共に研究開発している。今後、産学連携の取り組みを通じて、国内における自然言語処理技術の発展に貢献する。AI技術の社会実装で培った知見を生かし、広告制作だけでなくチャットボットやRPA(業務自動化システム)など業界特化型LLMの構築や、企業と連携してLLMを活用したビジネス開発を推進する。

米国OpenAIが開発した「ChatGPT」など生成AI・LLMが世界的に注目を集め、あらゆる業界で急速に活用が進むが、既存のLLMのほとんどは英語を中心に学習されており、日本語と日本文化に強いLLMは少ない。機械学習に適したGPU(画像処理半導体)で半導体大手の米国NVIDIA(エヌビディア)の「NVIDIA DGX H100」を国内で初導入し、国内最大級のLLM開発を予定するなどより性能の高いモデルの開発を見据えている。
 

この記事をシェアしてほしいパン!

人気記事トップ10

人気記事ランキングをもっと見る

今日の用語

エコーチェンバー
「エコーチェンバー」(Echo Chamber。エコーチャンバー)とは、「似たような意見・思想を持った人たちがコミュニティを形成した結果、意見が偏ってしまう現象」を指す。もともとは音響用語で、録音などで残響が強く残る“残響室”の意味だった。 SNSなどで自分と似たようなユーザーや好ましいと感じるユーザーばかりをフォローした結果、目にする投稿が世間一般・全世界で肯定されている意見と思い込んでし 用語集 を見てみる