サイバーエージェントが日本語に特化したLLM(大規模言語モデル)を開発して活用開始

より自然な日本語の文章生成を実現、国内における自然言語処理技術の発展に貢献

2023年5月15日 7:01

サイバーエージェントは、独自の日本語LLM(Large Language Model:大規模言語モデル)を開発した、と5月11日に発表した。同社が保有する大規模な日本語データを生かして開発し、より自然な日本語の文章生成が可能だ。LLMの学習規模を示すパラメータ(変数)は130億までの開発を完了し、AI(人工知能)を活用した「極予測AI」「極予測TD」「極予測LP」など広告クリエイティブ制作領域のサービスで活用を始めている。

日本語LLMは広告配信やクリエイティブ制作の技術課題に取り組むAI研究開発組織「AI Lab」と、プロダクト開発チームが共に研究開発している。今後、産学連携の取り組みを通じて、国内における自然言語処理技術の発展に貢献する。AI技術の社会実装で培った知見を生かし、広告制作だけでなくチャットボットやRPA(業務自動化システム)など業界特化型LLMの構築や、企業と連携してLLMを活用したビジネス開発を推進する。

米国OpenAIが開発した「ChatGPT」など生成AI・LLMが世界的に注目を集め、あらゆる業界で急速に活用が進むが、既存のLLMのほとんどは英語を中心に学習されており、日本語と日本文化に強いLLMは少ない。機械学習に適したGPU(画像処理半導体)で半導体大手の米国NVIDIA(エヌビディア)の「NVIDIA DGX H100」を国内で初導入し、国内最大級のLLM開発を予定するなどより性能の高いモデルの開発を見据えている。

この記事のキーワード：

#ボット

この記事をシェアしてほしいパン！

【24卒就活】IT業界人気企業ランキング、1位は14年連続で「NTTデータ」。最も社風がよさそうなのは？【楽天みん就調べ】

楽天グループの2023年1～3月期決算の売上収益は4756億円、第1四半期として過去最高

この記事の筆者

小島昇（Web担編集部）

フリーランス記者・編集者。インプレス「Web担当者Forum」でニュース記事を担当。「ASCII STARTUP」などでも執筆。東洋経済新報社の会社四季報編集部記者。毎日新聞社で電機メーカーや通信業界、東証、総務・経産・国交省などを取材し、ニュースサイトの編集10年を経て2019年9月退社し独立。
X(旧twitter):@nobochan

小島昇（Web担編集部）のプロフィールを見る