サイバーエージェントが日本語に特化したLLM(大規模言語モデル)を開発して活用開始

より自然な日本語の文章生成を実現、国内における自然言語処理技術の発展に貢献

サイバーエージェントは、独自の日本語LLM(Large Language Model:大規模言語モデル)を開発した、と5月11日に発表した。同社が保有する大規模な日本語データを生かして開発し、より自然な日本語の文章生成が可能だ。LLMの学習規模を示すパラメータ(変数)は130億までの開発を完了し、AI(人工知能)を活用した「極予測AI」「極予測TD」「極予測LP」など広告クリエイティブ制作領域のサービスで活用を始めている。

日本語LLMは広告配信やクリエイティブ制作の技術課題に取り組むAI研究開発組織「AI Lab」と、プロダクト開発チームが共に研究開発している。今後、産学連携の取り組みを通じて、国内における自然言語処理技術の発展に貢献する。AI技術の社会実装で培った知見を生かし、広告制作だけでなくチャットボットやRPA(業務自動化システム)など業界特化型LLMの構築や、企業と連携してLLMを活用したビジネス開発を推進する。

米国OpenAIが開発した「ChatGPT」など生成AI・LLMが世界的に注目を集め、あらゆる業界で急速に活用が進むが、既存のLLMのほとんどは英語を中心に学習されており、日本語と日本文化に強いLLMは少ない。機械学習に適したGPU(画像処理半導体)で半導体大手の米国NVIDIA(エヌビディア)の「NVIDIA DGX H100」を国内で初導入し、国内最大級のLLM開発を予定するなどより性能の高いモデルの開発を見据えている。
 

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

robots.txt
ロボット型の検索エンジンが自分のページを登録しないようにするためにサイト管理者が ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]