楽天が日本語に最適化した高性能なLLMを公開、オープンモデルで提供してAI発展に貢献

「基盤モデル」「インストラクションチューニング済モデル」「チャットモデル」の3つ

楽天グループは、日本語に最適化した高性能の大規模言語モデル(LLM)を公開した、と3月21日に発表した。基盤モデル「Rakuten AI 7B」と、同モデルを基にしたインストラクションチューニング済モデル「Rakuten AI 7B Instruct」、さらにファインチューニングを行ったチャットモデル「Rakuten AI 7B Chat」の3モデルを「Apache 2.0ライセンス」で提供する。楽天の公式「Hugging Face」リポジトリからダウンロードできる。

基盤モデルとインストラクションチューニング済モデルがトップの評価を獲得

「Rakuten AI 7B」はフランスのAI(人工知能)スタートアップのMistral AIのオープンモデル「Mistral-7B-v0.1」を基に大規模なデータを学習させた70億パラメータの日本語基盤モデル。「Rakuten AI 7B Instruct」は指示形式のデータで基盤モデルをファインチューニングし、入力した指示に対して返答を生成する。「Rakuten AI 7B Chat」は会話形式の文章生成のためのチャットデータを用いてファインチューニングした。

基盤モデルとインストラクションチューニング済モデルは、評価ツール「LM Evaluation Harness」で高いパフォーマンスが評価され高性能と実証された。全3モデルは文章の要約や質問応答、一般的な文章の理解、対話システムの構築など、さまざまなテキスト生成タスクにおいて商用目的で使用できる。基盤モデルは他のモデルの基盤としても利用が可能。オープンなモデルとして提供することで、国内外のAIの発展を後押しする。

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

検索オプション
より目的の検索結果となるように検索条件を絞り込める検索のこと。サイト内検索を提供 ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]