Googleが高性能AIモデル「Gemini」発表、マルチモーダルで高度な推論性能を備える

会話型AIサービス「Bard」に導入し、「Google Pixel 8 Pro」は初のAI内蔵スマホに

米国Googleは、高性能なAI(人工知能)モデル「Gemini(ジェミニ)」を12月6日(現地時間)に発表し、7日に日本語訳を公開した。テキスト、画像、音声、動画、プログラミングコードなどさまざまな種類の情報をシームレスに理解して組み合わせるマルチモーダルなAIとしてゼロから構築し、テキスト、画像、音声など同時に認識して理解できる。

最初のバージョンのGemini 1.0は、「Gemini Ultra」「Gemini Pro」「Gemini Nano」の3つのサイズに最適化し、データセンターからモバイルデバイスまであらゆる場所で効率的に動作する。Ultraは非常に複雑なタスクに対応する高性能の最大モデル。Proは幅広いタスクに対応する最良モデル。Nanoはデバイス上のタスクに最も効率的なモデル。

Ultraは自然な画像の理解から数学的推論、音声や動画の理解まで32の業界ベンチマークのうち30で既存AIの最高水準の結果を上回る。数学、物理学、歴史、法律、医学、倫理など57科目を組み合わせてテストする「MMLU(大規模マルチタスク言語理解)」で90.00%をスコアし、人間の専門家を上回るパフォーマンスを示した初のAIモデルになった。

GeminiはGoogleの各製品を通じて提供され、会話型AIサービス「Bard(バード)」では理解と要約、推論、ブレインストーミング、文章編集、計画の立案などBardでできることが大幅に向上する。170以上の国と地域で英語で利用でき、今後数カ月以内にさまざまなマルチモーダルデータに拡大して、新しい場所や言語のサポートを追加する。

スマートフォンの「Google Pixel」に導入し、「Google Pixel 8 Pro」はネットワーク接続がなくてもNanoを実行できる初のAI内蔵スマホに。レコーダーアプリの要約やメッセージングの「WhatsApp」と仮想キーボード「Gboard」でスマートリプライ(返信)できる。日本語対応は未定。「Google検索」「広告」「Chrome」にも導入される。

Googleデータセンターに並ぶCloud TPU v5p AI アクセラレータスーパーコンピューター
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

GRP
テレビCMにおいて、広告出稿回数ごとの視聴率を足した数値。 放送局が定めた ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]