Ledge.ai出張所

オープンか、クローズドか？ Stability AIが占う生成AIの未来

2023年5月11日、AI・人工知能EXPO内にてStability AI JapanでHead of Japanを務めるJerry Chi氏による講演。

0 4 0

2023年5月11日、AI・人工知能EXPO内にてStability AI JapanでHead of Japanを務めるJerry Chi氏による「生成AIの今と未来」と題した講演が行われた。本稿ではその様子をお伝えする。

Jerry Chi氏プロフィール
Jerryは、東京を拠点に活躍する台湾系アメリカ人で、四か国語を話します。これまでに彼は、Google、Supercell、SmartNews、Indeedでアナリティクスや機械学習関連のさまざまな役職を経験してきました。また起業家としての経験を通じ、複数のスタートアップへのアドバイザーを勤めています。Jerryのパッションは生成系AI及び機械学習のクリエイティブ分野への応用です。スタンフォード大学工学部とペンシルバニア大学ウォートンスクール卒。

2022年後半から始まったStable Diffusionの波

今でこそ有名になった画像生成AI「Stable Diffusion」を、Stability AIが発表したのは2022年9月だ。1ヶ月でAPIの利用者が100万人を突破し、12月には利用者が1,000万人を突破。年が明けて2023年1月には日本法人が設立され、4月には大規模言語モデル「Stable LM」もリリースしている。

Stable Diffusion の機能も続々追加されている。画像を生成する際にサイズなどの複数バリエーションを生成する機能や、自然言語や線、骨格情報を用いた画像編集機能、画像を高解像度化するイメージアップスケーリングAPIも公開している。

生成AIの事例も爆発的に増えている。以下はJerry氏が示した一例だが、Corridor Digitalというアニメ制作会社によるもの。俳優をグリーンバックなどで撮影し、Stable Diffusionを用いてアニメ化している。同氏によると、「2ヶ月前の事例なので、すでに古い技術」だという。

AIモデルは寡占化するか、民主化するか

続いてJerry氏は、昨今のAIトレンドを説明した。

ーーJerry氏
「生成AIに関する論文は指数級数的に増加しています。生成AIの市場規模は2030年には20兆円に上ると想定されており、AIへの投資は爆発的に増加しています。これは生成AIがこれほどトレンドになる以前の数値で、今ではもっと増加しているでしょう」

さらに、MicrosoftとOpenAI、AWSとStability AI、GoogleとCohere、GoogleとAnthropicなど、大手IT企業とスタートアップのパートナーシップが増えていると指摘。生成AIの技術スタックを示し、現在は大手IT企業による大規模言語モデルのAPI公開によって、生成AIを活用したアプリケーション開発への参入障壁が大きく下がっているとも示した。

続いてJerry氏は、生成AIの未来について聴衆に質問を投げかけた。ビッグテックによってAIモデルが寡占化するシナリオAと、多くの企業がオープンソースのAIモデルを使用するAI民主化ルートのシナリオB、どちらを予想するか？という質問だ。

シナリオAはモデルはクローズドであり、API使用料も高額になる。シナリオBではモデルは公開されており、無料または安価にモデルを使用可能だ。会場ではシナリオBが多数派だった。

ーーJerry氏
「私もシナリオB、つまりAIは民主化していくと思います。先日Googleの内部資料が流出したというニュースがありました。その中でGoogleの研究者は、”オープンソースには勝てない。我々のモデルには参入障壁がない”と言っています」

どういうことか。Jerry氏によれば、以下の要因でシナリオAが現時点では現実的だという。

性能の蒸留が可能なこと
最先端モデルがクローズドであっても、最先端モデルの出力を別のモデルのトレーニングに使用すれば、最先端モデルの性能を学習可能
価格の優位性
オープンなAIモデルは大体のケースで安く使える
コミュニティの存在
オープンソースのコミュニティには熱心な研究者、開発者、クリエイターや有力なユーザーがいるが、クローズドでは一企業のせいぜい数百人しかモデルの改善に寄与できない
カスタマイズ性
オープンソースはユースケースがさまざまで、モデルをカスタマイズしやすい

また、オープンソースではネットワーク効果も働く。個人の改善のみならず、それを共有することで、クリエイターやファン、開発者が相互に接触し、改善の好循環が生まれていく。この点で、オープンなモデルであれば派生モデルも生まれやすいとJerry氏は語った。

また、ChatGPTなど対話型AIで問題となっている内容の正確性については、人間や別のツールで事後確認を行うこと、生成AIと他システムとの連携で緩和すること、そもそも100％の正確性を求めないことを勧めた。さらに、クローズド≒ブラックボックスなモデルは生成物に関して説明ができないことも指摘。オープンなモデルを選び、自社が選んだ環境で使うことが重要と述べた。

ーーJerry氏
「生成AIにおいて、一番大きなパラダイムシフトは、“できない”が“できる”に変わることです。絵が書けない小説家が漫画家になることもできるし、自然言語でソフトウェアを開発することも今ではできるようになりました。今後は、より自ら選び、組み合わせることで目的を達成する、プロデューサー的スキルが重要になってくるでしょう」