ChatGPT Atlasとは何だろうか? OpenAIの新しい人工知能(AI)搭載ブラウザとその「エージェントモード」機能の基本的な説明のほか、これを使う場合のメリットとデメリットを、チャーリー・マーチャント氏が解説する。
ホワイトボード・フライデーへようこそ。私はExposure Ninjaのチャーリー。今回はChatGPT Atlasについて話そう。これが何なのか、なぜ他のブラウザと違うのか、どのように機能するか、そして実際に使う場合のメリットとデメリットを見ていこう。
ChatGPT Atlasとは
ChatGPT Atlasは、OpenAIが提供しているAI搭載ブラウザだ。
搭載されている特別な機能として、次の2つがある:
1つ目は、ChatGPTのサイドバーが統合されている点。インターネットで閲覧している内容について、いつも使っているChatGPTのアカウントで会話できる。
2つ目は、エージェントモードが統合されている点。君に代わってタスクを実行してくれる。
ChatGPT Atlasはどのように機能するのか
では、ChatGPT Atlasが実際どのように機能するのだろうか。AtlasはOWLと呼ばれるコアアーキテクチャを採用している。OWL(OpenAI's Web Layer)の役割はブラウザとLLM(大規模言語モデル)を連携させることだ。
たとえば、次の状況を想定してみよう:
君は、定期的にパークランや5キロのコースを走るために、新しいランニングシューズを探している。君はChatGPTをすでに使っており、これまでに「自分の走り」「足の形」「目標や野心」などについて、ChatGPTに相談したことがある。
そこで、ChatGPTのブラウザであるAtlasで、最適なランニングシューズを実際に検索してみた。しかし、検索するだけでは自分に合ったランニングシューズを見つけるために必要な結果が得られないかもしれないと感じた。
そこで君は、ChatGPT Atlasの機能を活かすために、もう少し詳しく質問してみる。具体的には、ChatGPT Atlasのサイドバーを開き、現在閲覧している内容についてChatGPTと実際に会話する。
その仕組みについて少し説明しよう。次の5つのポイントをもとに解説する。
ユーザー入力
ユーザーがChatGPT Atlasのサイドバーで何か入力する。ChatGPTに聞くのではなくChatGPT Atlasでクエリを入力するのは、「ChatGPTが最高と判断するランニングシューズ」というだけでなく、「自身が自分にとって最適なランニングシューズ」を見つけようとしているからだ。
コンテキストの理解
ChatGPT Atlasは、ユーザーの入力を受けて、コンテキストを理解する。具体的には、現在ブラウザで開いているタブを分析する(複数のタブに及ぶ場合もある)。
ちなみに、君が閲覧している内容をモデルが認識できるのは、君の許可がある場合だけだ。現時点で、ChatGPT Atlasではこの機能のオンとオフを切り替えられる。
情報検索
次にChatGPT Atlasは、情報を検索する。
ローカルのコンテキスト内にすでに十分な情報があるとChatGPTが判断した場合は、それを使ってクエリに直接回答できる。だが多くの場合、特にユーザーの質問に対してより完全で適切な回答をするために、検索APIを利用して最新の正確な情報を検索することもある。
推論と回答生成
その後、推論と回答生成の段階に移る。LLMは複数の要素を融合させる。具体的には、次のようなものを使う:
- ChatGPT Atlasのブラウザタブで見ていたページのコンテキスト
- ユーザーの意図(ユーザーが本当に求めているものについてのLLMの推定)
- 必要に応じてインターネット検索APIを使った場合は、取得した情報ソース
- 関連するメモリ
さらに、ChatGPTでの過去のチャットや会話を参照し、回答にも含めるべき関連性があるかどうかを判断する。
出力
次に、それを出力にまとめる。その出力は、次のようなバリエーションがある:
ChatGPTのタブで利用するときのようにテキスト形式の直接的な回答になる場合もある。
マルチステップのエージェントモードによる一連のタスクの形で、君の代わりに片付けてくれる場合もある。
後者のエージェントモードは、たとえば「航空券の予約や旅行のリサーチ」、あるいは「最も安いライブチケットを探す」といった、すべてを手作業でやりたくない場合には、特に役立つ。
ChatGPT Atlasの優れている点
ChatGPT Atlasには優れている点もあれば、あまり優れていない点もある。優れている点は次の4つだ:
- チャットユーザーインターフェースが組み込まれている
- コンテキストを把握している
- 従来の検索よりも高速に感じられる
- エージェントモードが実際に一部のタスクを代わりにやってくれる
それぞれ、具体的に見ていこう。
ChatGPT Atlasの優れている点として、第1にチャットユーザーインターフェースが組み込まれていることが挙げられる。インターネットで実際に閲覧している内容についてリアルタイムで質問でき、要約を作成したり、その情報をさまざまな方法で使ったりするよう指示することもできる。
第2に、コンテキストを把握していることだ。まったく別のブラウザやタブでChatGPTを使うのと比べ、ChatGPT Atlasでは、ブラウザのタブで開いている内容をChatGPTが把握し、ユーザーと一緒にその情報を検討できる。つまり、コンテキストをはるかに深く理解し、ユーザーが検索で何をしようとしているかを把握できるということだ。
第3に、従来の検索よりも高速に感じられる。これは、双方向に会話することで購買ジャーニーをはるかに迅速に進めるのに役立つからだ。
第4に、エージェントモードが実際に一部のタスクを代わりにやってくれる点は非常に優れている。結局のところ、誰もが「少しでも簡単に検索したい」と思っているのだ。
ChatGPT Atlasのあまり優れていない点
あまり優れていない点は次の4つが挙げられる:
- データセキュリティやプライバシーに関して懸念がある
- まだ開発段階で問題が生じることがある
- エージェントモードがすべてのタスクを完了できないこともある
- 現時点で提供されているのはmacOS版のみ
具体的に説明する。
第1にChatGPT Atlasはかなり新しいブラウザということもあり、現時点ではデータセキュリティやプライバシーに関して、いくらか懸念がある。Atlasに乗り換える前に、必ずその点に留意してほしい。
第2に、まだ開発段階だという点がある(つまり完成していない)。開発中の段階では問題が生じることもある。
第3に、エージェントモードも開発段階だという点で例外ではない。エージェントモードがすべてのタスクを完了させられず、ユーザーの介入が必要になることもある。
それから、現時点ではmacOSでしか利用できない点も難点だ。だが、他のOS向けも今後リリースされると思われる。
以上、ChatGPT Atlasとは何か、実際どのように利用できるかについて紹介してきた。
私はExposure Ninjaのチャーリー・マーチャント。いつでもLinkedInで連絡がとれる。


