The Adoption and Usage of AI Agents: Early Evidence from Perplexity
The Adoption and Usage of AI Agents: Early Evidence from Perplexity
基本情報
- arXiv ID: 2512.07828v1 (https://arxiv.org/abs/2512.07828)
- 著者: Jeremy Yang, Noah Yonack, Kate Zyskowski, Denis Yarats, Johnny Ho, Jerry Ma
- 所属: Harvard University, Perplexity
- 投稿日: 2025年12月07日
- カテゴリ: cs.AI, cs.HC
簡単に説明すると
この研究は、汎用AIエージェントの実世界での採用と利用パターンを数億のユーザーインタラクションデータで分析した初の大規模フィールド研究です。
PerplexityのCometブラウザとその統合エージェント「Comet Assistant」を対象に、「誰がAIエージェントを使っているのか」「どの程度集中的に使っているのか」「何に使っているのか」という3つの根本的な問いに答えています。
分析により、高GDP・高学歴国家、デジタルや知識集約的職業の早期採用者が積極的にエージェントを利用していることが判明しました。
使用目的については、階層的エージェント分類法を開発し、生産性・ワークフローと学習・研究が全体の57%を占めることを明らかにしています。
1. 研究概要
1.1 背景と動機
2025年は汎用AIエージェントの年と呼ばれており、会話型LLMチャットボットから行動指向AIエージェントへとフロンティアが移行している。
各種企業が様々な製品でAIエージェント機能をリリースしており、AgenticAI市場は2025年の80億ドルから2034年には1,990億ドルに成長すると予測されている。
経済的影響も大きく、PwCは2030年までに年間2.6兆ドルから4.4兆ドルの経済貢献を予測している。
しかし、実際の人々のAIエージェント採用と使用に関する体系的な行動証拠は限定的であり、多くが企業調査や特定用途(コーディングアシスタント等)に焦点を当てていた。
PerplexityのCometブラウザとその統合エージェント「Comet Assistant」は、2025年7月に開始された最初の広く採用されたAIブラウザの1つです。
本研究は、数億の匿名化されたユーザーインタラクションを分析し、「誰がAIエージェントを使っているのか」「どの程度集中的に使っているのか」「何に使っているのか」という3つの根本的な問いに答える。
1.2 主要な貢献
本論文は、汎用AIエージェントの実世界での採用、使用強度、用途に関する初の大規模フィールド研究を提示している。
数億の匿名化されたユーザーインタラクションデータを基に、AIエージェントの現実的な利用パターンを明らかにしている。
- AIエージェント採用における地理的・職業的格差の定量化:GDP per capita、教育水準、デジタル・知識関連職業との強い相関関係の発見
- 階層的エージェント分類法の開発:トピック・サブトピック・タスクの3レベルで構成される包括的な利用ケース分類システムの構築
- 時系列分析による利用パターンの解明:短期的な粘着性と長期的な認知指向トピックへの移行傾向の発見
- 利用環境の詳細分析:個人利用55%、職業利用30%、教育利用16%の分布と環境ごとの集中度の違いを明らかにした
2. 提案手法
2.1 手法の概要
本研究は観察研究であり、新しい技術を提案するものではなく、既存のAIエージェントシステムの利用パターンを分析している。
PerplexityのCometブラウザとその統合エージェント「Comet Assistant」を対象とした大規模データ分析を実施している。
Cometは2025年7月9日にデスクトップでMax tier加入者向けに開始され、段階的に拡大された。
8月13日にPro加入者、10月2日に全世界のユーザーに展開された。
研究期間は2025年7月9日から10月22日までの3.5か月間で、3つの異なるサンプルを用いて分析を実施した。
2.2 技術的詳細
データサンプリング手法
研究では3つの異なるサンプルを使用している:
Sample A(全体集団): 数百万ユーザーと数億クエリの全体集団データ。採用率と使用強度の全体的パターン理解に使用。
Sample B(職業分析用): 10万Cometユーザーとその最近のクエリをランダムサンプリング。O*NET職業クラスターに基づく職業分析を実施。
Sample C(エージェント利用分析用): 10万エージェントユーザーとその全エージェントクエリをサンプリング。階層的エージェント分類法による用途分析を実施。
階層的エージェント分類法の開発
分類法開発は3段階のボトムアップアプローチを採用:
探索フェーズ: エージェントクエリの埋め込み抽出、K-means クラスタリングによる意味的類似性に基づくグループ化、各クラスターの意味解釈。
精緻化フェーズ: クラスターラベルの手動検査、マージ・分割・調整・拡張の実施。「その他」として分類された大きな割合についてはボトムアップアプローチを再適用。
分類フェーズ: 最終分類法を用いたクエリ分類モデルの構築と適用。
検証手法
1,000件の匿名化・非機密化クエリからなる金標準データセットに対する分類精度の検証を実施。
トピック89%、サブトピック83%、タスク81%、利用コンテキスト83%の一致率を達成。
2.3 新規性
本研究の主要な新規性は、汎用AIエージェントの実世界利用に関する初の大規模フィールド研究である点にある。
従来のLLMチャットボット研究が情報交換に焦点を当てていたのに対し、本研究は外部環境でのタスク実行に着目している。
また、包括的な階層的エージェント分類法の開発により、エージェントクエリの体系的分類が初めて可能になった。
3レベル(トピック・サブトピック・タスク)の構造により、高次目標と低次タスクの区別が可能である。
地理的・職業的・時系列分析を組み合わせた多角的アプローチにより、AIエージェント採用の包括的理解を提供している。
これまでの研究が特定用途(コーディング等)や小規模調査に限定されていたのに対し、本研究は数億インタラクションの大規模データを用いている。
3. 実験結果
3.1 実験設定
分析は2025年7月9日から10月22日の期間に実施され、企業ユーザー、政府プログラムユーザー、アカウント削除ユーザー、データ保持オプトアウトユーザー、ログアウトユーザー、シークレットモードクエリは除外された。
エージェントクエリは、ブラウザ制御またはMCP(Model Context Protocol)やAPI呼び出しを通じた外部アプリケーションでの行動を伴うクエリと定義された。
単純なツール使用(ウェブ検索、コードインタープリター)は情報交換のみのため除外された。
Agent Adoption Ratio(AAR)とAgent Usage Ratio(AUR)を定義し、セグメント内での採用率と使用率をユーザー シェアとの比で評価した。
1以上の値は、該当セグメントが人口ベースに対して過剰代表されていることを示す。
3.2 主要な結果
採用と使用強度
エージェント採用と使用量は研究期間を通じて着実に成長し、一般提供(GA)後に加速した。
GA後期間は全エージェント採用者の60%、全エージェントクエリの50%を占めた。
コホート別分析:
- 7月9日コホート:ユーザーシェア4.3%、エージェント採用者シェア7.7%、AAR 1.79
- 8月13日コホート:ユーザーシェア28.3%、エージェント採用者シェア38.1%、AAR 1.35
- 10月2日コホート:ユーザーシェア67.4%、エージェント採用者シェア54.2%、AAR 0.80
初期採用者は平均的に2倍の採用確率、9倍のクエリ数を示した。
地理別分析:
GDP per capitaと対数エージェント採用者数(人口百万人当たり)の間に強い正の相関(r=0.85, p<0.001, R²=0.73)。
平均教育年数との相関も同様に強い(r=0.75, p<0.001, R²=0.56)。
使用量でも同様のパターンが確認された。
職業別分析:
- デジタルテクノロジー:採用者の28%、クエリの30%
- 学術界、金融、マーケティング、起業が続く
- これらの職業クラスターが全採用者とクエリの70%以上を占める
利用ケース分析
階層的分類法により6つの主要トピックを特定:
トピック レベル:
- 生産性・ワークフロー:36%
- 学習・研究:21%
- メディア・エンターテインメント:16%
- ショッピング・コマース:10%
- 旅行・レジャー
- 就職・キャリア
サブトピック レベル:
- コース:13%
- 商品ショッピング:9%
- 研究:8%
- ドキュメント編集:8%
- アカウント管理:7%
- ソーシャルメディア:7%
タスク レベル:
- 演習支援:9%
- 研究情報の要約・分析:7%
- ドキュメント作成・編集:7%
- 商品検索・フィルタリング:6%
- 研究情報検索・フィルタリング:6%
利用環境の集中度は分野によって大きく異なり、音楽(97%)、動画(97%)、プロフェッショナル ネットワーキング(96%)では上位5環境が高い集中度を示すが、アカウント管理(28%)、サービス ショッピング(35%)、プロジェクト管理(37%)では分散している。
全体では個人利用55%、職業利用30%、教育利用16%の分布を示す。
短期的には強い topic内継続性があるが、長期的には生産性、学習、認知指向トピックへの移行傾向が見られる。
3.3 既存手法との比較
本研究は観察研究のため、既存手法との直接的な性能比較は該当しない。
しかし、従来のLLMチャットボット研究や特定用途AIエージェント研究との比較において、以下の優位性を示している:
データ規模: 数億インタラクションの分析は、従来研究の数千〜数万件の調査規模を大幅に上回る。
包括性: 汎用エージェントの分析により、特定用途(コーディング等)に限定された従来研究よりも広範囲な知見を提供。
分類法の精度: 階層的エージェント分類法の検証において、トピック89%、サブトピック83%、タスク81%の高い精度を達成。
多角的分析: 地理的・職業的・時系列・利用環境の多次元分析により、従来の単一次元分析を超えた包括的理解を実現。
研究手法の妥当性については、業界標準のプライバシー保護、複数サンプリング戦略、自動化分類システム、金標準データセットでの検証により確保されている。
4. 実用性評価
4.1 実装の容易性
本研究は既存のAIエージェントシステムの分析研究であり、新しい実装を必要としません。
分析手法は他のエージェント製品にも適用可能です。
階層的エージェント分類法の構築プロセスは詳細に文書化されており、他の研究者や企業が独自のエージェント利用データに適用できます。
ボトムアップ的なクラスタリング手法と手動精緻化の組み合わせにより、異なるドメインやユーザー層への適応が可能です。
分類器の構築と検証プロセスも体系化されており、89%のトピック分類精度を達成しています。
これは他の製品データでも同様の精度で再現可能と考えられます。
4.2 計算効率
大規模データ分析(数億インタラクション)を効率的に処理するためのサンプリング戦略が確立されています。
3つの異なるサンプル(全体集団、10万ユーザー×2)による多角的分析により、計算コストと分析精度のバランスを最適化しています。
自動化された分類システムにより、人手による分析コストを大幅に削減しています。
1,000件の金標準データセットでの検証により、分類精度と効率性を両立しています。
プライバシー保護のための複数セーフガード(PII除去、内部ID使用、高度集約化)を実装しながらも、分析価値を維持しています。
4.3 応用可能性
本研究の知見は以下の分野で幅広く応用可能です。
製品開発: エージェント機能の優先順位付け、ユーザーインタフェース設計、新機能開発の指針として活用できます。
利用パターンの理解により、より効果的なエージェント体験の設計が可能になります。
マーケティング: 地理的・職業的セグメンテーション戦略の策定に活用できます。
GDP per capita や教育水準との相関関係は、市場参入戦略の重要な指標となります。
政策立案: デジタル格差の理解と対策、AI教育政策の立案、労働市場への影響評価に貢献できます。
職業別採用パターンの分析は、再教育プログラムの設計に有用です。
学術研究: 技術採用理論、ユーザー行動分析、人間-AI相互作用研究の基盤データとして価値があります。
階層的分類法は他のAI製品分析のベンチマークとなり得ます。
業界標準化: エージェント利用分析の標準化された手法とメトリクスを提供し、業界全体での比較可能な研究を促進します。
5. まとめと所感
5.1 論文の意義
本論文は、汎用AIエージェントの実世界利用に関する初の大規模実証研究として、極めて重要な学術的・実用的価値を持っています。
数億のインタラクションデータに基づく包括的分析により、理論的予測を実証データで裏付けた画期的な研究です。
学術的貢献としては、技術採用理論をAIエージェント分野に適用し、地理的・社会経済的・職業的要因との関係を定量化しました。
早期採用者の特徴(高GDP、高学歴、知識集約産業)の発見は、イノベーション普及理論の重要な検証となっています。
方法論的革新として、階層的エージェント分類法の開発は、今後のAI利用研究の基盤となる重要な貢献です。
3レベル構造(トピック・サブトピック・タスク)は、複雑なエージェント行動を体系的に理解する新しい枠組みを提供しています。
実用的価値では、企業の製品開発戦略、マーケティング戦略、ユーザー体験設計に直接活用可能な知見を提供しています。
生産性・ワークフロー(36%)と学習・研究(21%)が主要利用分野であることは、AI投資の方向性を示す重要な指標です。
時系列分析による利用パターンの変化(旅行・メディアから生産性・学習への移行)は、ユーザーの成熟過程を示す貴重な知見です。
短期的粘着性と長期的認知指向への移行の発見は、ユーザー行動の理解を深める重要な観察です。
社会的意義として、デジタル格差の定量化とAI利用における不平等の可視化は、政策立案者にとって重要な情報となっています。
職業別利用パターンの分析は、労働市場への影響予測と対策検討の基礎データとして価値があります。
5.2 今後の展望
本研究は汎用AIエージェント研究の出発点として、多くの発展方向を示しています。
分析の深化として、より長期間の追跡調査により、エージェント利用の成熟過程や社会への浸透パターンを詳細に分析できるでしょう。
異なる文化圏や経済発展段階の国々での比較研究により、普及メカニズムのより深い理解が可能になります。
分類法の拡張では、新しいエージェント機能や利用分野の出現に応じた分類法の更新と拡張が継続的に必要です。
マルチエージェント協調や自律的進化など、より高度なエージェント機能の分類体系の開発も重要な課題です。
因果推論の強化として、観察データから因果関係を推定するより高度な統計手法の適用により、エージェント利用の因果メカニズムの解明が期待されます。
実験的手法と組み合わせることで、利用促進要因の特定と効果的な介入策の設計が可能になるでしょう。
プライバシー技術の進歩により、より詳細な個人レベル分析と強固なプライバシー保護の両立が実現できる可能性があります。
連合学習や差分プライバシーなどの技術により、複数組織間での安全なデータ共有と分析が可能になるかもしれません。
予測モデルの構築として、利用パターンデータを基にした需要予測、機能開発優先度予測、市場拡大予測などの応用研究が期待されます。
機械学習技術との組み合わせにより、個人化されたエージェント体験の設計も可能になるでしょう。
社会影響研究では、AIエージェントの普及が労働市場、教育システム、社会構造に与える長期的影響の研究が重要になります。
ポジティブな影響の最大化とネガティブな影響の最小化のための政策研究も必要です。
これらの発展により、AIエージェント技術がより公平で有益な社会実装を達成し、人間の能力拡張と生活の質向上に真に貢献できる未来への道筋が明確になるでしょう。