AIエージェント、ルールと安全性開示に縛られずに増殖

AIエージェントはより一般的になり、より高い能力を持つようになっていますが、それらがどのように動作すべきかについてのコンセンサスや標準がないと、学術研究者たちは指摘しています。

MITのコンピュータ科学・人工知能研究所(CSAIL)もそう述べています。CSAILは2025年AIエージェント指数のために30のAIエージェントを分析しました。これはソフトウェアサービスへのアクセスを通じてオンラインで行動を実行できる機械学習モデルを評価するものです。

AIエージェントはツール搭載チャットアプリケーション(Manus AI、ChatGPT Agent、Claude Code)、ブラウザベースのエージェント(Perplexity Comet、ChatGPT Atlas、ByteDance Agent TARS)、またはエンタープライズワークフローエージェント(Microsoft Copilot Studio、ServiceNow Agent)の形態をとることがあります。

AIエージェント指数に付随する論文は、AIエージェントへの関心と投資の増加にもかかわらず、「それらの実世界の開発と展開の重要な側面が不透明なままであり、研究者やポリシーメーカーに公開されている情報はほとんどない」と述べています。

オープンソースエージェントプラットフォームOpenClawとそれに付随するエージェント相互作用ネットワークMoltbookをめぐるAIコミュニティの関心、ならびにオープンソースプロジェクトへのAI生成コード提出に対する継続的な不満は、行動ルールなしでエージェントを野放しにすることの結果を浮き彫りにしています。

論文の中で、著者たちはAIエージェントがロボット除外プロトコルを無視する傾向について指摘しています。ロボット除外プロトコルはrobots.txtファイルを使用してウェブサイトのスクレイピングに対する同意がないことを示します。これは、確立されたウェブプロトコルがもはやエージェントを制止するのに十分ではないかもしれないことを示唆しています。

これはタイムリーなテーマです。AIエージェントの主要プロバイダーの1つであるAnthropicは水曜日に、独自のAIエージェント自律性の分析を発表しました。これはエージェント使用の結果よりも、エージェントがどのように使用されるかに焦点を当てています。

「AIエージェントはすでに存在し、メール分類からサイバー諜報活動まで、その結果が大きく異なるさまざまなコンテキストに展開されています」と同社は述べています。「このスペクトラムを理解することはAIを安全に展開するために重要ですが、実際に人々がエージェントをどのように使用しているかについては、驚くほど少ししか知りません。」

コンサルティング企業マッキンゼーによれば、AIエージェントは2030年までに米国経済に2.9兆ドルを追加する可能性があります。ただし、OpenAIおよび他のテック企業による膨大な資本支出が相場の過熱を招いていないと仮定した場合です。企業がまだ見ていないほとんどAI投資のリターンを得ていることに注意が必要です。そして研究者たちは昨年、AIエージェントはマルチステップの事務作業の約3分の1しか完了できないことを発見しました。しかし、それ以来、AIモデルは改善されています。

MIT CSAILの2025年AIエージェント指数は30のAIエージェントをカバーしています。これは2024年の前身版より規模が小さく、2024年版は67のエージェントシステムを扱いました。著者たちは、2025年版はより深掘りしていると述べています。法律、技術的能力、自律性と制御、エコシステムの相互作用、評価、安全性という6つのカテゴリーを横断してエージェントを分析しています。AIエージェント指数のサイトではリスト化されたすべてのエージェントについてこの情報を提供しており、それぞれが45個の注釈フィールドを持ちます。

研究者たちによれば、調査対象の30のエージェントのうち24は2024~2025年の期間に公開されたか、大きな機能更新を受け取りました。しかし、エージェント開発者たちは安全性慣行よりも製品機能についてさらに多く語っています。

「最先端レベルの自律性を示す13のエージェントのうち、わずか4つだけがいかなるエージェント安全性評価も開示しています(ChatGPT Agent、OpenAI Codex、Claude Code、Gemini 2.5 Computer Use)」と研究者たちは述べています。

カバー対象となった30のエージェントのうち25の開発者は安全性テストの詳細を提供しておらず、23は第三者テストデータを提供していません。

状況をさらに複雑にするために、ほとんどのエージェントはわずかな基盤モデルに依存しています。大多数はAnthropicおよびGoogle、OpenAIによって作成されたモデルのハーネスまたはラッパーであり、スカッフォールディングとオーケストレーションレイヤーでサポートされています。

その結果は、単一のエンティティが責任を負っていないため評価が困難な一連の依存関係であるとMITの研究者たちは指摘しています。

デラウェア州に設立された企業は、著者たちが評価したエージェントのうち13を開発しました。5つは中国に設立された組織から、4つは米国以外かつ中国以外の出身です。具体的にはドイツ(SAP、n8n)、ノルウェー(Opera)、ケイマン諸島(Manus)からです。

5つの中国設立エージェント開発企業のうち、1つは公開された安全フレームワークを持ち、1つはコンプライアンス標準を持っています。

中国以外を出身地とするエージェントについては、15がAnthropicの責任あるスケーリング政策、OpenAIの準備フレームワーク、またはMicrosoftの責任あるAI標準などの安全フレームワークを指しています。他の10は安全フレームワークのドキュメンテーションを欠いています。エンタープライズ保証標準はより一般的で、30のエージェントのうち5つだけが文書化されたコンプライアンス標準を持っていません。

評価対象の23のエージェントはクローズドソースです。7つのエージェント開発者がエージェントフレームワークまたはハーネスをオープンソース化しました。Alibaba MobileAgent、Browser Use、ByteDance Agent TARS、Google Gemini CLI、n8n Agents、OpenAI Codex、およびWRITERです。

総合的に、インデックスはエージェント開発企業が安全情報をあまりにも少なく開示しており、わずかな企業が市場を支配していることを明らかにしました。その他の主要な調査結果には、依存関係の層を持つエージェントを分析することの困難さ、およびエージェントがすべてのウェブサイトで必ずしも歓迎されていないことが含まれます。

論文は次の著者を列記しています。Leon Staufer(ケンブリッジ大学)、Kevin Feng(ワシントン大学)、Kevin Wei(ハーバード・ロースクール)、Luke Bailey(スタンフォード大学)、Yawen Duan(Concordia AI)、Mick Yang(ペンシルベニア大学)、A. Pinar Ozisik(MIT)、Stephen Casper(MIT)、Noam Kolt(ヘブライ大学)。®

翻訳元: https://go.theregister.com/feed/www.theregister.com/2026/02/20/ai_agents_abound_unbound_by/

ソース: go.theregister.com