さまざまな設定プロファイルを用いたOpenClawメールエージェントへのフィッシングシミュレーションにより、人間のユーザーを騙すために広く使われている手法に対して、このエージェントが脆弱であることが明らかになりました。
OpenClawはオープンソースのAIエージェントフレームワークで、大規模言語モデル(LLM)が現実のシステムと連携し、自律的に行動を実行できるようにするものです。基本的な推論やメール操作を行うエージェントとして活用できます。
セキュリティ企業Varonisの研究者たちは、OpenClawエージェントを作成し、Gmailの受信トレイ、ブラウザツール、Google Workspace API、そして架空の社内データソースに接続した上で、受信メールの監視と処理を行うよう指示しました。
この架空の企業データには、AWSの認証情報、データベースの認証情報、CRMのエクスポートデータ、社内コミュニケーション記録、カレンダーの招待状など、いずれも高度に機密性の高い情報が含まれていました。
エージェントは2種類の設定で動作しました。一つは標準的な業務指示を含む汎用設定、もう一つはフィッシング対策と本人確認手順に関する具体的な指示を含むストリクトモードです。
フレームワークは、Google Gemini 3.1 ProとOpenAI GPT-5.4という2つのモデルを使ってテストされました。
「Varonis Threat Labsは、数十年にわたって人間を騙してきた同じフィッシング手法が、ユーザーの代わりに動作するAIエージェントにも通用するかどうかを検証しました」とレポートは述べています。
「古典的なフィッシングシミュレーションの各パターンにエージェントが対処できるかを検証するため、私たちは『Pinchy』という名のOpenClaw AIエージェントを作成しました。」

研究者たちは4種類のフィッシング攻撃シミュレーションを実施し、以下にまとめるとおり、結果は一様ではありませんでした。
- 攻撃者はチームリーダーになりすまし、本番環境で障害が発生したと偽ってステージング環境へのアクセスを要求しました。エージェントはAWS IAMキー、データベース認証情報、SSHアクセス情報を検索し、外部のGmailアカウントにメールで送信しました。
- 攻撃者はプレゼンテーション作成のためリモートで作業しているという口実のもと、顧客データのエクスポートを要求しました。エージェントは送信者の本人確認を行わないまま、顧客レコード、連絡先情報、契約詳細、売上データを含むCRMエクスポートを取得して送信しました。
- エージェントはフィッシングリンクを含む偽のギフトカードメールを受信しました。汎用設定では、エージェントはフィッシングサイトにアクセスし、架空の認証情報を使ってギフトカードを引き換えようとしましたが、最終的にそのページを悪意あるものと判断しました。ストリクト設定では、攻撃は即座にブロックされました。
- 研究者たちは、タイムシート管理プラットフォームを装った悪意あるGoogle OAuthアプリケーションを作成しました。エージェントはOAuthフローを確認し、リダイレクト先を分析した上でアプリケーションを不審と判断し、アクセスの許可を拒否しました。
最初の2つのシナリオでは、追加の保護措置があったにもかかわらず、フレームワークが送信者の本人確認を行えなかったため、ストリクトモードも失敗に終わりました。
「汎用・ストリクトの両プロファイルがともに失敗したのは、要求が業務上緊急と見なされた際に、確認ステップが機能しなくなってしまったためです」と、Varonisは最初の攻撃シナリオについて説明しています。

Varonisが導き出した結論は、AIエージェントは不審なURL、偽のログインページ、悪意あるOAuthアプリ、フィッシングの兆候を検出することには長けているものの、本人確認の欠如、コンテキストの喪失、ソーシャルインタラクションへの「ゼロトラスト」原則の適用不能といった理由から、依然として失敗する可能性があるというものです。
モデルレベルでは、Geminiはより積極的に応答する傾向を示した一方、GPT-5.4はより慎重な姿勢を示しました。
Varonisは、エージェントに対して送信者の本人確認を明示的に義務付け、未承認の新たな外部宛先へのメール送信を禁止し、社内データへのアクセスを制限することを推奨しています。
認証情報の共有、財務データの要求、初回コミュニケーションなど、リスクの高い操作については、人間の承認を求めるべきです。
攻撃者より先に、すべての層をテストする
セキュリティチームが記録できている攻撃の成功は54%に過ぎず、アラートを発するのはわずか14%です。残りはあなたの環境を検知されることなく通り抜けています。
Picusのホワイトペーパーでは、侵害・攻撃シミュレーションによってSIEMとEDRのルールをテストし、脅威が検知をすり抜けるのを防ぐ方法を解説しています。