4年前、司法省はコンピュータ不正・濫用防止法(Computer Fraud and Abuse Act)の下での「善意」のセキュリティ研究について、独立系および第三者のセキュリティ研究者に対して刑事訴追を求めないと発表した。
現在、著名なバグバウンティ・プラットフォームが、AIシステムの欠陥を研究する研究者に同様の保護を提供するための業界向けフレームワークの構築を試みている。対象にはAIセーフティなど、セキュリティ上の結果に影響し得る意図しない挙動や出力を検証する分野も含まれる。
HackerOneの最高法務・政策責任者であるイロナ・コーエン氏はCyberScoopに対し、「善意のAI研究セーフハーバー」は、DOJの方針変更や同社独自の「ゴールドスタンダード・セーフハーバー」フレームワークといった従来の取り組みを土台に、第三者のセキュリティ研究者が商用製品やシステムの欠陥を突いて検証するためのより広い法的自由を提供し、その枠組みをAI領域へ拡張することを目的としていると述べた。
HackerOneは以前、善意の研究者に関する方針がAIシステムにどのように適用されるのかについて、さらなる指針を示すようDOJに働きかけていた。コーエン氏は、同省の文言は「多くの明確さを提供し、セキュリティ研究者が、私たちのセキュリティ産業の基盤にとって非常に重要なテストを実施できるという安心感を得る助けになったが、必ずしもすべてのAI研究に当てはまるわけではない」と語った。
2022年のDOJの方針変更は、サイバーセキュリティ・コミュニティによる長年の提言活動の末に勝ち取られた、苦闘の成果だった。DOJから追加の指針が示されない中で、善意のハッカーが独立研究者はより広いサイバーセキュリティ・エコシステムにとって資産であると同庁を納得させたのと同様に、AIテストについても提言とガバナンスに関する基礎的な取り組みを業界が行うことが重要だと、コーエン氏は述べた。
参加企業は、保護措置の採用を告知する「バナー」をHackerOneのプロフィールに付けることができる。これは、とりわけ「法的措置を控える……」ことや、「許可された研究に関連して第三者が請求を行った場合に研究者を支援する」ことなどを約束するものだ。
トランプ政権がAIシステムをめぐる安全性やセキュリティの問題にほとんど関心がないことを示唆している一方で、他の政策立案者は、強固な保護とガードレールは、中国のような権威主義的な競合国よりも米国製のAIシステムやモデルを採用するよう他国を説得する際の主要な差別化要因の一つであるべきだと述べている。コーエン氏は、AIシステムが社会全体で広く採用される局面では、オープンなテストがとりわけ重要だと語った。
「AIシステムは、ガバナンスや法的枠組みが追いつけないほど本質的にずっと速いペースで展開されているため、AIシステムのテストをためらう人がいると……私たち全員にとって一定のリスクが生じます」とコーエン氏は述べた。
OpenAIやAnthropicのようなフロンティアAI企業は、一般に自社のセキュリティ研究プログラムをより厳格に管理してきた。
例えばOpenAIは、第三者のレッドチーム研究者からなる独自のネットワークを運営しており、申請プロセスを通じて審査・選定している。同社ウェブサイトによれば、レッドチームのエンゲージメントはOpenAIが委託し、同社の裁量で別の研究者に振り分けられる場合がある。参加時間は年5〜10時間程度のメンバーもいる。研究者は、AIの安全性や悪用といった問題に焦点を当てる別プログラムの下でも申請できる。
Anthropicの責任ある開示ポリシーは、「善意」の第三者セキュリティ研究を、報告対象となる脆弱性を特定すること「のみを目的」として情報システムをテストすることだと定義している。そのため研究者は、「そのような潜在的脆弱性が存在することを合理的に証明するために最小限必要な」行為にとどめ、データの持ち出しや削除などの実害を伴う行為は避けることが求められる。
また、同社からの「通知」がない限り、研究者は発見した脆弱性の存在や詳細について「第三者または一般に開示することを避ける」ことも求めている。
「私たちは、研究者が発見した脆弱性を公に開示する権利を全面的に支持します」と規約には記されている。「私たちが求めるのは、当社のサービス、顧客、その他の関係者への潜在的な害を防ぐため、開示のタイミングについて調整することだけです。」
Anthropicの規約はまた、同社製品の使用または統合に関連するあらゆる否定的結果について、同社を広範に免責しようとしている。全大文字で強調しつつ、「正確性、可用性、信頼性、セキュリティ、プライバシー、互換性、非侵害」などの領域において同社製品が有し得る適合性に関する一切の保証を「明示的に否認する」としている。
OpenAIとAnthropicは、掲載時点までにコメント要請に応じなかった。
翻訳元: https://cyberscoop.com/hackerone-industry-framework-good-faith-ai-research/