AIスタートアップがGitHubで機密認証情報を漏洩、モデルや学習データが露出

専門家によると、これらの漏洩は急成長するAI企業がイノベーションを基本的なDevSecOpsの衛生管理よりも優先していることを浮き彫りにしており、貴重な知的財産やデータが危険にさらされていることを示している。

クラウドセキュリティ企業Wizの新たな調査によると、世界のトップ民間AI企業のほぼ3分の2がGitHub上でAPIキーやアクセストークンを露出させており、急速な成長がセキュリティ規律を上回っている懸念が高まっている。

Wizは、Forbes AI 50企業の65%で認証済みの秘密情報の漏洩を発見しており、これらの企業の総評価額は4,000億ドルを超える。

問題の深刻さにもかかわらず、Wizによる開示試行のほぼ半数は、影響を受けた企業に届かなかったか、返答がなかったことから、セキュリティ報告への対応準備が不十分であることが示唆されている。

漏洩した情報には、プライベートなAIモデル、学習データ、組織内部の詳細を露出させる可能性のある認証情報が含まれており、市場投入までのスピードがAI分野の安全な開発慣行を上回り続けていることが示されている。

「APIキー、トークン、機密認証情報などが、削除されたフォークやgists、開発者リポジトリの奥深くに埋もれていることが多く、ほとんどのスキャナーはこれらに触れません」とWizはブログで述べている。「これらの漏洩の中には、組織構造や学習データ、さらにはプライベートモデルを露出させる可能性があるものもありました。」

漏洩した認証情報の中には、Hugging Face、Weights & Biases、LangChainといった主要なAIプラットフォームのものも含まれており、これらはプライベートモデルや機密性の高い学習データセットへのアクセスを許す可能性があったとWizは指摘している。

より広範な影響

アナリストによれば、設定ミスによるクラウドストレージの問題は10年以上にわたり繰り返されてきた問題であり、過去のAWS S3の漏洩などの事例が挙げられる。

しかし、パターン自体は馴染み深いものの、露出した資産がAIモデルや学習データ、複雑な開発パイプラインなどに拡大したことで、潜在的な被害は増大している。

「スピードとセキュリティのバランスが、クラウドの設定ミス、不十分な秘密管理、セキュリティやプライバシー設計の欠如、ツールのギャップといった根本的な原因になっているようです」とSunil Varkeyサイバーセキュリティアナリストは述べている。「影響は深刻で、典型的なデータ露出をはるかに超え、AIの漏洩は組織の技術、ビジネス、法務、倫理、戦略的競争力など複数のレベルに一度に影響を及ぼす可能性があります。」

このような大規模な露出は、AIスタートアップとより成熟したSaaSやクラウド企業との間に「明白なDevSecOpsの隔たり」があることを示していると、Chandrasekhar Bilugu氏(SureShield CTO)は述べている。「AIチームはプロトタイプ作成を急ぐあまり、設定ファイルのような秘密情報をパブリックリポジトリに保存しがちで、多くは削除されたフォークやgistsの基本的なスキャンすら行っていません」と彼は述べている。

「企業がGitHub上でAPIキーやトークンを露出させている現状では、現実世界でのリスクは壊滅的です。攻撃者は独自モデルを乗っ取って競争妨害を行ったり、顧客の個人情報を盗んでID窃盗(GDPR違反による数十億ドルの罰金の可能性)を行ったり、サプライチェーンの混乱を引き起こすことができます」とBilugu氏は続けた。「AIでは学習データが貴重な資産であり、たった1つの漏洩トークンで数千のプライベートモデルにアクセスされ、知的財産の窃盗やモデルの汚染が発生する可能性があります。」

この調査結果は、AIの導入が加速する中で、開発者やCISOも同様に開発パイプラインや秘密情報の管理体制を強化する必要があることを示唆している。

コンプライアンスとガバナンス

Wizの調査結果は、露出したAPIキーがAIエコシステム全体の大規模な侵害につながる可能性があることを浮き彫りにしていると、Sakshi Grover氏(IDCアジア太平洋サイバーセキュリティサービス シニアリサーチマネージャー)は述べている。「盗まれた認証情報はモデルの挙動を操作したり、学習データを抜き取ったりするのに利用され、導入済みシステムへの信頼を損ないます。」

Grover氏は、このような露出はAI開発環境の運用方法に起因することが多いと指摘する。「AIプロジェクトは、ノートブックや事前学習済みモデル、リポジトリが頻繁に共有される、ガバナンスが緩く実験主導の環境で運用されることが多く、秘密情報がスキャンされなかったり、ローテーションされなかったりします」とGrover氏は付け加えた。

彼女はIDCのアジア太平洋セキュリティ調査のデータを引用し、APACの企業の50%がCNAPPベンダーを選定する際にAPIセキュリティへの投資を計画していることを示し、露出したAPIが主要な攻撃経路となっていることを反映していると述べた。

規制当局がAIの安全性やデータ保護への注目を強める中、秘密管理やAPIガバナンスは新たなAIコンプライアンスフレームワークの監査対象要素となる可能性が高いとGrover氏は述べている。

翻訳元: https://www.csoonline.com/article/4087983/ai-startups-leak-sensitive-credentials-on-github-exposing-models-and-training-data.html

ソース: csoonline.com