techradar.com 2025年10月15日 1分で読了

悪意のある文書はいくつでLLMを汚染できる？思ったよりはるかに少ないとAnthropicが警告

たった250個の改ざんファイルで高度なAIモデルが即座に崩壊する、とAnthropicが警告
ごく少量の汚染データでも、数十億パラメータのAIシステムを不安定化させる可能性あり
単純なトリガーフレーズで大規模モデルが無意味なナンセンスを出力することが可能

こちらもおすすめ

AMDがAI推論などに役立つ新製品をひっそりと発表
こちらがおすすめAIサイトビルダーのリストです
また、おすすめAIライターもまとめています

翻訳元: https://www.techradar.com/pro/how-many-malicious-docs-does-it-take-to-poison-an-llm-far-fewer-than-you-might-think-anthropic-warns

関連

ソース: techradar.com

#AIセキュリティ #AIトレーニングデータ #AI大規模言語モデル #AI脆弱性 #Anthropic #データポイズニング #トリガーフレーズ #バックドア攻撃 #モデル崩壊 #機械学習リスク