悪意のある文書はいくつでLLMを汚染できる?思ったよりはるかに少ないとAnthropicが警告


  • たった250個の改ざんファイルで高度なAIモデルが即座に崩壊する、とAnthropicが警告
  • ごく少量の汚染データでも、数十億パラメータのAIシステムを不安定化させる可能性あり
  • 単純なトリガーフレーズで大規模モデルが無意味なナンセンスを出力することが可能

こちらもおすすめ

翻訳元: https://www.techradar.com/pro/how-many-malicious-docs-does-it-take-to-poison-an-llm-far-fewer-than-you-might-think-anthropic-warns

ソース: techradar.com