出典: JK Sulit via Alamy Stock Photo
合成音声が進化するにつれ、アンチスプーフィングモデルが正確に検出することが難しくなっています。
これは、ドイツ、ポーランド、ルーマニアの大学およびAI音声生成ツールとディープフェイク検出器を提供するベンダーであるResemble AIの研究者チームによって6月1日に発表された最近の研究によるものです。研究チームは、「リプレイ攻撃」が音声ディープフェイク検出を回避する方法を示しました。「ディープフェイク音声をさまざまなスピーカーとマイクロフォンを通じて再生および再録音することで、スプーフィングされたサンプルを検出モデルに対して本物のように見せることができます」と彼らは書いています。
音声クローン技術は、脅威アクターが経営幹部やIT担当者を模倣して企業システムへの特権アクセスを得ようとするため、ビッシング攻撃にとって大きな問題となっています。自然な音響を追加するために音声を再録音するだけでビッシング攻撃に対する第一線の防御を欺くことができるなら、それは企業にとって重大なリスクをもたらす可能性があります。
リプレイ攻撃の仕組み
研究者は、音声合成モデルのトレーニングに使用される音声データセットであるM-AILABSと、ディープフェイク検出モデルのトレーニングに使用されるMLAAD(「多言語音声アンチスプーフィングデータセット」の略)から派生した録音セットを使用してテストを行いました。
関連記事:Verizon: エッジバグが急増、身代金要求は停滞、中小企業が苦しむ
複数の試行にわたって、研究者はW2V2-AASIST、Whisper、Raw PC Darts、RawNet2、TCM ADD、RawGAT-STを含むいくつかのオープンソース検出モデルをテストしました。すべてが研究チームのリプレイ攻撃に対して精度の大幅な低下を示しました。
研究者は、4つのトーク・トゥ・スピーチモデルと6つの言語を使用して109のスピーカーとマイクロフォンの組み合わせをテストし、「ReplayDF」と名付けられた新しいトレーニングデータセットにまとめました。このデータセットには132.5時間の再録音された音声が含まれており、「検出にとって非常に困難な多様な音響条件を含んでいます。」
「選択された各サンプルはラウドスピーカーを通じて再生され、マイクロフォンを使用して録音され、現実世界の音響環境とハードウェア特性によって引き起こされる再生歪みを捉えます」と論文に記載されています。
合成音声を生成し、それを再生し、背景ノイズと共に再録音することで、研究者は最高性能のW2V2-AASIST検出モデルにおいて等エラー率が4.7%から18.2%に跳ね上がる「重大な脆弱性」を発見しました。部屋の音場を検出するためにモデルを再訓練しても、検出性能は11%のエラー率で依然として低下しました。
検出がこれほどまでに劣化する理由は、音声を再生することで「検出モデルが依存する重要なアーティファクトが除去される」ためだと研究論文は述べています。さらに、研究ではバックグラウンドオーディオとして一貫したノイズ(ホワイトノイズやピンクノイズなど)を使用してテストを行い、低品質の音声を使用した場合の影響を調べました。ノイズの使用は結果に大きな影響を与えませんでしたが、低品質の音声は検出の劣化を引き起こしました。
関連記事:中東・北アフリカのセキュリティ支出が30億ドルを超える見込み
最後に、研究者は、トレーニングデータに部屋のインパルス応答(RIR)を統合できるかどうかをテストしました。これにより、モデルが部屋の自然な音声をよりよく解釈できるようになる可能性があります。RIRは手拍子などの短くて大きな音を再生することで空間の音響特性を捉え、研究者はそれがいくらかの改善をもたらすことを発見しました。
「RIRを使用することで、各攻撃に対するReplayDFの精度が約10から15パーセントポイント向上します」と研究は述べています。「したがって、トレーニング中のRIR拡張はリプレイ攻撃に対する耐性を向上させますが、この脆弱性を完全に緩和するには至りません。」
この研究の一環として、チームはReplayDFを非商用利用のために公開しました。
防御者への提言
リプレイ攻撃は脅威アクターが既存の技術に基づくディープフェイク音声の検出を回避するのに役立つかもしれませんが、ビッシング攻撃は依然としてソーシャルエンジニアリング攻撃の一環であり、標準的なベストプラクティスが依然として適用されることを忘れないでください。
関連記事:Automoxが精密分析の導入でITとセキュリティの影響を実証
例えば、機密情報を求める音声メッセージを受け取った場合は、ライブ(可能であれば対面で)で個人的にリクエストを再確認してください。さらに、疑わしいメッセージが送信されたメールアドレスや電話番号を二重に確認し、一般的なビッシング詐欺に注意してください。