ユニバーシティ・カレッジ・ロンドン(UCL)の研究者らが最近の研究で、人間はディープフェイク音声を27%の割合で検出できないことを明らかにしました。
この研究 では、529人に本物とディープフェイクの音声サンプルを提示し、ディープフェイクを特定するよう求めました。参加者が偽音声を特定できたのは73%にとどまりましたが、ディープフェイク音声の特徴を認識するためのトレーニングを受けた後は、検出精度が平均で3.84%向上しました。
研究者らは、公開されている2つのデータセットで学習させたテキスト読み上げ(TTS)アルゴリズムを用いて、ディープフェイク音声サンプルを生成しました。言語が検出性能や判断の根拠に影響するかを理解するため、英語と中国語(標準中国語)で実施しました。
本研究の筆頭著者であるキンバリー・マイ氏は次のようにコメントしています。「私たちの発見は、人間がディープフェイク音声を確実に検出できないことを確認するものです。人工的なコンテンツを見抜く助けとなるトレーニングを受けているかどうかにかかわらず、です。また、この研究で使用したサンプルは比較的古いアルゴリズムで作成されたものである点にも触れておく価値があります。これは、現在および将来利用可能な最も高度な技術で作成されたディープフェイク音声について、人間がさらに検出しにくくなるのではないかという疑問を提起します。」
この研究は、英語以外の言語における人工生成音声を検出する人間の能力を評価した初の研究です。研究者らは現在、ディープフェイク音声や画像に対する検出能力を構築する取り組みの一環として、より優れた自動音声検出器の開発を計画しています。
ディープフェイクが増大する危険となっている理由
ディープフェイク技術(人工知能と機械学習アルゴリズムによって生成される合成メディア)は、近年ますます現実味を帯びるようになっています。これは音声・動画・画像の改ざん、あるいは個人(多くは著名人)に関する完全な偽コンテンツの作成を含みます。
2019年には、英国拠点のエネルギー企業のCEOが、243,000ドルを詐欺師に送金するようだまされました。同社の最高経営責任者を名乗る人物から電話を受けたためです。実際には、AI音声技術が用いられてドイツ人CEOの声がなりすましに利用されました。これはディープフェイク詐欺として記録された最初の事例でした。
別の事例では、2021年10月、裁判資料により、香港の銀行が巧妙なディープフェイク計画により3,500万ドルをだまし取られたことが明らかになりました。詐欺師らは「ディープボイス」技術を使って買収を控えた企業取締役の声を複製し、3,500万ドル相当の送金を承認するよう銀行に求めました。
2023年7月には、英国の節約術の専門家であるマーティン・ルイスが、投資詐欺を宣伝する彼になりすましたディープフェイク動画に衝撃を受けたと述べました。
ディープフェイクは、詐欺や偽情報の拡散などの悪意ある活動に利用される可能性があるため、規制を求める声が高まっています。例えば、英国のオンライン安全法案には、「ディープフェイク・ポルノ」の共有を犯罪化する規定が含まれています。
翻訳元: https://www.infosecurity-magazine.com/news/humans-detect-deefake-speech/