AI音声技術は今や非常に進化しており、現実の声とディープフェイクの声を区別することはほぼ確実にできなくなっています -…

長年、多くの人々はAI生成の音声はどこか「偽物っぽい」特徴があり、必ず見分けられると思っていました。

しかし、ロンドン大学クイーン・メアリー校による新しい研究はこの思い込みに異議を唱え、現在のAI音声技術が「音声クローン」やディープフェイクを本物の録音とほとんど区別できないレベルに達していることを示しました。

この研究では、参加者が人間の声と2種類の合成音声（実際の話者を模倣したクローン音声と、特定の対応者がいないLLMシステムによる音声）を比較しました。

リアリズムを超えて支配力へ

リスナーは両者を区別するのにしばしば苦労し、この技術が「人間らしいリアリズム」がもはや目標ではなく、現実となった段階に入ったことを示唆しています。

研究チームは、参加者が合成音声と実際の声を区別できるかどうかだけでなく、それらをどのように認識したかも調査しました。

驚くべきことに、両方のAI生成音声は人間の声よりも支配的と評価され、場合によってはより信頼できると判断されました。

ロンドン大学クイーン・メアリー校の心理学上級講師であるナディーン・ラヴァン博士は、彼女のチームがこれらの音声クローンをいかに簡単かつ低コストで作成できたかを強調しました。

「AI生成音声は今や私たちの身の回りにあふれています。AI技術が自然で人間らしい音声を生み出すのは時間の問題でした。必要なのは、わずかな専門知識と数分間の音声録音、そしてほとんどお金もかかりませんでした」と彼女は述べています。

彼女は、この使いやすさが短期間で技術がどれほど進歩したかを示していると語りました。

このような手軽さは、教育、コミュニケーション、アクセシビリティといった分野で、オーダーメイドの合成音声が関与やリーチを高める機会を生み出します。

AIライターが独自性や著作権、悪用の問題を提起するのと同様に、AI音声生成もアイデンティティの所有権や同意を巡る議論を呼び起こします。

リアルな音声が短いサンプルから作成できるなら、無断クローンのリスクは無視できなくなります。

AIツールの能力と利用しやすさが拡大し続ける中、恩恵を享受しつつ新たな詐欺の道を開かないようにすることが課題となるでしょう。

人々がこれらの音声にどう反応するかを理解することは、このもはや未来のものではなく、現実となった技術の倫理的・法的・社会的影響に対処するための第一歩に過ぎません。