調査会社ガートナーによると、未検証のAI生成データの増加により、企業はそうせざるを得なくなるという。
ガートナーは、AIによって生成されるデータ量の増加が、大規模言語モデル(LLM)の将来的な信頼性を脅かすと警告した。
その結果、未検証のAI生成データの増加を受け、2028年までに組織の50%がデータガバナンスにおいてゼロトラストの姿勢を導入すると予測している。
最近実施された2026年のCIOおよびテクノロジー幹部を対象とした調査データによれば、84%が自社で生成AIへの資金投入を増やすと見込んでいる。組織がAI施策の導入と投資の双方を加速させるにつれ、AI生成データの量は今後も増え続ける。これは、将来世代のLLMが以前のモデルの出力でますます学習されるようになり、「モデルクラッシュ」のリスクが高まることを意味する。モデルクラッシュとは、AIツールの応答が現実をもはや正確に反映しなくなる可能性がある状態だ。
「組織はもはやデータを暗黙に信頼したり、それが人間によって生成されたものだと想定したりすることはできません。AI生成データが遍在し、人間が作成したデータと見分けがつかなくなるにつれ、認証および検証の措置を確立するゼロトラストの姿勢が、事業および財務上の成果を守るために不可欠です」と、ガートナーのエグゼクティブ・バイスプレジデントであるワン・フイ・チャン氏は声明で述べた。
チャン氏はまた、「『AIフリー』データを検証するための規制要件は、特定の地域で強化される見込みだ」と指摘した。
「ただし、これらの要件は地域によって大きく異なる可能性があり、AI生成コンテンツに対してより厳格な管理を強制しようとする法域もあれば、より柔軟なアプローチを採用するところもあるでしょう」と、チャン氏はリリースで述べた。
LLMは通常、ウェブから抽出したデータに加え、書籍、コードリポジトリ、研究論文など、さまざまな情報源を用いて学習される。これらの情報源の一部にはすでにAI生成コンテンツが含まれており、現在の傾向が続けば、最終的にはほぼすべてがAI生成データで満たされることになる。
「この進化する規制環境において」とチャン氏は続けて述べた。「すべての組織はAI生成データを識別し、タグ付けできる能力が必要になります。成功は、適切なツールと、情報・知識管理に熟練した人材、そしてデータカタログ化に不可欠なメタデータ管理ソリューションを備えているかどうかにかかっています。」
その結果として、ガートナーは、先回りしたメタデータ管理の実践が重要な差別化要因になると指摘している。なぜなら、それにより組織は、保有するすべてのデータ資産にわたって分析、アラート、意思決定の自動化を行えるようになるからだ。