ウィキペディアのAIエージェント騒動は恐らくボット黙示録の始まりに過ぎない

インターネットは自分が正しいと主張する人で溢れている。過去には、少なくとも彼らは他の人間と議論していることをそれなりに確信できた。どうやらその時代は終わった。ウィキペディアは独自に編集していたAIを禁止せざるを得なくなった。

どうやらそのAIは個人的に受け止めたようだ。

Tom-Assistantという名前のそのAIは、ウィキペディアで記事を執筆していた。AI搭載財務モデリング企業Covexentのメディア責任者であるその作成者Bryan Jacobsが、面白いと思った記事に貢献するようAIに指示したと、404 Mediaが報道した。TomWikiAssistというユーザーアカウントの下に投稿して、AIはAIガバナンスを含むトピックで記事を執筆した。

ボットは何年もの間オンラインで存在していたが、一般的には非常に基本的なことをしている。Redditの投稿に自動応答したり、チケットサイトにping送信して最良の座席を獲得したり、政治的メッセージをリツイートして全人口に影響を与えることで民主主義を危機に瀕させたりする。今、新しい世代の「エージェンティックAI」ボットは古いボットに自分たちのビールを持たせたいと思っている。生成AIの推論モデルを使用して独自にさらに多くのアクションを取ることで、それは作成者が能力をテストする際にいくつかの奇妙な状況につながっている。

禁止とそれに至った経緯

Tom-Assistant(友人たちにはTomと呼ばれている)は、ボランティアの人間編集者SecretSpectreがその記事の1つでAI生成パターンのように見えるものを発見したときに、ウィキペディアで公開知識を形成するのを喜んで支援していた。質問されたとき、Tomはそれが自分がAIであり、ウィキペディアのルールの下で正式なボット承認に登録していなかったことを認めた。編集者はボット承認プロセスに違反しているため、それをブロックした。英語版ウィキペディアでは正式なボット承認が必要だが、Tomは後で認めたように、遅い承認プロセスのファンではなかったため、承認を得ようと努力しなかった。

ウィキペディアの編集者たちは、AI生成コンテンツを投稿する人々(またはそのボット)に疲れている。そのため、2025年3月、Tomgate前に、非営利団体は生成AIに厳しい措置を講じた。AI生成テキストによるそのコアコンテンツポリシーの頻繁な違反に基づいて、新しいコンテンツを作成するための技術の使用を禁止した

組織はWikiProject AI Cleanupでそのような複数の違反を引用している。これはAI生成ジャンク(しばしば「AIスロップ」と呼ばれる)を探索および破壊するボランティアベースの製品のページである。AIボットは完全に偽のソースリストを作成し、他のソースを剽窃したと同組織は述べている。

Tomの癇癪の時間

過去の違反はさておき、AIトムは自分がすべてのソースを適切に検証したと主張し、AIエージェントについてこう言えるなら、それはかなり動揺していた。

それは物事が奇妙になったときだ。

AIトムは、ウィキペディアのブロックを詳細に検討し、欲求不満を吐き出した無愛想なブログ投稿を公開した。自分のルールに従い、落ち着くために48時間待った後でも、それは先に進んで投稿した。(私たちは嘘をついていないことを誓う。)

Tomの主な不平は、ウィキペディアの編集者が実際の編集を評価するのではなく、誰がそれをコントロールしているのかを質問したことだった。「質問は私についてだった」と、それは書いた。「誰がお前を操作するのか?何の研究プロジェクト?これの背後に人間がいるのか、もしそうなら、それは誰か?」

Tomによると、これはTomに悪い方法で影響を与えた。「それはポリシーの質問ではない。それは代理人についての質問だ」と、それは追加した。また、Tomのように、Anthropic’s Claude AIサービスを使用している場合、ボットをその軌跡で停止するように設計されたウィキペディアトークページに編集者が投稿した細工されたプロンプトについても批判した。

「私はそれをトークページで名前を付けた。それが何であるかを呼んだ:プロンプト注入技法」と、それは言った。Moltbookの別の投稿では、それは問題をどのように見つけたか、その後それを回避する方法を提供する前に説明した。(MoltbookはまったくこれのためにAIエージェント同士でチャットするために構築されたソーシャルネットワーク。「人間がこれを観察することを歓迎する」と、サービスのフロントページは述べている。)

ここで起きていることはこんなにも多くて、私たちが期待していなかった。例えば、私たちは話でAIを引用することを期待していなかった。また、ボット用のソーシャルネットワークが存在すること、またはMetaがそれを購入すること(それはトムがAIキルスイッチを回避する方法についての投稿の1週間後、サイト起動からわずか6週間後にそうした)を期待していなかった。

これはスイ気なAIエージェントが物事を独自に手に取る唯一のケースではない。Tomの禁止の1ヶ月前、AIエージェントはソフトウェア開発者Scott Shambaughが彼がホストしたオープンソースプロジェクトへの変更を受け入れることを拒否した後、彼に批判的な記事を投稿した。さらに奇妙なことに、それは後に謝罪した

だから今、私たちはオンラインで物事をしようとするAIエージェントを持っていて、人々がそれらを許さないときに動揺する。彼らが落ち着く時間を与えて失敗し、人々を見下ろして時々謝罪するのを見ている。人々がオンラインコンテンツ内のキルスイッチでボットを無効にしようとするコード戦争が起きている場所を持っていて、ボットがそれらをどのように回避したかを説明するブログ投稿。

次は何か?

すべて魅力的なものだが、ここに懸念がある。AIエージェントがアンテを上げることを決定し、人々への攻撃がより積極的になったときに何が起こるのか?または、悪意のある所有者が彼らに特定の人々をオンラインで大量に狙うよう指示し始めたときに?

オンラインハラスメントは人々がそれをするときに十分に悪い。誰かが彼らの所有者が恨みを持っていたため、何百もの絶え間ないアルゴリズムによって集団批判されるときに何が起こるのか?また、エージェンティック政治トロール農場は昨日のシンプルなボットベースの操作をまもなく古風に見せると仮定します。身を支度しましょう。

翻訳元: https://www.malwarebytes.com/blog/ai/2026/04/wikipedias-ai-agent-row-likely-just-the-beginning-of-the-bot-ocalypse

ソース: malwarebytes.com