GitHubはCopilotの利用者に対する約束を取り返しのつかない形で変更することを決定しました。4月24日から始まり、このシステムはAIの対話、コード片、および運用コンテキストを徴収して、独自のモデルを構築します。これらの新しい規則はCopilot Free、Pro、Pro+のユーザーを対象としますが、BusinessおよびEnterpriseの企業版、学生や教育者は完全にこの方針から免除されます。
このデータの流出から逃れることは可能ですが、手動の介入を通じてのみ可能です。このつながりを切断するため、GitHubはユーザーに/settings/copilot/featuresに移動し、プライバシーセクション内で「GitHubが私のデータをAIモデルのトレーニングに使用することを許可する」という設定を無効にするよう指示しています。このやり方はアメリカの市場の典型的な特徴です。企業はデフォルトでデータ収集を要求し、ユーザーが自発的に拒否する負担を負わせます。
企業の記録の中で、GitHubのプロダクトディレクターであるマリオ・ロドリゲスは、この方針を正当化し、デジタルアーキテクトの運用リズムを深く理解したいという強い願いとして説明しました。最終的な野心は、正確で堅牢なコードテンプレートを提供しながら、潜在的な異常をそれが本番環境に落ちる前に事前に捕捉することです。ロドリゲスによれば、Microsoft内で展開された同様の戦略はすでに目に見える成果をもたらし、人員とAIの相乗効果を活用して、生成されたアドバイスの採用率を急速に高めています。
GitHubは広範なテレメトリーデータを収集する予定です。モデルの出力結果(受け入れられたか、詳細に調整されたか)、クエリの入力、サービスに提供される特定のコード片、カーソル位置を含む周囲のコンテキスト、注釈と全体的なドキュメンテーション、ファイル名、リポジトリの複雑なアーキテクチャ、Copilot機能内で実行されるアクション(会話交換を含む)、およびユーザーが提供されたソリューションに関して与えるフィードバック。
質問と回答のまとめの中で、企業はAnthropicやJetBrains、Microsoft自体も同様の方針を採用していることを明確に強調しています。この業界標準の意図的な引用は、より広い市場が長い間、自動的な同意に基づくパラダイムへと移行しており、後から拒否する特権が伴うことを明らかにしようとする計算されたものです。
この変化の最も厄介な側面はプライベートリポジトリに関するものです。GitHubのアーカイブドキュメンテーションでは、そのようなリポジトリは侵すことのできない聖域として描かれ、所有者、明示的に指定されたコラボレーター、および指定された組織メンバーのみがアクセスできます。しかし、この新しい方針には重大な注意書きが含まれています。ユーザーが彼らの個人データでモデルの教育に同意する場合、プライベートリポジトリから抽出されたコード片は体系的に収集され、ユーザーがそのプロジェクト内でCopilotを使用している間、トレーニングに使用される可能性があります。GitHubはリポジトリの可視性に関する説明の中でこれらの詳細を説明しています。
コミュニティから聞こえてくる支配的な感情は、肯定的というより、明らかに怒りに満ちているように見えます。GitHubの公開討論の中で、ユーザーはたった3つの肯定的な反応に対して59の非難的な反応を示しました。さらに、39のメッセージの中で、この取り組みに対して明確な支持を示した唯一の声はGitHubの開発者関係副社長であるMartin Woodwardでした。
このような深い懐疑論は容易に理解できます。デジタル領域の住人たちは、他人の独自のコードを使用して人工知能をトレーニングすることの倫理的境界線についての激しい論争を長い間行ってきており、Copilotの歴史はこの論争に燃料を注ぐだけです。OpenAIは以前、CodexはCopilotの基礎となるGPT言語モデルであり、GitHubに含まれる公開アクセス可能なコードを使用して厳密に改良されていることを絶対に明確に述べていました。MicrosoftはCopilotをCodexの使用に明確に結びつけています。この緊迫した背景に対して、GitHubの最新の動きは、突然の大きな方向転換ではなく、すでに正常化されたデータ徴収の教義の容赦ない拡張として浮上しています。