Checksumは、デプロイ済みアプリケーションに対して毎夜自動実行し、エンジニアがダッシュボードを開いたりプロンプトを入力したりするのを待たずに、壊れたテストを自動的に修復する自律システム「Continuous Quality Agent」を発表しました。

AIコーディングはソフトウェア開発における制約を変えました。チームは以前よりもはるかに多くのコードをリリースできるようになりましたが、すべてのPRは本番環境に到達する前に、依然としてテスト、検証、そして信頼性の確認が必要です。AIによって書かれたテストでさえ、セレクターの更新、失敗のトリアージ、実際のバグと壊れたテストの切り分けといった人間によるメンテナンスが必要です。スプリントを重ねるごとにギャップは広がり、それを埋めるにはテストを自動生成し、プロダクトの変化に合わせて修復するエージェントが必要です。
「業界はコード生成の問題を解決しました。しかし品質の問題はまだ解決されていません」と、Checksumの CEO であるGal Veredは述べています。「AIを使ってコードを書いているチームは、より多くをリリースしている一方で、より少ししか検出できていません。Continuous Quality Agentにより、テスト失敗の70%はエンジニアが手を触れることなく解決されます。それがコパイロットとしてのAIと、インフラとしてのAIの違いです。」
このエージェントは150万件以上のテスト実行でファインチューニングされており、品質ループ全体をカバーします。カバレッジのギャップを検出し、特定のフローに対するテストを生成し、ライブアプリケーションに対してテストを実行し、壊れたテストを自律的に修復します。すべてのテストは標準的なPlaywrightコードであり、プルリクエストとしてチーム自身のリポジトリに直接コミットされます。独自フォーマットなし、ベンダーロックインなしです。
このエージェントは、開発者がすでに作業している場所に合わせて機能します:
- Webアプリからは、すべてのセッション、すべての失敗分類、そして実際のプロダクトバグと壊れたテストを切り分けるライブの機能健全性ダッシュボードへの完全な可視性が得られます。
- IDEからは、Claude Code、Cursor、その他のエディタ上の /checksum スラッシュコマンドを使って、エディタを離れることなくエージェントをトリガー、制御、レビューできます。
「オフショア開発者の給与コストの半分以下で、フルQAチームに匹敵する効果が得られています」と、CounterpartのエンジニアリングマネージャーであるRon Ron Alexssenは述べています。「Checksumがやっていることを自分たちで代替しようとすれば、少なくとも6〜10人のフルチームが必要になるでしょう。全社ミーティングで本番障害ゼロを報告できるとき、まるでヒーローになった気分です。」
翻訳元: https://www.helpnetsecurity.com/2026/05/28/checksum-continuous-quality-agent/