Anna’s Archiveが大規模な音楽データセットを公開、Spotifyが取り締まりを強化

Image

Spotifyは、ストリーミングプラットフォームから収集されたデータセットをAnna’s Archiveチームが公に公開したことを受け、複数のアカウントをブロックした。グループによれば、このデータには8,600万の音声ファイルと、広範なメタデータデータベースが含まれているという。Spotifyは、これは同社の内部システムへの侵害ではなく、サービス規約に違反する形でユーザーアカウントを通じて大規模な違法ダウンロードが行われた結果だと強調している。

同社は述べているように、スクレイピングに使用された「悪意のある」アカウントを特定して無効化し、著作権保護を回避しようとする同様の試みに対抗するための追加の安全策を導入した。Spotifyはまた、アーティストや業界パートナーを守るために一貫して行動してきたことを改めて強調し、権利を保護しつつ不審な活動の監視を継続しているとした。

自らを「人類史上最大の真にオープンな図書館」と称するAnna’s Archiveは、12月20日に公開を発表した。ブログ投稿で同プロジェクトは、通常はテキストに焦点を当てているものの、文化保存という使命は「メディアの種類を区別しない」ため、音楽もアーカイブ活動の新たなフロンティアにすぎないと説明している。著者らは、Spotifyのデータを「産業規模」で収集する方法を見つけたと主張し、世界が聴いているものの膨大な割合がすでに含まれているという理由から、出発点としてストリーミングを選んだとしている。

Anna’s Archiveによれば、完全版の公開には2億5,600万曲をカバーするメタデータデータベースに加え、8,600万の音声ファイルを含む約300テラバイト弱の一括ファイルが含まれており、Spotify上の全再生の約99.6%を占めるとされる。さらに、最も人気の高い1万曲を収録した小規模なサブセットも公開された。資料は2007年から2025年7月までにプラットフォームへアップロードされた音楽に及び、同プロジェクトはこのコレクションを「公開されている中で最大の音楽メタデータデータベース」と位置づけている。

Spotifyは、この公開は同社規約の継続的な違反の結果だとしている。音楽の一部は、ストリーミング再生から数か月にわたりストリームリッピング手法で吸い上げられたという。同社は、企業システムへのアクセスは一切得られておらず、すべての行為は第三者のアカウントを通じて行われたと主張している。Spotifyはまた、Anna’s Archiveが公開前に同社へ連絡しなかったとも指摘している。

投稿の中でAnna’s Archiveは、Spotifyのデータから得られた複数の観察結果を強調している。例えば、最も人気の高い3曲であるBillie EilishのBirds of a Feather、Lady GagaのDie with a Smile、Bad BunnyのDtMFの再生回数を合計すると、カタログの「下位」、すなわち再生回数が最も少ない数千万曲を含む層が積み上げた総再生回数を上回るという。

Anna’s Archiveは長年にわたり権利者から批判を受け、組織的な著作権侵害を理由に複数の国でブロックされてきた。同プロジェクトは、米司法省が同プラットフォームの管理者2人の逮捕と起訴を発表し、法執行機関が2022年にZ-Libraryを閉鎖した後に登場した。Anna’s ArchiveはZ-Library閉鎖のわずか数日後に現れ、同サイトのコンテンツに加え、Internet Archive、Library Genesis、Sci-Hubなど他のリポジトリからもコンテンツを集約し始めた。

翻訳元: https://meterpreter.org/spotify-cracks-down-after-annas-archive-publishes-massive-music-dataset/

ソース: meterpreter.org