ハクティビストがSpotifyの8600万曲をスクレイピング、目的は文化の保存だと主張

もしストリーミングサービスが消滅したら、世界の音楽コレクションはどうなるのだろうか。あるハクティビスト集団は解決策があると言う。Spotifyから約300テラバイトの音楽とメタデータをスクレイピングし、世界初の「完全にオープン」な音楽保存アーカイブだと称して無料で提供するというのだ。

このスクレイピングは、Anna’s Archive(アナズ・アーカイブ)に関係する人々によって実行されたようだ。Anna’s Archiveは、従来は書籍や学術論文といったメディアの保存に注力してきたシャドーライブラリ系サイトで、著作権で保護された作品を直接ホスティングするのではなく、メタデータを集約し、大規模データセットを配布することに重点を置いている。実際のところ、Anna’s Archiveはメタデータ検索エンジンのように機能しており、ユーザーが欲しいコンテンツを見つけられるようにし、法的責任を減らすために、通常はトレント経由で他のソースからのダウンロードへとつなぐ。 

土曜日のブログ投稿で同グループは、「テキスト以外」の分野でSpotifyを大規模にスクレイピングできる機会を逃すわけにはいかなかったと述べ、約8600万の音楽ファイルをアーカイブしたと主張した。これは同プラットフォームでの再生の約99.6%を占めるという。

「しばらく前に、Spotifyを大規模にスクレイピングする方法を発見しました」とAnna’s Archiveは述べた。「ここで私たちが担うべき役割は、主として保存を目的とした音楽アーカイブを構築することだと考えました」

Anna’s ArchiveはSpotifyのスクレイピングを、「音楽のための『保存アーカイブ』を始めるためのささやかな試み」だと説明し、「自然災害、戦争、予算削減、その他の大惨事」による「人類の音楽遺産」の「破壊」から守るためだと正当化した。 

特にAnna’s Archiveのチームは、他の音楽保存の取り組みによくある問題、すなわち「最も人気のあるアーティストへの過度な注目」「可能な限り最高品質への過度な注目」、そして「これまでに制作されたすべての音楽」を代表する権威あるトレントリストの欠如を回避したいと述べた。 

しかし、Anna’s Archiveのブログ投稿を読み進めると、そうした高尚な主張はすぐに崩れてしまう。 

同グループがSpotifyでの再生の約99.6%を占めると主張する、約8600万の音楽ファイルからなる300TBは膨大な音声量ではあるが、プラットフォームの全カタログには遠く及ばない。Anna’s Archiveによれば、Spotifyには合計で約2億5600万曲があるという。つまり、アーカイブされた音声ファイルがカバーするのはカタログの約3分の1にすぎず、残りの曲は音楽ファイルとして保存されているのではなく、メタデータとして表現されているだけだ。

Spotifyのカタログにある音楽の「かす」をすべて扱う手間をかけないことで、Anna’s Archiveのチームは、最も人気のあるアーティストだけに焦点を当てたくないと主張しながらも、人気の低い曲が放置されることを容認しているようだ。 

アーカイブが300TB分の音楽をどのようにトレントファイルに分割するつもりなのか、あるいは1つの巨大ファイルとして公開するつもりなのかは不明だ(チームに連絡したが返答はなかった)。ただしブログでは、「保存を目的としたトレントのみのアーカイブ」として提供するだけであり、「十分なディスク容量がある人なら誰でも簡単にミラーできる」と記されている。 

要するに、アーカイブという目標は、ユーザーが欲しいSpotifyの個別トラックを単にダウンロードできるようにすることとは相容れない。そんなことをすれば、ただの海賊行為にほかならないからだ。 

より広範な保存をめぐるレトリックと同様に、このコレクションを厳密にアーカイブ目的で公開するというAnna’s Archiveの善意の主張は、ブログ投稿の後半で弱められている。

「十分な関心があれば、Anna’s Archiveに個別ファイルのダウンロード機能を追加することもできます」と、ボランティアメンバーの「ez」はブログに書いた。「これを望むかどうか、ぜひ教えてください」 

Anna’s Archiveが残りの曲をスクレイピングするためにSpotifyのサーバーへ戻るつもりだったのなら、Spotifyの広報担当者がThe Register. に述べたコメントによれば、手遅れかもしれない。

「Spotifyは、不正なスクレイピングに関与した悪質なユーザーアカウントを特定し、無効化しました」と同社は私たちに語った。「この種の反著作権攻撃に対する新たな安全対策を実装し、不審な行動を積極的に監視しています」

スクレイパーがどのようにしてSpotifyのデジタル著作権管理(DRM)ソフトウェアを回避できたのかについて、SpotifyもAnna’s Archiveも言及しなかった。

SpotifyはAnna’s Archiveの所谓の保存動機に関する質問には答えなかったが、Spotify自身がアーティストに公正に支払っていないという点で、ある種のIP海賊であるとしても、同社サーバーから数千万件の知的財産が盗まれたことは、動機にかかわらず単なる海賊行為だと見なしていると述べた。

「初日から、私たちは海賊行為に対してアーティストコミュニティと共に立ち、業界パートナーと積極的に協力してクリエイターを保護し、その権利を守っています」とSpotifyは述べた。 

現時点では、Spotifyの約2億5600万曲のほぼすべてをカバーするメタデータがAnna’s Archiveからダウンロード可能だ。音楽ファイル自体はまだ公開されていないが、アーカイブは将来的に、人気順にそれらを公開する計画だと主張している。 ®

翻訳元: https://go.theregister.com/feed/www.theregister.com/2025/12/22/hacktivists_scrape_songs_spotify/

ソース: go.theregister.com