音楽業界にとって驚きの展開として、Anna’s Archiveとして知られる海賊版活動家グループが、Spotifyから膨大な情報のコピーに成功したと発表した。同グループは自らを保存活動家のチームと称し、2億5600万曲分の詳細を収集し、約8600万の音声ファイルを確保したと主張している。
周知のとおり、Spotifyは世界有数のストリーミングプラットフォームだ。しかし同グループは、私たちの文化史を安全に保つ役割を1社に依存するのは危険だと主張する。Anna’s Archiveは、多くの保存活動が有名アーティストや、保存しにくいほど容量の大きい高品質ファイルに偏りがちだと指摘し、自分たちのアーカイブは2025年時点の音楽の「スナップショット」になるとしている。
データが取得された方法
これは、パスワードやクレジットカード情報を盗むような従来型の「ハッキング」ではなく、大規模なデータスクレイピングだった点に注意したい。同グループはSpotify自身のシステムを利用して、メタデータ(アーティスト名やアルバム名など、楽曲に付随するデジタルラベル)を収集し、さらにデジタルロックを回避して音声を取得する方法を見つけたという。
同グループは成果を「spotify_clean.sqlite3」と呼ばれる専用ファイルに整理した。これは、プラットフォーム上のあらゆるアーティスト、アルバム、楽曲のつながりをマッピングする、高度に整理されたデジタル書類棚のようなものだ。
さらに同グループは、Spotifyの内部システムに存在する形のままデータを保持し、細部が失われないよう「ロスレス」コピーであることに注意を払ったと主張している。この構造化されたセットアップにより、適切なスキルを持つ人であれば、ゼロから検索可能な音楽ライブラリを再構築できるという。
「私たちはSpotify(メタデータと音楽ファイル)をバックアップしました。人気度ごとにグループ化し、バルクトレント(約300TB)として配布しています。このリリースには、2億5600万トラックと1億8600万のユニークISRCを含む、公開されている中で最大の音楽メタデータデータベースが含まれます。」と同グループはブログ投稿に記した。
人気度フィルター
Anna’s Archiveチームは非常に戦略的で、無作為にすべての曲をかき集めたわけではない。Spotify独自の「人気度指標」を使い、何を優先して保存するかを決めたという:
人気ヒット曲:約8600万曲が元の品質のまま保存された。これはアプリで実際に聴かれているものの99.6%をカバーする。
再生ゼロのトラック:誰も聴いていない曲については、容量節約のため音質を下げた。専門家なら違いが分かるかもしれないが、ほとんどの人には同じに聞こえると説明している。
Spotifyの公式見解
通常は書籍のデジタルコピー保存に注力しているという同グループは、今回のプロジェクトは世界の音楽が時の流れの中で失われないようにするための「ささやかな試み」だと主張している。一方Spotifyは明確に異議を唱え、迅速に反応した。企業の広報担当者は次の声明を発表した:
「Spotifyは、違法なスクレイピングに関与した悪質なユーザーアカウントを特定し、無効化しました。新たな安全対策を実装し…クリエイターを守るため、業界パートナーと積極的に連携しています。」
メタデータは2025年12月21日時点ですでにオンライン上にある一方、実際の音楽ファイルは総量が約300テラバイトと非常に大きいため、段階的に公開が進められている。
専門家の見解:あなたのアカウントは安全か?
「無料のSpotify」という発想は魅力的に聞こえるかもしれないが、専門家は現実的な危険があると警告している。Acumen Cyberのプリンシパル・コンサルタントであるNathan Webb氏はHackread.comに対し、「トレント」(P2P共有)でこれらのファイルをダウンロードしようとする人はリスクを負うことになると述べた。というのも、「本当に正当なものをダウンロードしているという検証がほとんどない」ため、ファイルにウイルスを容易に紛れ込ませられるからだ。
「現実には、音楽を海賊版で入手する人は常にその手段を持っていました。だからこそ、このデータの配布開始にP2Pトレントが選ばれたのです。このダンプは、すでにそれを実現できるスキルを持つ人にとって、音楽ファイルをより入手しやすくするだけでしょう。」とCyberは述べた。
また同氏は、「トレントを利用する人は、それがリスクを伴うことを理解すべきです。実際に正当なものをダウンロードしているという検証がほとんどないためです。実際にはもっと悪質な目的があるにもかかわらず、これらのファイルを再配布していると主張する人が増える可能性もあります」と警告した。
翻訳元: https://hackread.com/annas-archive-pirate-spotify-songs-data-scrape/

