著名なデジタル保存プラットフォームであるAnna’s Archiveは、これまでに記録された中で最大となる、Spotifyの音楽データの無断抽出が行われたと発表しました。
ハクティビストグループは、ストリーミングサービスから約8,600万曲をスクレイピングし、プラットフォーム上の全ユーザーの視聴活動の約99.6%に相当するとしています。
総量約300TB弱に及ぶこのコレクションには、Spotifyにある約2億5,600万トラックのうち推定99.9%のメタデータが含まれています。
これは、書籍や学術論文の保存に重点を置いてきたAnna’s Archiveの従来の焦点を大きく超えるものであり、人類の文化的知識を守るという同グループのより広範な使命を示しています。
Anna’s Archiveによると、既存の音楽保存の取り組みには重大な制約があります。

多くの取り組みは人気アーティストに大きく偏り、知名度の低いミュージシャンの膨大なカタログを見落としています。
さらに、多くのアーカイブはロスレス形式による最高音質を優先するため、保存に必要なストレージが劇的に増加し、包括的な保存を妨げています。
「これまでに制作されたあらゆる音楽を網羅することを目指す権威あるアーカイブは存在しない」と、同グループは発表の中で説明しました。
Spotifyには一部の希少な録音が欠けているものの、真に包括的な音楽保存データベースを構築するための理想的な出発点になったとしています。
技術的な実行
スクレイピングでは、Spotifyの「人気度」指標を用いてアーカイブ対象トラックの優先順位を付けました。人気度の高いファイルは、元のOGG Vorbis形式のまま160kbit/s品質で保存されました。

人気度の低いトラックについては、OGG Opusの75kbit/sに再エンコードし、ほとんどのリスナーにとって許容できる音質を維持しつつ、ストレージ需要を削減しました。
抽出されたメタデータはトレントファイルを通じて配布されており、音楽ファイルは人気度ランキングに基づいて段階的に公開されています。
データには、アーティスト情報、アルバム詳細、ジャンル分類、そしてSpotifyのアルゴリズムが生成した音声分析機能が含まれます。
この事件は、大規模音楽ストリーミングプラットフォームにおける根強いセキュリティ脆弱性を浮き彫りにし、データ保護基準に関する疑問を提起しています。

Anna’s Archiveはこの取り組みを文化保存として位置付けていますが、音楽の権利者やSpotifyは、この作戦を大規模な違法著作権侵害とみなす可能性が高いでしょう。
ハクティビストグループは、アーカイブされたコンテンツの長期保存を確実にするため、トレントのシーディングや寄付によるコミュニティ支援を呼びかけています。
学術論文や書籍の世界最大のシャドーライブラリを運営していることで知られるAnna’s Archiveは、従来のテキスト中心の資料を超えて、その使命を拡大し続けています。
同グループは、プラットフォームの停止、ライセンス紛争、技術的陳腐化による喪失から文化遺産を守ることで、音楽保存は公共の利益に資すると主張しています。
このアプローチが正当な保存に当たるのか、それとも大規模な海賊行為なのかは、デジタル権利および保存コミュニティにおいて依然として議論の的となっています。
翻訳元: https://gbhackers.com/spotify-music-library-targeted-as-hacktivists-scrape-86-million-files/