ハクティビスト集団、Spotifyの音楽ライブラリをスクレイピング――8600万ファイルを含む

著名なデジタル保存プラットフォームであるAnna’s Archiveは、これまでに記録された中で最大規模となる、Spotifyの音楽データの無許可抽出を行ったと発表した。

このハクティビスト集団は、ストリーミングサービスから約8600万曲をスクレイピングし、プラットフォーム上の全ユーザーの聴取活動の約99.6%に相当するとしている。

総量約300TB弱のこのコレクションには、Spotifyの約2億5600万トラックの推定99.9%に関するメタデータが含まれる。

これは、書籍や学術論文の保存に重点を置いてきたAnna’s Archiveの従来の焦点を大きく超える拡張であり、人類の文化的知識を守るという同グループのより広範な使命を示している。

Anna’s Archiveによれば、既存の音楽保存の取り組みには重大な制約がある。多くの取り組みは人気アーティストに過度に集中し、知名度の低い音楽家の膨大なカタログを見落としている。

さらに、多くのアーカイブはロスレス形式を用いて最高音質を優先するため、保存に必要なストレージが劇的に増大し、網羅的な保存が制限されてしまう。

「これまでに制作されたすべての音楽を代表することを目的とした権威あるアーカイブは存在しない」と、同グループは発表の中で説明した。

Spotifyは一部の希少な録音を欠いているものの、真に包括的な音楽保存データベースを構築するための理想的な出発点になったという。

今回のスクレイピングでは、Spotifyの「人気度」指標を用いて、どのトラックをアーカイブするかの優先順位を付けた。人気度が高いファイルは、元のOGG Vorbis形式のまま、160kbit/sの品質で保存された。

人気度が低いトラックについては、ほとんどのリスナーにとって許容できる音質を維持しつつ、ストレージ需要を抑えるため、OGG Opusの75kbit/sへ再エンコードした。

抽出されたメタデータはトレントファイルを通じて配布されており、音楽ファイルは人気度ランキングに基づいて段階的に公開されている。

データには、アーティスト情報、アルバム詳細、ジャンル分類、そしてSpotifyのアルゴリズムが生成した音声解析機能が含まれる。

この事件は、大規模な音楽ストリーミングプラットフォームにおける根強いセキュリティ脆弱性を浮き彫りにし、データ保護基準に関する疑問を提起している。

Anna’s Archiveはこの取り組みを文化保存として位置づけているが、音楽の権利者やSpotifyは、この作戦を大規模な違法著作権侵害とみなす可能性が高い。

このハクティビスト集団は、アーカイブされたコンテンツの長期保存を確実にするため、トレントのシーディングと寄付によるコミュニティ支援を呼びかけている。

同グループは、プラットフォームの閉鎖、ライセンス紛争、技術的陳腐化による喪失から文化遺産を守ることで、音楽保存は公共の利益に資すると主張している。

このアプローチが正当な保存に当たるのか、それとも大規模な海賊行為なのかは、デジタル権利および保存コミュニティにおいて依然として論争の的となっている。

翻訳元: https://cyberpress.org/hacktivist-group-scrapes-spotify-music-library-containing-86-million-files/

ソース: cyberpress.org