- Spotify APIは、楽曲の人気要因をモデル化して理解するために、数十種類のオーディオ変数とコンテキスト変数(エネルギー、感情価、持続時間、ダンス性など)を提供しています。
- 統計分析によると、人気のある曲とそうでない曲では、ほぼすべての音声特性に違いが見られる一方、ジャンル、音色、タイトルの感情表現は予測力が低いことが分かった。
- ロジスティック回帰、KNN、SVM、ナイーブベイズ、ランダムフォレストなどの機械学習モデルは、あるトピックが上位15%の人気トピックに入るかどうかを分類する際に、約84~85%の精度を達成します。
- 楽曲の長さ、エネルギー、音量、そして楽器編成は、Spotifyでの人気を左右する重要な要素として際立っており、編集によるプレイリストやレコメンデーションアルゴリズムが重要な役割を果たすエコシステムにおいて、その人気を支えている。

Spotifyは、ヒット曲を生み出す要因を研究するのに最適な実験場となっている。リアルタイム再生データ、アーティスト向けの高度な指標、そして毎秒意思決定を行う何百万ものリスナーがいます。Spotifyは単なるリスニングプラットフォームではなく、巨大な データベース そこでは、パターン、感情、ジャンル、プレイリスト戦略などを分析することで、なぜある曲はヒットし、他の曲は忘れ去られてしまうのかを理解することができる。
近年、ツール、学術研究、そして 機械学習モデル 専用の Spotifyヒット分析「Today's Top Hits」や「Rap Caviar」といった編集チャートの分析から、楽曲がカタログの中で最も人気のあるグループに属するかどうかを予測できるアルゴリズムの構築まで、Spotifyは様々な取り組みを行っています。同時に、Spotify for Artistsはこれらの指標へのアクセスを民主化し、どのアーティストも誰が自分の楽曲を聴いているのか、どこでどのように発見されているのかを把握し、それに応じてクリエイティブ戦略やマーケティング戦略を調整できるようにしました。
Spotifyのヒット分析とは具体的に何なのか、そしてなぜそれが重要なのか?
私たちが話すとき Spotifyヒット分析 単に曲の再生回数を見るだけではありません。オーディオ、コンテキスト、ユーザーの行動を組み合わせた、より包括的なアプローチで、リリース前に曲の成功を予測できるのかという、厄介ながらも重要な問いに答えようとしています。SpotifyのAPIから得られるデータを用いて、研究者たちは人気度、エネルギー、感情価、長さ、テンポ、ダンス性といった変数を分析し、その答えに近づこうとしています。
このアプローチは、いわゆる 「ヒット曲の科学」2000年代初頭にマイク・マクレディによって広められたこのアイデアは、アルゴリズムと数理モデルを用いて、どの曲がチャートやラジオでヒットするかを予測するというものです。初期の研究では、これは非常に困難であり(モデルの精度も十分ではない)、という結論が出ていましたが、ストリーミングの登場、データ量の爆発的な増加、そして機械学習技術の洗練によって、状況は一変しました。
現在、Spotifyは数万曲にアクセスできるAPIを提供しています。 音楽的および文脈的特性キーやモードから、楽曲がアコースティックかインストゥルメンタルかの確率、さらには楽曲の印象(エネルギー、感情価、ダンス性など)を具体的に表す指標まで、あらゆる要素を網羅しています。これらすべてによって、主観的な意見から、より精度の高い定量的な分析へと移行することが可能になります。
並行して、ツール アーティストのためのSpotify これは、クリエイターが表面的な指標に惑わされることなく、本当に重要なこと、つまり長期的なオーディエンスの育成、エンゲージメント、維持、そしてマーケティング活動が真のファンを生み出す上でどのような影響を与えるかに集中できるように支援します。言い換えれば、数字も重要ですが、文脈と戦略的な意図が伴うということです。
公式プレイリストと戦略:編集リストの重み
Spotifyのヒット曲を真剣に分析する上で最も重要な要素の1つは、 公式編集プレイリストDiscover Weekly、Release Radar、Today's Top Hits、New Music Friday、Rap Caviar、Mint、¡Viva Latino!といったチャートは、巨大な増幅器のような役割を果たします。これらのチャートに掲載されることで、楽曲の方向性やキャリアそのものが大きく変わる可能性があります。
Soundchartsのようなサードパーティツールを使用すると、 アーティストがこれらのプレイリストでどのように振る舞うか掲載回数、掲載期間、最も影響力のある市場など。このような分析によって、編集記事リストへの掲載は単なる飾りではなく、プラットフォームにおける成長戦略の重要な要素であることが明らかになります。
質の高いプレイリストを作成する際には、いくつかの共通する基準があります。例えば、 同じ名前を何度も繰り返すのではなく、多様なアーティスト同じアーティストが何度も登場するリストは、リスナーの発見感を損なうため、評価が低くなる傾向がある。
また、 一貫性のあるジェンダーバランスプレイリストが明確な方向性もなく多くのスタイルを混ぜ合わせると、 experiencia 情報が断片化され、評価が下がってしまう。最も評価の高いリストは、明確に定義された1つまたは少数のジャンルに焦点を当てている傾向があり、ユーザーは再生ボタンを押したときに何が期待できるかを一目で理解できる。
もう一つの重要な側面は、 よく知られたテーマと新しいテーマの組み合わせ大ヒット曲だけを集めたプレイリストも悪くはないが、新しい音楽との出会いという点ではあまり魅力的ではない。一方、既に確立された名曲とあまり知られていない隠れた名曲を組み合わせたプレイリストは、より多くのリスナーの関心を集め、新たなヒット曲を生み出す可能性を秘めている。
最後に、良いプレイリストには少なくとも 約50曲で充実した体験を提供収録曲数が10曲未満のチャートは、しばしば質が低いとみなされ、低い評価を受ける。これは、収録されている楽曲のパフォーマンスにも影響を与える。
Spotifyの簡単な歴史と、その分析機能の起源
Spotifyが高度なヒット曲分析を実行できるようになるには、まずプラットフォーム自体が音楽業界における自らの立ち位置を確立する必要があった。共同創設者のダニエル・エクが考案したこのアイデアは、2002年のNapsterの崩壊後に生まれたものだ。 彼は「海賊版よりも優れていて、かつ業界にも利益をもたらす」サービスを作りたかったのだ。当時、エクは主要なP2Pダウンロード・共有クライアントの一つであるuTorrentを運営していたため、非公式な配布の世界について直接的な知識を持っていた。
2006年末にuTorrentをBitTorrentに売却した後、EkはSpotifyの開発に専念した。このアプリケーションは、2008年にスウェーデンで正式にリリースされた。 大手音楽会社とのライセンス契約および株式参加契約ソニー・ミュージックエンタテインメント、ユニバーサル・ミュージック・グループ、ワーナー・ミュージック・グループ。1年後にはイギリスに進出し、2011年にはアメリカに上陸した。
その初期段階では、有料会員数はヨーロッパで約1万人から、約 2012年には世界中で4万人2016年までに、Spotifyはすでに40万人の有料ユーザーと約100億人の総ユーザー数を発表しており、ストリーミングが世界中で最も支配的な音楽消費形態としての地位を確立していた。
同時に、アーティスト向けのデータツールが登場し始めた。最初に登場したのは ファンの洞察このソリューションでは、一部のチームのみがストリーミングデータ(人口統計、地域、基本的な傾向など)にアクセスできるという限定的な機能が提供されていました。2017年、このソリューションはSpotify for Artistsへと進化し、すべてのアーティストが主要な指標を確認し、そのデータに基づいてツアー、リリース、プロモーションに関する意思決定を行えるようになりました。
2018年、同社は株式公開を行い、時価総額は約 30.000万円それ以来、同社が事業を展開する市場の数は増え続け、それに伴い、プラットフォームにおける分析の重要性も高まっている。ライセンス制のメディアプレーヤーとして始まった同社は、データが最優先されるグローバルなインフラへと成長した。
Spotifyの指標:ストリーミング再生回数以外で楽曲を測定する方法
ヒット予測モデルを構築するには、まずどのようなタイプの Spotify APIによって提供されるデータ例えば、インド市場に焦点を当てたある調査では、Spotifyが作成したプレイリストから4万6000曲以上の楽曲が抽出され、幅広いジャンルとサブジャンルを網羅していた。
情報はいくつかのセクションに整理されています。トラックレベルでは、次のようなデータがあります。 識別子、タイトル、アーティスト、人気度、リリース日、再生時間(ミリ秒単位)アルバムレベルでは、IDと名前が保存されます。プレイリストレベルでは、名前、ID、ジャンル、および関連するサブジャンルが表示されます。
しかし、ヒット分析にとって最も興味深いのは オーディオ機能音楽は、「ムード」特性(ダンス性、エネルギー、感情価、テンポ)、物理的特性(音量、話し言葉らしさ、楽器らしさ)、文脈(音響性、生々しさ)、音楽的要素(調、モード)といった異なるカテゴリーに分類されます。これらの変数はそれぞれ、綿密に定義され、正規化されています。
例えば、ダンスのしやすさは、0から1の間の値で表され、 歌に合わせて踊るのはどれくらい簡単ですか?リズム、テンポの安定性、ビートの強さといった要素に基づいて、エネルギーも0から1の範囲で表され、楽曲が激しく、速く、力強いサウンドなのか、それとも穏やかで柔らかなサウンドなのかを捉えようとするものです。
バレンシアは 知覚された感情的な「ポジティブさ」 音声においては、低い値は悲しい、緊張した、または陰鬱な感情に対応し、高い値は陽気な、明るい、または高揚感のある音楽に合致します。アコースティック性はトラックがアコースティックである可能性を測定し、ライブ性は録音に生の聴衆が存在するかどうかを示し、スピーチ性はミックスにおける話し言葉の割合を反映します(たとえば、ポッドキャストや話し言葉のトラックでは非常に高くなります)。
その他の重要なパラメータは BPMでのテンポ合計再生時間、キー(整数でエンコード)、モード(長調または短調)、そして楽曲の人気度。人気度はSpotify独自の指標で、0から100までの範囲で表されます。 それは、河川の水量と、河川がどれくらい最近に発生したかの両方に依存します。かつては大ヒットした曲でも、今ではほとんど聴かなくなった曲は、時間の経過とともに評価が下がっていくでしょう。
ヒットを予測できるようにデータセットを準備およびクリーニングする方法
Spotifyのヒット曲分析について議論する際にしばしば見落とされがちなステップは、 データセットの準備本研究では、RとRStudioを使用してデータを収集し、市場(インド)、ジャンル、サブジャンルのさまざまな組み合わせについてSpotify APIを呼び出しました。これらの組み合わせは、グローバルおよびローカルな重要度に基づいて選択されました。
さまざまなテーマのプレイリストから曲を組み合わせる場合、同じ曲が異なるリストに登場する可能性があるため、多くのトラックが重複することがよくあります。目的はプレイリスト戦略自体を分析することではなく、曲の特徴を分析することだったので、 重複トラックを削除しましたこれにより、合計46.417曲から約39.147曲の固有曲に減少しました。
アーティスト、アルバムIDと名前、プレイリスト固有のフィールドなど、モデルの説明変数として使用されない列は削除されました。同時に、 彼らはフィールド名を標準化した また、データ型も調整されました。例えば、人気度、モード、キー、期間などは、統計処理を容易にするために浮動小数点型の数値に変換されました。
重要な決定事項は、人気度をより扱いやすい変数に変換することでした。0から100までの連続値を扱う代わりに、 人気曲と不人気曲を区別するための閾値分布の上位85パーセンタイル(人気度約65)を基準として、その値を超えるトラックを「人気」、それ以外を「人気がない」とみなした。
このようにして、データセットは分割されました。 約6.000曲の人気曲と約33.000曲のあまり人気のない曲探索的分析では、データを人気度に応じて5つのクラス(非常に高い、高い、中程度、低い、非常に低い)に20ポイント間隔で分割し、成功度レベル間の細かい傾向を比較できるようにした。
さらに、曲のタイトルから新しい変数が生成されました。 感情指標PythonのTextBlobライブラリを使用して、各タイトルの極性(-1から1までの数値)を計算し、肯定的、否定的、中立的のいずれかに分類しました。この数値はデータフレームに追加され、タイトルのトーンがその人気度と関連しているかどうかを調査するために使用されました。
データ探索:最も人気のある曲を特徴づけるものは何か
機械学習モデルをトレーニングする前に、 データの視覚的および統計的分析本研究では、分布曲線、人気度グループごとの平均値、および感情と成功の関係性を分析した。
注目すべき発見の一つは、最も成功した楽曲の人気度に関するものです。人気度評価が90を超える楽曲を見ると、 バレンシアでは、0,5を下回る値を示すものが多かった。言い換えれば、彼らの歌声は陽気というよりは、悲しげで、陰鬱で、憂鬱な響きを持っていた。それが絶対的に優勢というわけではなかったが、明確な傾向だった。
性別ごとの人気分布をプロットすると、ほとんどの曲線は おおよそベル型平均的な評価の曲が多く、極端な評価の曲は少ない。しかし、ロック、R&B、EDM、ワールドミュージック、インド音楽などのジャンルでは、人気度ゼロの曲が多数存在するため、やや非対称性が見られた。対照的に、ポップ、ラップ、ラテン、デジなどのスタイルは、よりバランスが取れており、評価ゼロの曲の集中度も低かった。
これは、より主流のジャンルでは一般的に、 一定の人気レベルに達しやすいたとえ楽曲がすべての理想的な特徴を備えていなくても、他のジャンルでは成功の分布がより二極化している。
人気度クラス別にさまざまな特徴の平均値を比較すると、非常に明確なパターンが浮かび上がりました。最も成功しているトピックは、 より大きなエネルギーとより大きな音量(知覚される音量)さらに、楽器演奏の比重が増し、語りの比重が減る傾向にある。簡単に言えば、ストリーミング配信で好成績を収める楽曲は、より力強く、語りの言葉よりも音楽に重点が置かれていることが多い。
また、人気曲には 音響特性とライブ感の低下言い換えれば、それらは「アコースティック」な響きや「ライブ感」が薄れている。スタジオ録音のような、より洗練されたサウンドで、周囲の雑音やコンサートの雰囲気が失われている。
もう一つの重要な発見は、人気のある歌は 人気のないものよりも短い収益がストリーミング再生回数に依存し、アルゴリズムが繰り返し再生を優遇する状況においては、短い楽曲の方が再生回数をより早く獲得でき、プレイリストにとってより「好ましい」ものとなるのは理にかなっている。
知覚された幸福度(価値)に関しては、興味深い傾向が見られます。人気の低いクラスから「高い」クラスにかけてレベルは上昇しますが、最も極端なカテゴリーである「非常に高い」クラスでは、顕著な低下が見られます。言い換えれば、 超人気曲は、単に「成功した」曲よりも悲しく聞こえる傾向がある。これは、大衆の嗜好や社会感情的な文脈について、多くの解釈の可能性を開くものである。
統計分析:ジャンルと音声属性の影響
データの調査が完了したら、次のステップは適用することだった 正式な統計的検定 人気を説明する上で、どの変数が関連性があると考えられるかを調べるため、性別が成功に影響を与えるかどうかを調べるために、9つの主要ジャンルを用いて分散分析(ANOVA)を行った。
ANOVAの結果は非常に高いF値と実質的にゼロの有意性を示しました。これはつまり、 ジャンルによって人気度に統計的に有意な差があるしかし、それだけでは十分ではありません。これらの違いがどの性別間で発生するのか、またその変数が予測モデルに役立つかどうかを知ることも重要です。
分散が均一ではなく、ジャンルごとの楽曲数も異なっていたため、以下の方法が用いられた。 ゲームズ・ハウエル事後検定この分析により、どの性別の組み合わせが人気度に大きな差を示さなかったかを検証することが可能になり、全体として、機械学習モデルにおいて性別を強力な予測因子として使用することはあまり推奨されないことがわかった。
並行して、以下のことが実施された。 独立t検定 各オーディオ特性について、人気曲グループと非人気曲グループの間で平均値を比較した。有意水準95%で、ほぼすべての変数(ダンス性、エネルギー、音量、音響性、ライブ感、持続時間、テンポ、感情価、楽器性)において、両グループ間に有意差が認められた。
唯一の明らかな例外は 言語障害最初のテストでは、平均値の差は有意ではなかったが、詳細な分析の結果、非常に人気のあるトピックの言語性範囲(0,024~0,685)が、人気のないトピックの言語性範囲(0~0,964)の範囲内に収まっていることが明らかになった。この重複は、言語性を効果的に使用すればモデルに情報を提供できることを妨げるものではなかったため、予測因子として保持することに決定した。
要約すると、オーディオ機能ブロックは、 人気に関する明確な記述力一方、性別はより慎重に扱われ、一部の予測手法では主要な変数として除外された。
ヒットを予測する機械学習モデルの構築
クリーンなデータセットと関連する変数を選択したので、 二値分類モデル 楽曲が人気上位15%に入るかどうかを予測できる。これを行うために、まずカテゴリ変数であるkeyとmodeを、Pandasのget_dummies関数を使用してダミー変数に変換した。
これらのダミー変数を組み込んだ後、キーとモード、および継続的な人気度に関する元の列は削除され、目的変数のみが保持された。 人気度バイナリフィールド (人気かそうでないか)。モデルをトレーニングする前に、すべての数値特徴量はStandardScalerを使用して標準化されました。これは、数値特徴量が非常に異なるスケールで動作するため、同等の重みを持つことが重要だったからです。
データセットはtrain_test_split関数を使用してトレーニングとテストに分割され、 試験登録者の20%このようにして、情報漏洩が回避され、性能指標がモデルの実際の汎化能力を反映し、単に訓練データを記憶する能力だけを反映していないことが保証された。
最初に適用されたモデルは ロジスティック回帰この手法は二値分類で広く用いられています。学習率0,01、反復回数200回の反復バージョンを実装し、交差検証を用いて評価しました。平均精度は約84,7%に達し、音楽的成功の予測という複雑な問題としては、非常に優れた結果となりました。
次にアルゴリズムのテストが行われた。 K最近傍法(KNN)これは、特徴空間におけるk個の最近傍に基づいて各楽曲を分類します。グリッドサーチを使用してkyの値を調整し、最適な構成を見つけたところ、ロジスティック回帰と比較して交差検証スコアがわずかに向上し、精度は約84,8%と非常に類似していました。
次のモデルは サポートベクターマシン(SVM)線形関係と非線形関係の両方に対応できる別の教師あり学習手法も用いられた。ここでも、ハイパーパラメータのフィッティングにより、約84,6%の精度が達成され、交差検証でも同等の値が得られ、安定した性能が示された。
以下の項目も評価されました。 単純ベイズ分類器特徴間の独立性という仮説に基づいています。仮定の面でははるかに単純なモデルであるにもかかわらず、その精度結果(約84,6%)はSVMと同等であり、ロジスティック回帰やKNNにも非常に近いものでした。これは、問題構造がこの種の確率的アプローチに適しているという考えを裏付けるものです。
最後に、決定木に基づいたモデルを検証した。 デシジョンツリー分類子 精度は著しく低下し、約75,4%にとどまりました。交差検証によってもこの性能低下が確認され、これはおそらく過学習の問題によるものと考えられます。 ランダムフォレスト分類子これらの影響を緩和するために多数のツリーを組み合わせた手法は大幅に改善され、精度は約84,1%、交差検証では84%以上を達成しました。
分析を完了するには、 混同行列と分類レポート ランダムフォレストの場合、このモデルは、人気のない曲(多数派クラス)を識別する能力に優れており、精度は0,85、再現率は0,99に近い値を示しました。一方、人気のある曲(少数派クラス)での性能はやや低く、精度は0,40、再現率は0,05でした。これは、この種の問題におけるクラス不均衡という古典的な課題を浮き彫りにしています。
変数の重要性:ヒット曲を生み出す際に最も重要な要素は何か
どのモデルがより正確かを知ることに加えて、理解することが重要です。 実際に役立つ情報を提供する機能はどれか 楽曲の人気を予測する際に、XGBoost(XGBClassifier)を用いて、決定木における各特徴量の誤差削減への貢献度に基づいて変数重要度スコアを算出しました。
結果は、 その曲の長さは明らかに他とは異なっていた。Fスコアは400を大きく上回った。この結果は、短いトラックは繰り返し聴くことを促し、結果として短時間でより多くの再生回数を獲得するという考え方と一致する。これはSpotifyのレコメンデーションアルゴリズムが好む傾向にある点である。
その反対の極端な例として、キー、モード、または タイトルから得た感覚 それらの重要度スコアは50未満であり、モデル全体の予測力への貢献度が小さいことを示唆している。これは、それらが全く効果がないという意味ではなく、他の特徴量と比較して、その重みがはるかに小さいということである。
残りのオーディオ属性(エネルギー、ダンス性、価数、音量、音響性、ライブ感、スピーチ性、楽器性など)は、Fスコアが200~300の中間範囲にあり、 彼らはかなりバランスの取れた情報ブロックを形成している。どれも絶対的に支配的な要素ではないが、すべてを合わせると、楽曲の成功の可能性をかなり正確に把握するのに役立つ。
総合的に見て、音声特徴に基づくモデルは、約 ヒントが最も人気のある15%に含まれる場合、成功率は84~85%となる。これは、「ヒット曲の科学」という古くからの直感に、ある程度の経験的な裏付けを与えるものである。つまり、適切なデータと適切な手法を用いれば、音楽の成功は完全に偶然によるものではなく、予測不可能な要素が依然として大きく残るということだ。
この分析によって明らかになったのは、Spotifyのデータ、従来の統計、そして機械学習モデルを組み合わせることで、単にストリーム数を数えるだけにとどまらない、はるかに深い洞察が得られるということです。楽曲の長さ、エネルギー、感情価、そして音楽性といった要素の影響に加え、編集プレイリストの役割やプラットフォームのレコメンデーションの仕組みを理解することで、アーティスト、レーベル、アナリストは、なぜ特定の楽曲がヒットするのか、そして、人間的で創造的な要素を完全に失うことなく、いかにしてその選ばれたグループに加わる可能性を最大限に高めることができるのかを、非常に具体的なロードマップとして活用できます。幸いなことに、これらの要素はどんな公式にも還元できないものです。