
Введение
В этом проекте я провела анализ дата-сета, созданного для отслеживания песен, которые попадают в топ-50 песен на музыкальной платформе Spotify, дата-сет ежедневно обновляется. Анализ позволяет узнать, что объединяет самые популярные песни, и какой должна быть песня, чтобы попасть в топ и оставаться в нем длительное время.
Мой выбор данных основан на моей любви к музыке, как популярной, так и менее известным артистам. Анализ данного дата-сета был для меня любопытным исследованием, из которого я узнала, что является фактором успеха для трека. Это буквально дата-сет, в котором собраны все данные для того, чтобы понять, каким ты должен написать свой трек, если хочешь, чтобы он стал вирусным.

Выбор стиля визуализации данных и внешний вид графиков основаны на логотипе Spotify — одной из самых популярных музыкальных платформ, которую автор дата-сета использует для сбора данных.

Обработка данных
Я импортировала дата-сет с kaggle.com, а затем импортировала библиотеки для обработки данных — numpy, pandas, matplotlib.pyplot.
Визуализация
График 1. Топ 10 самых популярных песен в US за 2025 год
Несмотря на то, что Spotify является шведской компанией, чаще всего в рекомендациях попадаются американские исполнители, а также чаще занимают лидирующие позиции в чартах, поэтому в первую очередь мне было интересно узнать, какие артисты популярны в США, есть ли там артисты из других стран. Выборка данных произведена за 2025 год, так как я хотела узнать о текущей ситуации в музыкальных чартах.
График 2. Наличие нецензурной лексики в песнях
В этой диаграмме я задействовала красный цвет для более явного отличия категорий.
Данные, выведенные этой круговой диаграммой, меня удивили, так как я была уверена, что большинство современных артистов в топах, часто прибегают к использованию нецензурной лексики в своих текстах, поэтому я была приятно удивлена этим процентным соотношением.
График 3. Распределение изменения позиций за неделю
Было так же любопытно узнать, что в основном, большинство треков остается на одной и той же позиции в топе в течение целой недели. С учетом того, насколько быстро сменяются тренды в современном мире, данные гистограммы меня удивили.
Гистограмма в градиентных оттенках показалась мне интересным решением для отображения количества треков.
График 4. Зависимость популярности от длительности песни
Диаграмма рассеяния показалась мне интересным решением для того, чтобы показать большой массив данных за один раз. Основное скопление точек указывает на то, что в средняя продолжительность трека, который попадет в топ, 3,5 минуты.
Я решила также привести график, отражающий менее обширную выборку данных. Для удобства, я взяла лишь 5% от всего дата-сета, чтобы проверить данные еще раз и убедиться в том, что расчет средней продолжительности для популярного трека верен.
График 5. Изменение популярности топ-3 песен в 2025 году
Также мне показалось интересным узнать, какие три песни были самыми популярными в начале 2025 года. Любопытно было сравнить, насколько мои музыкальные предпочтения совпали с другими слушателями, какие треки были выбраны людьми для того, чтобы вступить в новый год и задать себе настроение и энергию.
Список источников
Top Spotify Songs in 73 Countries (Daily Updated) by ASANICZKA