
1. Выбор данных
Как алгоритмы описывают эмоциональное пространство музыки
Для анализа был выбран датасет Spotify Tracks Dataset, размещённый на платформе Kaggle. Датасет представлен в формате CSV и содержит информацию о музыкальных треках, включая: популярность треков; жанры (track_genre); длительность; аудио-характеристики, рассчитанные алгоритмами Spotify (energy, valence, danceability, tempo, loudness, acousticness и др.). Источник данных: Kaggle — Spotify Tracks Dataset.
Актуальность выбранного датасета
Я являюсь активным слушателем музыки и мне достаточно интересно поработать с этой темой. Данный датасет актуален тем, что: - музыка в нём описывается через числовые параметры - эмоциональное и телесное восприятие звука формализуется алгоритмами - можно исследовать, как цифровые платформы классифицируют культурный контент Музыка здесь рассматривается не как субъективный опыт каждого человека, а как алгоритмически измеряемое пространство.
Выбор типов графиков
Для проекта были выбраны разные типы визуализаций: - точечные диаграммы - плотностные графики - тепловые карты - столбчатые диаграммы - пузырьковые диаграммы Это позволяет рассмотреть данные на разных уровнях: от отдельных треков до обобщённых архетипов.
2. Начало работы с данными (PANDAS)

3. Предварительный анализ и очистка данных
4. Аналитическая концепция проекта
В основе проекта лежит идея рассматривать параметры Spotify как координаты эмоционального и телесного пространства музыки. Ключевые оси: - Energy — интенсивность - Valence — эмоциональная окраска - Danceability, Tempo, Loudness — телесность и ритм.
5. Создание архетипов (Новый признак)
Переменная mood была создана в ходе анализа и отсутствовала в исходном датасете.
6. Стилизация визуализации
Визуальный референс: Интерфейсы Spotify, цифровые музыкальные дашборды, неоновые UI.
7. Итоговые графики
График 1 — Эмоциональное пространство музыки Spotify
На графике представлено двумерное эмоциональное пространство, где каждая точка — отдельный трек. Ось energy отражает интенсивность, а ось valence — эмоциональную окраску (от грустной к радостной). Цветовая кодировка показывает музыкальные архетипы. График демонстрирует, что музыка формирует устойчивые эмоциональные зоны, а не хаотичное распределение.
График 2 — Связь танцевальности и энергии
График показывает связь между параметрами danceability и energy. Хотя эти показатели часто воспринимаются как связанные, визуализация демонстрирует, что высокая энергия не всегда означает высокую танцевальность. Это подчёркивает сложность телесного восприятия музыки.
График 3 –– Плотность эмоциональных состояний музыки
Этот график отображает плотность распределения треков в эмоциональном пространстве. В отличие от точечной диаграммы, он показывает не отдельные значения, а зоны концентрации. Это позволяет интерпретировать эмоции в музыке как непрерывное поле, а не дискретные категории.
График 4 –– Громкость и энергия треков
График иллюстрирует связь между громкостью звука и параметром энергии. Несмотря на наличие корреляции, видно, что громкость и энергия не являются тождественными показателями. Это особенно заметно в архетипе «Агрессия», где высокая энергия может сочетаться с разными уровнями громкости.
График 5 –– Жанры и эмоциональные архетипы
Тепловая карта визуализирует количество треков каждого архетипа внутри популярных жанров. Цветовая интенсивность позволяет быстро оценить доминирующие эмоциональные типы. График подчёркивает, что жанр можно рассматривать как эмоциональную конструкцию, а не только музыкальный стиль.
График 6 –– Акустичность и танцевальность
Визуализация показывает, как акустичность связана с танцевальностью. В целом, танцевальная музыка чаще имеет низкую акустичность, однако наличие выбросов указывает на существование гибридных форм.
График 7 –– Средняя длительность треков
График показывает, что даже длительность композиции связана с эмоциональным типом музыки. Некоторые архетипы характеризуются более короткими, динамичными треками, тогда как другие — более протяжёнными и созерцательными.
График 8 –– Музыкальные архетипы (энергия, эмоция)
Этот график объединяет сразу три измерения: энергию, эмоциональную окраску и популярность. Положение пузырей отражает эмоциональные координаты архетипов, а их размер — среднюю популярность. Такая визуализация позволяет воспринимать архетипы как целостные «профили», а не набор отдельных чисел.
8. Используемые статистические методы
- описательная статистика - анализ распределений - группировка и агрегация - относительные частоты - корреляционный анализ - пороговая классификация
9. Описание использования генеративной модели
В ходе проекта использовалась генеративная модель ChatGPT (OpenAI) для помощи в: разработке аналитической концепции; проверке корректности кода; улучшении читаемости визуализаций; формулировке пояснительных текстов. Модель использовалась как вспомогательный инструмент анализа. Ссылка: https://chat.openai.com
10. Заключение
В рамках проекта был проведён анализ музыкального датасета Spotify с использованием количественных аудио-характеристик. Рассматривая музыку как систему числовых параметров, удалось выявить устойчивые взаимосвязи между энергетикой, эмоциональной окраской, темпом и телесностью звучания. Построенные визуализации показали, что музыкальные треки формируют выраженные эмоциональные кластеры, связанные с жанрами и популярностью, но не сводимые к одному параметру. Это позволило рассмотреть жанр и настроение как сложные культурные конструкции, формируемые алгоритмами стриминговых платформ. Проект демонстрирует, что визуализация данных может служить не только способом представления информации, но и инструментом исследования, позволяющим интерпретировать цифровые данные в культурном и дизайнерском контексте.