Original size 840x1264

Spotify: анализ популярной музыки

PROTECT STATUS: not protected
4

Концепция

Spotify — одна из самых популярных платформ для прослушивания музыки, подкастов и аудиокниг. В месяц насчитывается около 640 млн прослушиваний контента с использованием сервиса.

Для меня выбор темы связан с моим интенсивным использованием Spotify для прослушивания музыки. Я на протяжении нескольких лет использую это приложения, собирая большое количество разных плейлистов по настроению.

Для анализа специфики музыкальных треков я использовала сервис Kaggle для поиска нужного мне датасета «Spotify Tracks Dataset». В нем я нашла всю нужную информацию по проекту, так как в нем можно найти все нужные данные, а именно: длительность треков, их популярность, энергичность, громкость и тд.

Обработка данных

big
Original size 1085x150
big
Original size 5000x1500

Сначала я выбрала в каких цветах я буду визуализировать данные. Для этого я выбрала основные цвета Spotify: черный, белый и зеленый, а также чтобы контент не сливался — фиолетовый.

Также в коде я установила белый цвет для текста, черный цвет — для фона, а зеленый и фиолетовый — для цвета элементов графиков и диаграмм.

big
Original size 1085x75

Для эффективной и наглядной визуализации данных были использованы следующие виды графиков:

- Точечный график (для анализа зависимости громкости и энергичности, чтобы посмотреть насколько популярны треки этих двух категорий);

- Гистограмма (чтобы узнать среднюю длительность треков);

- Круговая диаграмма (наличие или отсутствие контента недопустимого для всех возрастов);

- Линейный график (для зависимости популярности от танцевальности треков).

0

В точечный графике фиолетовым цветом я выделила популярные, а зеленым менее популярные композиции. Также во всех последующих кодах взята выборка из 1000 случайных треков из датасета.

Original size 1085x513

В гистограмме начала я миллисекунды перевела в минуты, потом строится график, а затем ограничиваю количество показателей минут до 12.

Original size 1085x568

В круговой диаграмме определяю по таблице показатели датасета True и False в зависимости от наличия недопустимого для возрастов контента. С помощью ax.pie () создаю диаграмму с подписями, процентами и заданными цветами.

Original size 1085x503

Визуализация данных

Для начала я решила посмотреть зависимость громкости треков от энергичности мелодии, а затем по цветам определить как эта зависимость влияет на популярность среди пользователей.

Original size 1111x590

Как мы можем заметить среди пользователей популярны треки, не обладающие высокой громкостью, но при этом энергичные. То есть приходим к выводу, что обычные танцевальные треки обладают большим спросом в прослушивании.

Original size 1189x589

В гистограмме мы можем заметить, что средняя продолжительность популярных треков на площадке составляет от 2,5 минут до почти 6, в этот промежуток как раз входят классические представители жанра танцевальной музыки.

Original size 737x590

Так как я уже предположила с основаниями из датасета, что основная часть всех популярных треков — это танцевальная музыка, мы опять находим этому подтверждение. Среди всех популярных произведений есть данные о том, что 91,4% треков не используют ненормативную лексику. А так как мат не пропускают в большинстве мест для общественного прослушивания аудио, то, например, по радио мы как раз и слышим только энергичную танцевальную музыку.

Original size 1189x590

Заключение

В конце своего лонгрида хочу подытожить вышеперечисленную информацию. Как показывают графики, информацию для которых я взяла из общедоступного датасета, могу сделать вывод, что все ныне популярная музыка в основном состоит из танцевальных треков. Это можно было заметить на графиках, а именно: энергичная и не высокая громкость, почти полное отсутствие ненормативной лексики, а также график, показывающий зависимость популярности музыки от ее танцевальности.

Описание применения генеративной модели

ИИ я использовала исключительно в создании обложки. Мне помог в этом сайт Leonardo.Ai, а именно модель Graphic Design. Также был прикреплён логотип приложения Spotify в качестве референса для генерации изображения.

Промт:

«I need to create a cover for a project in which I talk about spotify. the logo of this program should be present on the cover, and in the background there should be an abstraction of green, white purple balls on a black background. here are the exact color codes #1ed760, #ffffff and #9c1ed6.»

Ссылки на используемые ресурсы

Kaggle.com для поиска и скачивания датасета.

Leonardo.Ai для генерации обложки.

Google Colab в качестве среды для написания кода.

Figma для размещения скриншотов графиков и фрагментов кода на слайдах.

Spotify: анализ популярной музыки
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more