Original size 720x1008

Анализ данных популярности книг в библиотеках

PROTECT STATUS: not protected
10

Описание проекта

Для анализа я выбрала базу данных «Рейтинг книг, пользовавшихся наибольшим спросом у читателей библиотек по годам», который представлен в портале открытых данных Правительства Москвы, раздел «Культура». Анализ этих данных и визуализация позволяет проанализировать тренды и изменения в предпочтениях читателей. Для визуализации были использованы столбчатые диаграммы, так как они наиболее наглядно демонстрируют тенденции популярности и позволяют сравнить показатели в разные временные периоды. Также визуально столбцы диаграммы напоминают полку с книгами, что соответствует рассматриваемой теме.

Анализ данных и визуализация

Для начала необходимо импортировать необходимые библиотеки — pandas для работы с данными, matplotlib.pyplot и seaborn для визуализации данных, matplotlib.cm для создания цветовых палитр и numpy для работы с числовыми данными, а также подключиться к Google Drive, чтобы получить доступ к файлу, который будем анализировать. Далее происходит загрузка данных из CSV файла в DataFrame с помощью функции pd.read_csv () из библиотеки pandas. Для этого указан путь к файлу в Google Drive и разделитель, используемый в файле. После загрузки данных выполняется преобразование некоторых столбцов в тип int для того, чтобы можно было выполнять арифметические операции с этими столбцами и использовать их в дальнейшем для анализа данных.

big
Original size 1654x885

Создадим график, отображающий количество книг по жанрам. Необходимо указать столбцы для отображения на осях x и y — количество книг и жанр, а также задать цветовую палитру. Добавим подписи осей, заголовок и поворот меток оси x.

Original size 1500x622

код № 1

Original size 842x674

график № 1

Далее проанализируем средний рейтинг популярности книг по жанрам. Для этого сначала посчитаем средний рейтинг для каждого жанра, а затем отсортируем их по убыванию. Добавим цветовую палитру, подписи осей и заголовок.

Original size 1498x850

код № 2

Original size 833x674

график № 2

Для построения графика, который иллюстрирует средний рейтинг книг каждой страны необходимо сгруппировать данные по странам, вычислить средний рейтинг для каждой страны и отсортировать в порядке убывания.

Original size 1569x846

код № 3

Original size 833x753

график № 3

В следующем графике представлен рейтинг популярности книг по издательствам. Для его создания необходимо для каждого издательства вычислить средний рейтинг популярности и далее отсортировать полученные данные в порядке убывания рейтинга.

Original size 1644x849

код № 4

Original size 842x761

график № 4

Обложка проекта сгенерирована с помощью нейросети Ideogram. Промт: Minimalist photograph of a wooden bookshelf on which a collection of bright, colorful books are neatly arranged. The background is simple and clean.

Анализ данных популярности книг в библиотеках
10
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more