Original size 1140x1600

Топ-250 фильмов на Кинопоиске

PROTECT STATUS: not protected

Описание

В поисках интересного датасета на сайте kaggle.com, я сразу обратила внимание на список топ-250 фильмов по версии Кинопоиска. Я очень люблю кинематограф и давно пользуюсь самим сервисом, а этот список — настоящий ориентир, к которому я не раз возвращалась, выбирая, что посмотреть вечером. Недолго думая, я выбрала именно этот датасет для анализа.

big
Original size 1536x1024

Генерация в Recraft

Для визуального представления данных были выбраны такие типы диаграмм, которые обеспечивают максимальную наглядность и позволяют быстро уловить основные тенденции. 1. Линейный график 2. Диаграмма рассеяния 3. Столбчатая диаграмма 4-5. Линейчатая диаграмма 6. Круговая диаграмма

Оформление

big
Original size 1536x500

В оформлении визуальной части проекта использовалась фирменная цветовая палитра платформы, обеспечивающая узнаваемость и стилистическое единство. В качестве фона и основного цвета типографики был выбран чёрный #000000, создающий нейтральную и контрастную основу для представления данных.

Для обводки и ключевых элементов интерфейса использован белый цвет #FFFFFF, обеспечивающий визуальную чёткость и высокую читаемость.

Original size 1536x501

Основные акценты в визуализациях заданы с помощью ярких, контрастных цветов: — оранжевый #FF5500 — салатовый #BBFF00

Эти оттенки применяются в диаграммах и градиентных заливках, подчеркивая ключевые значения и создавая динамичный, современный визуальный образ.

Загрузка данных и форматирование

В проекте использовались следующие библиотеки: pandas — для обработки табличных данных, numpy — для числовых операций, matplotlib.pyplot — для построения графиков, seaborn — для визуализации статистических данных, matplotlib.colors — для настройки цветовых схем и градиентов, matplotlib.patches — для добавления графических элементов на диаграммы.

Original size 1537x600
0

1. Просмотр первых строк; 2. Просмотр общей информации о датасете; 3. Приведение типов и фильтрация данных; 4. Настройка фирменных цветов

[1] Рейтинг по годам

Original size 1536x1024
Original size 1536x498

На этой диаграмме отображается, как менялся средний рейтинг фильмов из топ-250 Кинопоиска в зависимости от года их выпуска. Линия позволяет проследить общую тенденцию: в какие периоды выходило больше высоко оценённых фильмов, а когда — меньше. Такой график помогает увидеть динамику зрительских предпочтений во времени и оценить, как менялось качество популярных фильмов с годами.

[2] Рейтинг и год выпуска

Original size 1536x1024
Original size 1536x463

Этот график показывает, как соотносятся оценки фильмов с годами их выхода. Каждый кружок — это отдельный фильм из топ-250 Кинопоиска. По горизонтали — год выпуска, по вертикали — рейтинг.

Такой тип графика позволяет сразу увидеть, когда выходило больше популярных фильмов, а когда — меньше. Он хорошо показывает, что высоко оценённые фильмы есть как среди старых, так и среди относительно новых. Благодаря форме диаграммы легко заметить общее распределение и разброс данных — без усреднения или сглаживания.

[3] Страны и фильмы

Original size 1536x1024
Original size 1536x447

Этот график показывает, какие страны чаще всего представлены в списке топ-250 фильмов на Кинопоиске. В нём отображены топ-10 стран с наибольшим количеством фильмов в рейтинге.

Каждый столбик — это страна, а его высота показывает, сколько фильмов из этой страны попали в список. Такой график помогает сразу понять, какие кинематографии доминируют: например, США, СССР или Франция. Это наглядный способ увидеть географию кинематографического влияния в глазах зрителей Кинопоиска.

Формат столбчатой диаграммы выбран не случайно — он идеально подходит для сравнения категорий между собой по количественным показателям.

[4] Фильмы и год выпуска

Original size 1536x1024
Original size 1536x776

График показывает, сколько фильмов было выпущено в каждый год. По сути, это гистограмма, где каждый столбик — это год, а его высота указывает, сколько фильмов из этого списка вышло в тот период.

В отличие от стандартной гистограммы, здесь каждый фильм изображён как отдельная цветная плитка, уложенная вертикально — благодаря этому становится видно не просто количество, а буквально «массу» фильмов по годам. Градиент внутри столбиков делает график более живым и помогает визуально различать плотность.

Этот тип визуализации интересен тем, что позволяет заметить кинематографические волны — периоды повышенной активности или спадов в выпуске культовых фильмов. Также можно увидеть, какие десятилетия особенно богаты на популярное кино, и как с годами изменялось количество знаковых релизов.

[5-6] Режиссёры и фильмы

Original size 1536x1024
Original size 1536x469

Этот график показывает, какие режиссёры чаще всего представлены в списке. Он построен в виде горизонтальной столбчатой диаграммы, где каждая строка — это фамилия режиссёра, а длина полосы отражает, сколько его фильмов вошло в список.

Такой тип графика особенно удобен, когда названия категорий — в данном случае имена — достаточно длинные. Он позволяет легко сравнивать значения между участниками и быстро понять, какие режиссёры наиболее влиятельны в глазах зрителей. Это своеобразный рейтинг самых «успешных» авторов по количеству вошедших в топ фильмов.

Original size 1536x1024
Original size 1536x643

Круговая диаграмма отражает, какую долю от топ-250 занимают фильмы режиссёров-лидеров по количеству работ. В неё включены 10 самых часто встречающихся имён, и каждый сектор показывает, какую часть от общего числа фильмов составляют их работы.

Такая визуализация хороша тем, что сразу даёт представление о распределении «влияния»: видно, у кого из режиссёров вклад наиболее значительный, а у кого — скромнее. Размер сектора интуитивно передаёт масштаб — чем он больше, тем заметнее режиссёр в общем рейтинге.

Original size 1536x1024

Генерация в Recraft

Применения ИИ

В процессе работы над проектом использовались инструменты генеративного искусственного интеллекта: — ChatGPT (модель GPT-4) — применялся для генерации идей по визуальному оформлению проекта; составления промтов для визуального генератора. — Recraft.ai — использовался для генерации изображений, созданных на основе заранее подготовленных промтов. Промты формировались с помощью ChatGPT.

Топ-250 фильмов на Кинопоиске
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more