
Выбор данных
Для анализа я выбрала данные о продажах видеоигр в период с 1980-х до 2010-х годов. Мне показалось, что, изучив примеры самых продаваемых игр за такой длительный период времени, я смогу лучше понимать этот рынок и его общие тенденции.
Датасет я нашла на сайте kaggle.com.
Визуализация данных

Для отображения количества продаж с течением времени я выбрала линейный график. В данном случае используются данные о мировых продажах для одного Nintendo, но аналогично можно рассчитать эту информацию для любого из издателей.

Далее был создан график для определения наиболее продаваемых жанров для определенного региона. В данном примере показана Европа. Также я убрала некоторые элементы визуала и изменила цветовую палитру для достижения большей минималистичности изображения.
Для круговой диаграммы я взяла соотношение платформ и мировых продаж, чтобы определить, на каких платформах были самые продаваемые игры. Из всех данных я выбрала 10 наиболее успешных платформ.
Для тепловой карты я взяла выборку из 5 издателей с наибольшими продажами и суммы их продаж в каждом из регионов. Таким образом, график отображает количество продаж по регионам, что помогает определить, на какую аудиторию в основном работают издатели.
Описание применения генеративной модели
Для ускорения работы с импортированными библиотеками я использовала GPT-4 от OpenAI, документациии stackoverflow.com. Я составляла запросы для полного перечня функций библиотеки по определенным критериям и примеров ее применения.
Примеры промптов:
— What functions from Matplotlib can I use to change the colors of the chart elements? List all color palettes for Matplotlib What function removes the grid?
Для создания обложки проекта использовалась Ideogram AI.