
Концепция
Для данного проекта я использовал набор данных с сайта Kaggle.com, который включает список самых популярных видеоигр за период с 1980 по 2023 год.
Работа с этими данными была увлекательной, особенно потому, что я обучаюсь в области гейм-дизайна. Анализ статистики игр, которые мне лично нравятся, а также открытие для себя новых игр, представлял особый интерес.
Виды получившихся графиков
1. Распределение рейтингов игр (Violin Plot). 2. Количество отзывов по годам (Bar Plot). 3. Средний рейтинг по жанрам (Violin Plot). 4. Топ-10 игр по количеству отзывов (Dot Plot). 5. Сравнение количества отзывов по жанрам (Horizontal Bar Plot). 6. Количество игр, выпущенных по годам (Step Plot). 7. Соотношение количества желаемого к покупке (wishlist) и рейтинга (Hexbin Plot). 8. 100 Самых популярных игр по рейтингу снизу (Bubble Plot).
Особенности графиков:
• Использование единой цветовой палитры для лучшей визуальной согласованности.
• Добавление заголовков, меток осей и сетки для улучшения читаемости.
• Размеры графиков подобраны так, чтобы обеспечить оптимальное отображение информации.
Прошу заметить: в графиках «Количество отзывов по годам» и «Количество игр выпущенных по годам» наблюдается спад, так-как список заканчивается на 2023 году, и дальше даты не учитывает.
На самом деле рост этих графиков до сих пор наблюдается!
Этапы работы
1. Загрузка данных из файла CSV. 2. Выбор интересующих столбцов. 3. Преобразование значений столбцов в числовой формат и дату. 4. Очистка данных от некорректных записей. 5. Обработка и преобразование данных (например, количество команд разработчиков). 6. Визуализация данных с помощью различных типов графиков.
Графики
Распределение рейтингов
Количество отзывов по годам
Средний рейтинг по жанрам
Топ-10 игр по количеству отзывов
Сравнение количества отзывов по жанрам
Количество игр, выпущенных по годам
Соотношение в wishlist и рейтинга
Соотношение Топ-100 игр снизу с их рейтингом