Исходный размер 832x1248

Анализ факторов, влияющих на экзаменационные баллы студентов

PROTECT STATUS: not protected

Выбор данных

Я выбрала датасет «Exam Score Prediction Dataset» с платформы Kaggle, который содержит информацию о 20,000 студентов и факторах, влияющих на их экзаменационные баллы.

Ссылка на датасет: https://www.kaggle.com/datasets/kundanbedmutha/exam-score-prediction-dataset

Ценность данных

Данные представляют интерес, потому что:

1. Реальная практическая значимость:

Понимание факторов успеваемости полезно для образовательных учреждений, студентов и преподавателей

2. Мультифакторный подход:

Включает академические, поведенческие, бытовые и средовые факторы (учеба, сон, посещаемость, интернет и др.)

3. Чистота и готовность к анализу:

Данные уже очищены, нет пропусков, что позволяет сосредоточиться на анализе

Выбор типов графиков

Я выбрала следующие виды визуализаций:

Тепловая карта (heatmap) — для показа взаимодействия двух категориальных факторов

Групповая столбчатая диаграмма — для сравнения средних значений по группам

Гистограмма — для анализа распределения оценок

Точечная диаграмма (scatter plot) — для выявления корреляций

Этапы работы

Обработка данных

Этап 1 Загрузка и первоначальный осмотр данных

Исходный размер 1054x534

Этап 2 Проверка данных

Исходный размер 1054x534

Для помощи в анализе использовала DeepSeek AI с промптами:

«Упрости код, оставив только необходимое» «Помоги исправить ошибку»

Что нейросеть помогла сделать:

  1. Предложить темы для анализа
  2. Оптимизировать код визуализации
  3. Подобрать цветовую палитру
  4. Решить технические проблемы (KeyError)

Этап 3 Стилизация графиков

Вдохновлялась принципами Data-Ink Ratio (минимализм в визуализации данных)

Исходный размер 1054x534

Шрифт DejaVu Sans (доступен в Google Colab)

Изучающая визуализация

Исходный размер 1054x534

Объясняющая визуализация

Исходный размер 1054x534

Статистические методы

1. Описательная статистика: Среднее, стандартное отклонение

2. Агрегация: Группировка по категориям

3. Корреляционный анализ: Визуальная оценка взаимосвязей

4. Сравнение средних: Между разными группами

Итоговые графики

Исходный размер 984x584
Исходный размер 984x584
Исходный размер 984x565
Исходный размер 1184x584
Исходный размер 924x584
Анализ факторов, влияющих на экзаменационные баллы студентов
Проект создан 14.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше