
Концепция
В ходе данного исследования хотелось бы выяснить, что влияет на успеваемость учащихся. Это важная тема, которая позволяет выявлять сильные и слабые стороны каждого ученика, что способствует индивидуализации образовательного процесса, также данные об успеваемости могут служить основой для принятия обоснованных решений о корректировке учебных планов и внедрении новых образовательных технологий.
В своем исследование я буду использовать данные с сайта Kagle [1]. Так как там представлено достаточно данных для сбора и анализа. Графики, которые я буду использовать:

Оттенки были выбраны с помощью чата GPT под концепцию обучения, поэтому тона получились приглушенные и спокойные.
Ход работы
Для начала я импортировала необходимые мне библиотеки: Обработка данных: pandas, numpy Визуализация: matplotlib, seaborn

Набор данных содержит реальные академические записи 5000 студентов. Он включает различную информацию, полезную для анализа моделей успеваемости, корреляций и поведения учащихся.
График 1 / влияние посещаемости на оценки
График показывает распределение оценок в пределах каждого диапазона посещаемости:
Посещаемость ниже 60%: Ни один учащийся не получает оценок A или B, большинство получает оценки D (42%) посещаемость 60-70% и 70-80%: более сбалансированное распределение по всем классам посещаемость 80-90%: преобладают оценки A (45,6%) посещаемость 90-100%: только оценки A (68,2%) и B (31,8%) Вывод: посещаемость и оценки очень сходятся, что указывает на влияние одного фактора на другой.
Давайте проверим, есть ли другие факторы, влияющие на оценки.
График 2 / влияние пола на оценки
Распределение оценок по полу показало
Оценки A: мужчины — 30,29% | женщины — 29,26% Оценки B: Мужчины немного выше, чем женщины. В целом: сбалансированное распределение по классам.
График 3 / влияние возраста на средний балл
Средний Общий балл по возрасту показал следующие данные: Возраст Средний Балл 18 74.272118 19 75.199043 20 75.321765 21 74.900029 22 75.632365 23 75.270443 24 75.222065
График 4 / влияние оценок на стресс
Распределение оценок по уровню стресса: Более высокий уровень стресса (диапазон 8-10): больше оценок A (33,5%), меньше оценок D и F (~ 15,7%-15,8%). Более низкий уровень стресса (диапазон 0-2): сбалансированное распределение, но немного больше оценок D (18,0%) и F (17,6%). Вывод: стресс может быть связан с лучшими академическими результатами.
Описание применения генеративной модели
Для своей работы я использовала Chat-GPT. Он помог мне найти подходящую цветовую палитру
Посмотреть промпты: https://docs.google.com/document/d/1E40nDmDSc3HkXVORmp8r9GAtGqvkoWoG5Tq4JyQ0Am0/edit?usp=sharing
Ссылка на модель: https://chatgptchatapp.com/
Обложка для проекта была сгенерирована с помощью нейросети Leonardo promt: create a photo of the school room in light shades. Use shades: DEB887, ADD8E6, F5F5DC, BCDDC6
ссылка на модель: https://leonardo.ai/
Ссылка на датасет и код: https://drive.google.com/drive/folders/16guTr7Ut4Ni9fqxzOsgyoH6Bp8XxQ_eM?usp=sharing