
Анализ датасета об интровертах и экстравертах
В данном проекте я решила проанализировать датасет «Extrovert vs. Introvert Behavior Data».
В первую очередь данный датасет заинтересовал меня своей актуальностью лично для меня. Я — неклассическая и довольно активная интровертка, которая любит узнавать новое про себя, и, как мне показалось, обработка такого объема данных как раз-таки поможет мне лучше «типировать себя».

Также, помимо личного интереса, данный датасет представляет интерес и социальный. Многие до сих пор придерживаются стигмы, что «все» интроверты — одиночки без друзей, ленивые и неактивные, когда «все» экстраверты — гиперактивные и никогда не устают. Но так ли это? Ответ на данный вопрос и стал целью исследования.
Для визуализации я выбрала два противополложных как по тону, так и по теплоте оттенка — оранжевый и сиреневый, которые, несмотря на свою противополножность, комплиментарны, как и сами интроверты и экстраверты.

Датасет был взят с открытой платформы Kaggle.
Всего в исследовании я использовала такие виды визуализаций:
(1) Столбчатая диаграмма (2) Диаграмма распределения (3) Точечная диаграмма (4) Ящик с усами (5) Корреляционная матрица
Я выбрала именно эти типы визуализаций, потому что они позволяют наиболее ясно и наглядно передать структуру данных и выявить ключевые зависимости.
В проекте использовалась библиотека Pandas для чтения и предварительной обработки датасета. Библиотеки Seaborn и Matplotlib применялись для построения и стилизации графиков.
Оформление

Первым делом я выполнила загрузку необходимых библиотек, также загрузила сам датасет и настроила палитру цветов для интровертов и экстравертов.
Также отдельно я загрузила шрифт Verdana, так как исследование мое направлено на социальный аспект, следовательно должно быть читабельным и легкодоступным.
(1) Распледеление типов личности, столбчатая диаграмма
Сначала я решила проверить количество участников. Все же для более точного типирования, данные должны быть распределены поровну или очень схоже.
Количество интровертов и экстравертов в датасете сбалансировано, что позволяет провести сравнительный анализ без существенного перекоса и сделать более достоверные выводы.
(2) Плотность активности vs. одиночество, диаграмма распределения
Настало время самого анализа. В современном мире люди очень сильно полагаются на соцсети. Поэтому мне показалось логичным посмотреть, есть ли девиационные моменты в поведении интровертов и экстравертов в сети. Я посмотрела зависимости времени в одиночестве и количества постов в неделю у интровертов и экстравертов. В классических определениях типажей, интроверты должны мало проявлять активность в соцсетях и проводить много времени в одиночестве. экстраверты — наоборот.
У части интровертов высокий уровень объема постов несмотря на любовь к уединению. У некоторых экстравертов — объем почти на нуле.
Получается, что пусть и не много, но мы видим некую нестереотипную девиацию.
(3) Связь страха сцены и выхода в «свет», точечная диаграмма
Далее я решила проверить, боятся ли публичности даже те, кто активно выходит «в свет»?
Некоторые экстраверты боятся сцены, но часто бывают на мероприятиях. Здесь мы развеиваем еще один миф: экстраверсия ≠ публичность, а интроверсия ≠ социальная изоляция.
(4) Социальная активность, ящик с усами
Далее я хочу доказать, что среди интровертов есть разные уровни активности, включая высокую.
Несмотря на то, что выборка отчасти подтверждает различия в кругах общения, мы все равно видим выбросы у интровертов. Это доказывает, что интроверты не одиноки — они просто избирательны.
(5) Корелляционная матрица
Завершая исследование, я бы хотела финально посмотреть, как по-разному связаны поведенческие факторы у интровертов и экстравертов.
Интересно, что корелляция между факторами у интровертов больше, чем у экстравертов.
Выводы
Какой же вывод можно сделать? Как мне кажется, тип личности — это не ярлык и не шаблон поведения, а лишь один из факторов, влияющих на поведение человека.
Интроверты — не обязательно замкнутые одиночки, и экстраверты — не всегда душа компании.
Люди многогранны, и личность проявляется гибко — в зависимости от среды, комфорта, целей и предпочтений. Конечно, стереотипы не возникают из неоткуда. Но они лишь показывают опыт «большинства», и люди не должны судить других исключительно по набору общеизвестных факторов.
Описание применения генеративной модели