Original size 2280x3200

Social Media vs Productivity

PROTECT STATUS: not protected
4

Концепция исследование

Многие считают, что чрезмерное использование социальных сетей может негативно влиять на продуктивность и работоспособность. Но помимо развлечений, социальные сети могут служить источником информации и общения, что способствует улучшению продуктивности. Данное исследование направлено на то, чтобы понять, как различные аспекты использования социальных сетей (время, количество уведомлений, предпочтительные платформы) коррелируют с продуктивностью и уровнем стресса.

Для анализа я выбрала датасет «Social Media Usage vs Productivity», который содержит данные о времени, проведённом в социальных сетях, а также о различных факторах, которые могут влиять на продуктивность, таких как уровень стресса, удовлетворенность работой, количество перерывов и другие параметры.

Цель исследования: Оценить, как использование социальных сетей влияет на продуктивность и стрессы, а также выявить ключевые факторы, влияющие на эту зависимость.

big
Original size 3840x2160

Предварительные действия

#импортирую библиотеку

import seaborn as sns import matplotlib.pyplot as plt import pandas as pd import numpy as np

#вывожу первые 5 строк

df = pd.read_csv ('C:/Users/Dinozavr/Downloads social_media_vs_productivity.csv' df.head ()

#информация о датасете, смотрю есть ли пропущенные данные

df.info ()

#убираю пропущенные

df = df[df['daily_social_media_time'].isna ()== False]

График № 1: Распределение времени в соцсетях

График представляет собой гистограмму, отображающую распределение времени, которое люди проводят в социальных сетях ежедневно, измеренное в часах. На оси X указано количество часов, проведенных в соцсетях, а на оси Y — количество людей, проводящих это время.

По графику видно, что большинство людей проводят в социальных сетях от 0 до 5 часов в день, при этом пик приходится на диапазон от 2 до 3 часов. Время, превышающее 10 часов в день, встречается крайне редко.

sns.set_style («whitegrid») # сетка на фоне plt.figure (figsize=(12, 6)) # размер графика

Создание гистограммы с фиолетовыми оттенками

ax = sns.histplot ( data=df, x="daily_social_media_time», bins=15, # количество столбцов color="

8A2BE2»,

фиолетовый alpha=0.7, # прозрачность edgecolor="black», # чёрные границы столбцов linewidth=0.7 # толщина границ

Добавление заголовка и подписей

plt.title ( «Распределение времени в соцсетях (часов/день)», fontsize=16, pad=20 # отступ заголовка

plt.xlabel («Часы в соцсетях», fontsize=12) plt.ylabel («Количество людей», fontsize=12)

Настройка сетки и оформления

sns.despine (left=True) # убираем левую границу plt.grid (axis="y», linestyle="--» , alpha=0.4) # горизонтальная сетка plt.show ()

Original size 3840x2160

Вывод: Основная масса людей тратит умеренное количество времени в социальных сетях (менее 5 часов в день), что может указывать на то, что большинство пользователей пытаются сбалансировать время между личной и рабочей активностью.

График № 2: Распределение предпочтений соцсетей

Следующий график к которому я обращаюсь в своем исследование, это круговая диаграмма. На графике изображено распределение предпочтений пользователей социальных сетей.

Согласно диаграмме, все выбранные платформы — TikTok, Facebook, Instagram, Telegram и Twitter — имеют примерно равные доли среди пользователей, с небольшим перевесом у TikTok (20.3%), и чуть меньшими показателями для остальных платформ (около 19,8% — 20,0%).

platform_counts= df['social_platform_preference'].value_counts ()

Фиолетовая палитра (от светлых к тёмным оттенкам)

purple_palette= [ '

DDA0DD',

Сливовый светлый '

BA55D3',

Средний орхидей '

9932CC',

Тёмный орхидей '

9400D3',

Тёмный фиолетовый '

800080'

Фиолетовый ]

Создание круговой диаграммы

plt.figure (figsize=(10, 8)) wedges, texts, autotexts = plt.pie ( platform_counts, labels=platform_counts.index, autopct='%1.1f%%' , startangle=90, colors=purple_palette[: len (platform_counts)], wedgeprops={'edgecolor': 'black', 'linewidth': 0.5}, textprops={'fontsize': 12} )

Улучшаем подписи

plt.setp (autotexts, color='white', weight='bold') # Белые цифры с % plt.title ('Распределение предпочтений соцсетей', pad=20, fontsize=16) plt.tight_layout () plt.show ()

Original size 3840x2160

Вывод: Все платформы имеют примерно одинаковую популярность, что может указывать на разнообразие предпочтений среди пользователей. Это может свидетельствовать о равномерном распределении интересов в разных социальных сетях, что важно для маркетинговых стратегий, направленных на разные аудитории.

График № 3: Среднее время по возрастным группам

Далее, я решила проанализировать среднее время проведенное в соцсетях. График представляет собой столбчатую диаграмму, показывающую среднее время, которое люди проводят в социальных сетях в зависимости от возрастной группы. Мы анализируем, как возраст влияет на количество времени, проводимого в соцсетях.

bins = [0, 25, 35, 45, 100] # Границы групп labels = ['<25 лет', '25-34 года', '35-44 года', '45+ лет'] # Названия групп df['age_group']= pd.cut (df['age'], bins=bins, labels=labels, right=False)

Группируем данные по возрастным группам

age_media_time= df.groupby ('age_group')['daily_social_media_time'].mean ().reset_index

Настраиваем стиль

plt.figure (figsize=(10, 6)) purple_palette= sns.color_palette («Purples», n_colors=4) # 4 фиолетовых оттенка

Строим барчарт

ax = sns.barplot ( data=age_media_time, x='age_group', y='daily_social_media_time', palette=purple_palette, # подгружаем ранее созданные цвета edgecolor='black', #рамки linewidth=1, saturation=0.8 )

Добавляем аннотации и оформление

plt.title ('Среднее время в соцсетях по возрастным группам', pad=20, fontsize=16 plt.xlabel ('Возрастная группа', fontsize=12) plt.ylabel ('Часов в день', fontsize=12) plt.tight_layout () plt.show ()

Original size 3840x2160

Выводы: Люди младше 25 лет и в возрастной группе 25-34 года проводят в социальных сетях около 2.5-3 часов в день. Возрастные группы 35-44 года и 45+ лет проводят чуть меньше времени — около 2.0-2.5 часов в день.

Это может свидетельствовать о том, что молодежь и люди среднего возраста более активны в социальных сетях, в то время как более старшая группа проводит меньше времени на этих платформах.

График № 4: Факторы влияющие на продуктивность

Мы анализируем взаимосвязь между уровнем удовлетворенности работой (job_satisfaction_score), количеством чашек кофе в день (coffee_consumption_per_day), фактическим уровнем продуктивности (actual_productivity_score), временем, проведенным в социальных сетях (daily_social_media_time), и уровнем стресса (stress_level).

Выбираем нужные колонки

cols = ['job_satisfaction_score', 'coffee_consumption_per_day', 'actual_productivity_score', 'daily_social_media_time', 'stress_level'] df_selected= df[cols]

Считаем корреляцию Спирмена (подходит для нелинейных зависимостей)

corr = df_selected.corr (method='spearman')

Маска для верхнего треугольника (чтобы не дублировать)

mask = np.triu (np.ones_like (corr, dtype=bool))

Создаем фиолетовую палитру

purple_palette= sns.light_palette (»#8A2BE2», as_cmap=True, reverse=False)

Настраиваем размер

plt.figure (figsize=(10, 8))

Строим heatmap

sns.heatmap (corr, mask=mask, annot=True, fmt=».2f», cmap=purple_palette, vmin=-1, vmax=1, center=0, square=True, linewidths=.5, cbar_kws={"shrink»: .8})

Настраиваем внешний вид

plt.title («Корреляция Спирмена (фиолетовая палитра)\n» plt.xticks (rotation=45, ha='right') plt.tight_layout () plt.show ()

Original size 3840x2160

Выводы: Наибольшая положительная корреляция наблюдается между уровнем удовлетворенности работой и фактическим уровнем продуктивности (0.89). Это может свидетельствовать о том, что высокая удовлетворенность работой способствует повышению продуктивности. Низкая корреляция между временем, проведенным в социальных сетях, и другими переменными, такими как продуктивность или стресс, что указывает на то, что время, потраченное в соцсетях, не оказывает значительного воздействия на эти факторы. Отсутствие корреляции между количеством чашек кофе в день и другими переменными может означать, что потребление кофе не связано напрямую с продуктивностью, стрессом или удовлетворенностью работой.

График № 5: Общая тенденция

Через график scatter plot (диаграмма рассеяния), который показывает зависимость между временем, проведённым в социальных сетях (по оси X), и фактической продуктивностью (по оси Y), также добавлена линия тренда (регрессионная линия), чтобы наглядно показать общую тенденцию.

plt.figure (figsize=(10, 6)) sns.set_style («white»)

Простой scatter plot

plt.scatter ( x=df[«daily_social_media_time»], y=df[«actual_productivity_score»], color="

8A2BE2»,

Фиолетовый цвет s=30 # Размер точек )

Добавляем линию тренда

sns.regplot ( x=df[«daily_social_media_time»], y=df[«actual_productivity_score»], scatter=False, line_kws={"color»: «

4B0082», «linewidth»: 2}

Темно-фиолетовый )

Оформление

plt.title («Продуктивность vs Время в соцсетях», fontsize=16, pad=15) plt.xlabel («Часы в соцсетях в день», fontsize=12) plt.ylabel («Фактическая продуктивность», fontsize=12) plt.grid (axis='both', alpha=0.2, linestyle='--')

Фиолетовая рамка

for spine in plt.gca ().spines.values (): spine.set_edgecolor ('#9370DB') spine.set_linewidth (1.5) plt.tight_layout () plt.show ()

Original size 3840x2160

Выводы: Видна отсутствие явной зависимости между временем, проведённым в социальных сетях, и фактической продуктивностью. Точки рассеяны по графику без выраженной закономерности. Линия тренда практически горизонтальна, что подтверждает вывод о незначительном влиянии времени в соцсетях на продуктивность.

Таким образом, можно сделать вывод, что время, проведённое в социальных сетях, не имеет существенного воздействия на фактическую продуктивность пользователей.

Заключение

Несмотря на большое количество времени, которое многие пользователи проводят в социальных сетях, исследование показало, что это время не оказывает прямого воздействия на их продуктивность. Основными факторами, влияющими на продуктивность, являются внутреннее удовлетворение работой и другие личные характеристики, а не время, проведённое в социальных сетях.

Ссылки

Social Media vs Productivity
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more