
Концепция исследование
Многие считают, что чрезмерное использование социальных сетей может негативно влиять на продуктивность и работоспособность. Но помимо развлечений, социальные сети могут служить источником информации и общения, что способствует улучшению продуктивности. Данное исследование направлено на то, чтобы понять, как различные аспекты использования социальных сетей (время, количество уведомлений, предпочтительные платформы) коррелируют с продуктивностью и уровнем стресса.
Для анализа я выбрала датасет «Social Media Usage vs Productivity», который содержит данные о времени, проведённом в социальных сетях, а также о различных факторах, которые могут влиять на продуктивность, таких как уровень стресса, удовлетворенность работой, количество перерывов и другие параметры.
Цель исследования: Оценить, как использование социальных сетей влияет на продуктивность и стрессы, а также выявить ключевые факторы, влияющие на эту зависимость.

Предварительные действия
#импортирую библиотеку
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd import numpy as np
#вывожу первые 5 строк
df = pd.read_csv ('C:/Users/Dinozavr/Downloads social_media_vs_productivity.csv' df.head ()
#информация о датасете, смотрю есть ли пропущенные данные
df.info ()
#убираю пропущенные
df = df[df['daily_social_media_time'].isna ()== False]
График № 1: Распределение времени в соцсетях
График представляет собой гистограмму, отображающую распределение времени, которое люди проводят в социальных сетях ежедневно, измеренное в часах. На оси X указано количество часов, проведенных в соцсетях, а на оси Y — количество людей, проводящих это время.
По графику видно, что большинство людей проводят в социальных сетях от 0 до 5 часов в день, при этом пик приходится на диапазон от 2 до 3 часов. Время, превышающее 10 часов в день, встречается крайне редко.
sns.set_style («whitegrid») # сетка на фоне plt.figure (figsize=(12, 6)) # размер графика
ax = sns.histplot ( data=df, x="daily_social_media_time», bins=15, # количество столбцов color="
plt.title ( «Распределение времени в соцсетях (часов/день)», fontsize=16, pad=20 # отступ заголовка
plt.xlabel («Часы в соцсетях», fontsize=12) plt.ylabel («Количество людей», fontsize=12)
sns.despine (left=True) # убираем левую границу plt.grid (axis="y», linestyle="--» , alpha=0.4) # горизонтальная сетка plt.show ()
Вывод: Основная масса людей тратит умеренное количество времени в социальных сетях (менее 5 часов в день), что может указывать на то, что большинство пользователей пытаются сбалансировать время между личной и рабочей активностью.
График № 2: Распределение предпочтений соцсетей
Следующий график к которому я обращаюсь в своем исследование, это круговая диаграмма. На графике изображено распределение предпочтений пользователей социальных сетей.
Согласно диаграмме, все выбранные платформы — TikTok, Facebook, Instagram, Telegram и Twitter — имеют примерно равные доли среди пользователей, с небольшим перевесом у TikTok (20.3%), и чуть меньшими показателями для остальных платформ (около 19,8% — 20,0%).
platform_counts= df['social_platform_preference'].value_counts ()
purple_palette= [ '
plt.figure (figsize=(10, 8)) wedges, texts, autotexts = plt.pie ( platform_counts, labels=platform_counts.index, autopct='%1.1f%%' , startangle=90, colors=purple_palette[: len (platform_counts)], wedgeprops={'edgecolor': 'black', 'linewidth': 0.5}, textprops={'fontsize': 12} )
plt.setp (autotexts, color='white', weight='bold') # Белые цифры с % plt.title ('Распределение предпочтений соцсетей', pad=20, fontsize=16) plt.tight_layout () plt.show ()
Вывод: Все платформы имеют примерно одинаковую популярность, что может указывать на разнообразие предпочтений среди пользователей. Это может свидетельствовать о равномерном распределении интересов в разных социальных сетях, что важно для маркетинговых стратегий, направленных на разные аудитории.
График № 3: Среднее время по возрастным группам
Далее, я решила проанализировать среднее время проведенное в соцсетях. График представляет собой столбчатую диаграмму, показывающую среднее время, которое люди проводят в социальных сетях в зависимости от возрастной группы. Мы анализируем, как возраст влияет на количество времени, проводимого в соцсетях.
bins = [0, 25, 35, 45, 100] # Границы групп labels = ['<25 лет', '25-34 года', '35-44 года', '45+ лет'] # Названия групп df['age_group']= pd.cut (df['age'], bins=bins, labels=labels, right=False)
age_media_time= df.groupby ('age_group')['daily_social_media_time'].mean ().reset_index
plt.figure (figsize=(10, 6)) purple_palette= sns.color_palette («Purples», n_colors=4) # 4 фиолетовых оттенка
ax = sns.barplot ( data=age_media_time, x='age_group', y='daily_social_media_time', palette=purple_palette, # подгружаем ранее созданные цвета edgecolor='black', #рамки linewidth=1, saturation=0.8 )
plt.title ('Среднее время в соцсетях по возрастным группам', pad=20, fontsize=16 plt.xlabel ('Возрастная группа', fontsize=12) plt.ylabel ('Часов в день', fontsize=12) plt.tight_layout () plt.show ()
Выводы: Люди младше 25 лет и в возрастной группе 25-34 года проводят в социальных сетях около 2.5-3 часов в день. Возрастные группы 35-44 года и 45+ лет проводят чуть меньше времени — около 2.0-2.5 часов в день.
Это может свидетельствовать о том, что молодежь и люди среднего возраста более активны в социальных сетях, в то время как более старшая группа проводит меньше времени на этих платформах.
График № 4: Факторы влияющие на продуктивность
Мы анализируем взаимосвязь между уровнем удовлетворенности работой (job_satisfaction_score), количеством чашек кофе в день (coffee_consumption_per_day), фактическим уровнем продуктивности (actual_productivity_score), временем, проведенным в социальных сетях (daily_social_media_time), и уровнем стресса (stress_level).
cols = ['job_satisfaction_score', 'coffee_consumption_per_day', 'actual_productivity_score', 'daily_social_media_time', 'stress_level'] df_selected= df[cols]
corr = df_selected.corr (method='spearman')
mask = np.triu (np.ones_like (corr, dtype=bool))
purple_palette= sns.light_palette (»#8A2BE2», as_cmap=True, reverse=False)
plt.figure (figsize=(10, 8))
sns.heatmap (corr, mask=mask, annot=True, fmt=».2f», cmap=purple_palette, vmin=-1, vmax=1, center=0, square=True, linewidths=.5, cbar_kws={"shrink»: .8})
plt.title («Корреляция Спирмена (фиолетовая палитра)\n» plt.xticks (rotation=45, ha='right') plt.tight_layout () plt.show ()
Выводы: Наибольшая положительная корреляция наблюдается между уровнем удовлетворенности работой и фактическим уровнем продуктивности (0.89). Это может свидетельствовать о том, что высокая удовлетворенность работой способствует повышению продуктивности. Низкая корреляция между временем, проведенным в социальных сетях, и другими переменными, такими как продуктивность или стресс, что указывает на то, что время, потраченное в соцсетях, не оказывает значительного воздействия на эти факторы. Отсутствие корреляции между количеством чашек кофе в день и другими переменными может означать, что потребление кофе не связано напрямую с продуктивностью, стрессом или удовлетворенностью работой.
График № 5: Общая тенденция
Через график scatter plot (диаграмма рассеяния), который показывает зависимость между временем, проведённым в социальных сетях (по оси X), и фактической продуктивностью (по оси Y), также добавлена линия тренда (регрессионная линия), чтобы наглядно показать общую тенденцию.
plt.figure (figsize=(10, 6)) sns.set_style («white»)
plt.scatter ( x=df[«daily_social_media_time»], y=df[«actual_productivity_score»], color="
sns.regplot ( x=df[«daily_social_media_time»], y=df[«actual_productivity_score»], scatter=False, line_kws={"color»: «
plt.title («Продуктивность vs Время в соцсетях», fontsize=16, pad=15) plt.xlabel («Часы в соцсетях в день», fontsize=12) plt.ylabel («Фактическая продуктивность», fontsize=12) plt.grid (axis='both', alpha=0.2, linestyle='--')
for spine in plt.gca ().spines.values (): spine.set_edgecolor ('#9370DB') spine.set_linewidth (1.5) plt.tight_layout () plt.show ()
Выводы: Видна отсутствие явной зависимости между временем, проведённым в социальных сетях, и фактической продуктивностью. Точки рассеяны по графику без выраженной закономерности. Линия тренда практически горизонтальна, что подтверждает вывод о незначительном влиянии времени в соцсетях на продуктивность.
Таким образом, можно сделать вывод, что время, проведённое в социальных сетях, не имеет существенного воздействия на фактическую продуктивность пользователей.
Заключение
Несмотря на большое количество времени, которое многие пользователи проводят в социальных сетях, исследование показало, что это время не оказывает прямого воздействия на их продуктивность. Основными факторами, влияющими на продуктивность, являются внутреннее удовлетворение работой и другие личные характеристики, а не время, проведённое в социальных сетях.
Ссылки