
Описание проекта

Проект представляет собой анализ данных о распространении COVID-19 в мире. Используются данные из файла worldometer_coronavirus_daily_data.csv, который содержит ежедневную статистику по новым случаям, смертям, общему количеству случаев и смертей, а также активным случаям по странам. Основная цель проекта — выявить глобальные и страновые тенденции, проанализировать динамику распространения вируса, а также визуализировать ключевые показатели.
Практическая польза

Проект может быть полезен для:
Эпидемиологов и врачей: Понимание динамики распространения вируса и выявление наиболее пострадавших стран.
Политиков и руководителей: Принятие решений на основе данных о темпах роста и уровнях летальности.
Исследователей: Использование визуализаций и выводов для дальнейшего анализа.
Типы диаграмм, используемых в проекте:
Линейные графики — для отображения динамики случаев и смертей.
Столбчатые диаграммы — для сравнения стран по количеству случаев и смертей.
Тепловая карта — для визуализации среднего количества новых случаев по странам и месяцам.
Интерактивная карта мира — для отображения распространения COVID-19 по странам.
Графики с областями — для сравнения темпов роста между странами.
Этапы работы
1. Загрузка и предварительная обработка данных Загрузка данных: Данные загружаются из CSV-файла.
Преобразование даты: Столбец date преобразуется в формат datetime.
Заполнение пропущенных значений: Пропущенные значения в числовых столбцах заполняются нулями.
Создание новых признаков: Добавляются колонки с месяцем, днем, годом и летальностью (отношение смертей к случаям).
2. Анализ мировых тенденций Группировка данных по датам: Рассчитываются суммарные показатели по всему миру.
Скользящее среднее: Добавляется 7-дневное скользящее среднее для сглаживания данных.
Анализ по странам: Выделяются топ-10 стран по количеству случаев и смертей.
3. Визуализация данных Линейные графики: Отображаются общее количество случаев и смертей, а также ежедневные новые случаи и смерти с 7-дневным скользящим средним.
Столбчатые диаграммы: Сравниваются топ-10 стран по количеству случаев и смертей.
Тепловая карта: Визуализируется среднее количество новых случаев по странам и месяцам.
Интерактивная карта мира: Отображается распространение COVID-19 по странам с использованием библиотеки Plotly.
4. Анализ летальности Расчет летальности: Рассчитывается уровень летальности для стран с более чем 1000
5. Сравнительный анализ стран Линейные графики: Сравниваются кумулятивные случаи и темпы роста для выбранных стран.
Интерактивная визуализация: Создается интерактивный график для сравнения тенденций по странам.
6. Выводы Общие тенденции: Анализируются общее количество случаев и смертей, уровень летальности.
Пиковые значения: Определяются периоды с наибольшим количеством новых случаев и смертей.
Распространение по странам: Выделяются страны с наибольшим количеством случаев и смертей.
Темпы роста: Анализируются средние темпы роста по странам.
Загрузка данных
Загружаются данные из CSV-файла, содержащего ежедневную статистику по COVID-19. Это отправная точка для всего анализа.
Преобразование даты и создание новых признаков
Дата преобразуется в формат datetime для удобства анализа. Добавляются новые признаки, такие как месяц и уровень летальности (отношение смертей к случаям).
Группировка данных по датам и расчет скользящего среднего
Данные группируются по датам для анализа глобальных тенденций. Добавляется 7-дневное скользящее среднее для сглаживания ежедневных колебаний.
Создание тепловой карты
Данные группируются по странам и месяцам, затем преобразуются в формат, подходящий для тепловой карты. Карта визуализирует среднее количество новых случаев по странам и месяцам.


Интерактивная карта мира
Создается интерактивная карта мира, которая отображает общее количество случаев по странам. Цветовая шкала показывает интенсивность распространения.
Анализ летальности
Анализируется уровень летальности в странах с более чем 1000 случаев. Строится столбчатая диаграмма для визуализации стран с самым высоким уровнем летальности.
Итоги
1. Общие тенденции: - Всего зарегистрировано 520,833,195 случаев COVID-19 во всем мире. - Общее количество смертей составило 6,287,654. - Средний уровень летальности по миру: 1,21%.
2. Пиковые значения: - Наибольшее количество новых случаев (3,829,248) было зарегистрировано 01.21.2022. - Наибольшее количество новых смертей (16,834) было зарегистрировано 01.21.2021.
3. Распространение по странам: - Страна с наибольшим количеством случаев: USA (84,209,473 случаев). - Страна с наибольшим количеством смертей: USA (1,026,646 смертей).
4. Летальность: - Страна с самым высоким уровнем летальности (среди стран с не менее 1000 случаев): Yemen (18.18%).
5. Динамика распространения: - Страна с самым высоким средним темпом роста: Italy (2.47% в день). - Страна с самым низким средним темпом роста: China (0.63% в день).
6. Временные периоды: — Месяц с наибольшим количеством новых случаев в среднем: Jan-2022 (2,901,408 случаев в день). - Месяц с наибольшим количеством новых смертей в среднем: Jan-2021 (13,754 смертей в день).
Выводы
Проект представляет собой комплексный анализ данных о COVID-19, начиная от загрузки и предварительной обработки данных и заканчивая визуализацией и формулированием выводов. Он позволяет не только понять глобальные тенденции, но и сравнить ситуацию в разных странах, что делает его полезным инструментом для исследователей, врачей и политиков.
Датасет, ссылки и код