
концепция
В современном мире рынок криптовалюты набирает популярность с каждым днем все больше и больше. Самой известной и дорогой на рынке сейчас является Bitcoin — виртуальная монета с ценой около $85 000
В первую очередь криптовалютой интересуются молодые люди — активные пользователи социальных сетей. Поэтому было принято использовать базу данных, изучающую новости о Bitcoin именно в соц. сетях (в нашем случае — профильные СМИ). В качестве анализируемого материала я выбрала базу данных Crypto News + с сайта Kaggle.

В ходе анализа датасетов я посчитала подходящими следующие виды графиков, поскольку нашла их наиболее релевантными и наглядными для визуализации данных:
Столбчатая диаграмма Облако слов Круговая диаграмма Линейная диаграмма
оформление

Стиль оформления проекта базируется на аудитории (молодых людях), поэтому выбор пал на мультяшную яркую графику в цветах самой монеты
предварительная подготовка
В этом проекте я использую два Dataset для более полного анализа данных и получения точной статистики.
Первая база данных взята из источника yahoo finance и загружена посредством кода. Эта база данных хранит статистику дата — цена Bitcoin c октября 2021 по декабрь 2023.
Вторая база данных (Crypto News +) была взята с Keggle. В ней собраны все новости с упоминанием Bitcoin с октября 2021 по декабрь 2023.
итоговые графики
— цена Bitcoin
Этот график дает контекст для анализа других графиков, таких как количество новостей и тональность.
Цена биткоина пережила значительные колебания: пик в конце 2021, спад в 2022 и восстановление в 2023
— топ 10 ключевых слов в новостях о Bitcoin
Новости о биткоине в основном фокусируются на цене, рыночных трендах и технических аспектах, таких как майнинг и блокчейн.
— облако слов
Облако слов подчеркивает, что цена и рыночные тренды — центральные темы в новостях о биткоине.
— тональность новостей
Большинство новостей о биткоине имеют позитивный или нейтральный сентимент, что может отражать оптимизм на рынке.
— количество новостей о Bitcoin
Количество новостей, вероятно, коррелирует с ключевыми событиями на рынке: Пики в количестве новостей могут совпадать с резкими изменениями цены (например, ноябрь 2021 — пик цены, или ноябрь 2022 — крах FTX).
— цена Bitcoin и 30-дневная скользящая средняя тональность новостей
Корреляция между ценой и тональностью новостей практически отсутствует, что говорит о слабой связи между сентиментом новостей и ценой.
Однако можно заметить некоторые закономерности: Во время роста цены (например, конец 2021 или 2023) тональность может быть более позитивной.
Во время падения цены (например, 2022) тональность может становиться более негативной.
Тональность новостей слабо коррелирует с ценой (0.03), но может отражать рыночные настроения с запаздыванием.
— волатильность цены и количество новостей, упоминающих регуляцию
Этот график показывает волатильность цены биткоина (зеленая линия) и количество новостей с ключевым словом 'regulation' (оранжевые линии). Мы видим, что пики новостей о регулировании в конце 2021 года, в апреле 2022 и в конце 2023 года совпадают с пиками волатильности. Например, в апреле 2022 года волатильность достигла 0.08, и в это же время было до 1.5 новостей о регулировании в день. Однако общая корреляция между волатильностью и новостями о регулировании равна нулю, что говорит о том, что влияние таких новостей на волатильность носит локальный характер.
— обучение модели LTSM для прогнозирования цены Bitcoin
Модель предсказывает цену с ошибкой 1664 доллара на обучающей выборке и 2476 долларов на тестовой выборке. Это составляет примерно 3–15% от цены биткоина, что является приемлемым результатом для такой волатильной задачи.
Модель LSTM показала, что новости и исторические данные о цене могут быть использованы для предсказания трендов цены биткоина. Хотя модель хорошо улавливает общие тенденции, она сглаживает резкие скачки, что делает её более подходящей для долгосрочных прогнозов. Ошибка предсказания (3–15%) указывает на умеренную точность, но её можно улучшить с помощью дополнительных данных или настройки модели.
вывод
Это исследование показало, что новости о биткоине в основном рассказывают о его цене, рыночных тенденциях и технических деталях, таких как майнинг и блокчейн, а их настроение чаще всего позитивное или нейтральное. Я выяснила, что новости не сильно влияют на стоимость биткоина и её колебания, а скорее отражают то, что уже происходит на рынке. Даже новости о регулировании не играют большой роли в изменении цены. Я также попробовала предсказать цену с помощью специальной модели, которая хорошо улавливает общие тенденции, но не всегда точна для новых данных. В итоге стало ясно, что для понимания движений цены биткоина нужно смотреть не только на новости, но и на другие факторы, например, общую экономическую ситуацию. Чтобы делать более точные прогнозы, стоит изучить больше данных и использовать более сложные подходы.
промты и использованные нейросети
Adobe Color генерация цветовой палитры и ее редактирование на основе загруженного изображения
Recraft (исп. стиль генерации)
создание обложки и иллюстраций для проекта (см. экраны 4, 7, 19, 53)
Grok помощь в интерпретации данных и обращение за советами по улучшению кода (промты отмечены *)