Описание проекта
В рамках данного проекта я обучил генеративную нейросеть Stable Diffusion на основе визуального материала из культового веб-сериала в жанре analog horror/VHS horror — The Mandela Catalogue.
Выбор именно этого сериала был обусловлен его уникальной визуальной эстетикой, атмосферой тревоги и искажения привычной реальности. Его выразительный язык VHS-записей, глитч-эффектов и мрачных, почти параноидальных образов идеально подходит для изучения и воссоздания характерной среды аналогового ужаса с помощью нейросетевых технологий.
Проект не только исследует границы синтетического изображения, но и отсылает к феномену коллективного страха в цифровую эпоху, где тревожное может прятаться за знакомыми экранами.
Примеры изображений
Созданные своим ИИ изображения
Разбор итоговой серии изображений
Что представлено в итоговой серии изображений
Нейросеть сгенерировала несколько образов, каждый из которых вдохновлён визуальным языком The Mandela Catalogue. В изображениях представлены:
— тревожные силуэты
— искажённые лица
— пустые интерьеры
— зловещие тени
— стилизованные под VHS/analog‑horror сцены
Все кадры выдержаны в едином тоне: приглушённая палитра с фиолетово-серыми оттенками и «плёночной» текстурой.
Связь с концепцией проекта
Образы чётко передают атмосферу The Mandela Catalogue:
— тревога на грани с паранойей
— неустойчивое чувство времени и пространства
— присутствие чего-то потустороннего, но неявного
— визуальные коды (телевизоры, силуэты в дверях, пустые углы)
Особенно хорошо отражены:
— эстетика «аналога» (шумы, цветовой дрифт, неестественная резкость);
— дух «инструктажей», где лица теряют человечность;
— тема двойников и альтернатив, как визуальный мотив искажения человеческой природы.
Разбор характеристик изображений
Сильные стороны:
— Изображения достаточно точно воспроизводят образы «альтернатив»: смазанные, тёмные, с акцентом на глаза/рот.
— Изображение с комнатой с лицом вдалеке успешно передает атмосферу, как будто «альтернатива» наблюдает из самого пространства.
— Изображение с телевизором в углу — великолепный символ тревожного наблюдения. Пустота и мрак за экраном говорят сами за себя.
Моменты, которые можно доработать:
— Изображения можно было бы чуть сильнее стилизовать, например добавлением визуального шума или глитчей/искажений
Обработка и технические детали
Для реализации проекта использовалась генеративная нейросеть Stable Diffusion XL (SDXL), дообученная с помощью методов DreamBooth и LoRA (Low-Rank Adaptation) в среде Google Colab с использованием GPU уровня T4.
DreamBooth позволил встроить в модель образы и стили конкретного визуального источника (The Mandela Catalogue) путём fine-tuning на небольшой кастомной выборке кадров из сериала.
LoRA обеспечил более эффективное дообучение за счёт замены полных весов на низкоранговые матрицы, что сократило требования к ресурсам и ускорило процесс.
Для оптимизации процесса применялись:
— Mixed precision training (fp16) — уменьшение потребления памяти без потери качества;
— Gradient checkpointing — для обработки больших batch size без превышения лимитов VRAM;
— AdamW 8-bit оптимизатор — для снижения нагрузки на GPU-память.
Генерация финальных изображений велась через pipeline diffusers, где обученные веса LoRA и DreamBooth были загружены в pre-trained SDXL. Результаты сохранялись в разрешении 1024×1024 пикселя.
Дополнительных стадий постобработки (например, апскейлинга или ретуши) не применялось — визуальные характеристики достигнуты исключительно за счёт fine-tuning модели и правильно настроенных промптов.
Визуальный анализ вариаций
Вариации охватывают три основные категории:
— Лица — крупный план, искажённые, с провалами в глазницах или ртах
— Интерьеры/комнаты — пустые сцены с тревожной атмосферой
— Силуэты/фигуры — тёмные фигуры на фоне
Все изображения визуально единообразны, но каждое предлагает свою вариацию страха: через пустоту, наблюдение или нечеловеческое искажение.
Итог
Генерации получились выразительными и стилистически выверенными. Проект достиг своей цели: обученная нейросеть смогла воссоздать эстетику analog horror и сформировать визуальный язык, отсылающий к The Mandela Catalogue без прямого копирования.
Дополнительные материалы (изображения ИИ на чекпоинте 250/500)