
Концепт проекта
Попробовала заставить нейросеть «разбить» реальность на цветные стеклышки. Цель — научить LoRA имитировать не просто картинку, а саму технологию витража. Суть в двух ключевых элементах: во-первых, жирные, темные «свинцовые» контуры, которые делят изображение на отдельные фракции. Во-вторых, чистые, насыщенные, как бы светящиеся изнутри цвета внутри этих фракций.
Датасет

Источники: Pexels, Unsplash, Pixabay, и не забывайте про Flickr Commons (там много старых, аутентичных изображений). Запросы: Ищу «stained glass», «stained glass window». Важно: Не беру только общие планы соборов. Обязательно нужны макро-снимки, где модель сможет «разглядеть» текстуру стекла и то, как выглядят эти черные спайки вблизи.
Финальная серия генераций

В итоговой серии (на fluffy white cat виден успех: модель отказалась от имитации шерсти и сгруппировала ее в гладкие, плоские 'стеклышки'. Это доказывает, что LoRA научилась стилю, а не просто «перекрашиванию».


Модели удалось:
Детали генерации
Ключом к успеху стала подготовка данных. Использование префикса a stained_glass_art of, позволило BLIP определить объект (e.g., a cat), а LoRA научилась, что stained_glass_art — это «метод», применяемый к этому объекту.