Original size 2480x3500

Мозаичный Мир

The project is taking part in the competition

Концепт проекта

Попробовала заставить нейросеть «разбить» реальность на цветные стеклышки. Цель — научить LoRA имитировать не просто картинку, а саму технологию витража. Суть в двух ключевых элементах: во-первых, жирные, темные «свинцовые» контуры, которые делят изображение на отдельные фракции. Во-вторых, чистые, насыщенные, как бы светящиеся изнутри цвета внутри этих фракций.

Датасет

Original size 2490x510

Источники: Pexels, Unsplash, Pixabay, и не забывайте про Flickr Commons (там много старых, аутентичных изображений). Запросы: Ищу «stained glass», «stained glass window». Важно: Не беру только общие планы соборов. Обязательно нужны макро-снимки, где модель сможет «разглядеть» текстуру стекла и то, как выглядят эти черные спайки вблизи.

Финальная серия генераций

Original size 1024x1024

Original size 1036x46

Original size 913x883

Original size 1078x48

В итоговой серии (на fluffy white cat виден успех: модель отказалась от имитации шерсти и сгруппировала ее в гладкие, плоские 'стеклышки'. Это доказывает, что LoRA научилась стилю, а не просто «перекрашиванию».

Original size 1000x40

Модели удалось:

Original size 880x867

Уверенно добавлять черные контуры (самое важное!)

Original size 807x703

Значительно «уплощать» цвета внутри сегментов

Original size 999x924

Original size 827x864

(Ключевой момент) Игнорировать фотографические тени и блики, заменяя их чистым, «светящимся» цветом.

Детали генерации

Original size 2316x1204

Ключом к успеху стала подготовка данных. Использование префикса a stained_glass_art of, позволило BLIP определить объект (e.g., a cat), а LoRA научилась, что stained_glass_art — это «метод», применяемый к этому объекту.

Ноутбук с кодом

Original size 1006x221

Мозаичный Мир

Polina Hodakova

artificial intelligence

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...