Original size 2480x3500

Мозаичный Мир

PROTECT STATUS: not protected
1
The project is taking part in the competition

Концепт проекта

Попробовала заставить нейросеть «разбить» реальность на цветные стеклышки. Цель — научить LoRA имитировать не просто картинку, а саму технологию витража. Суть в двух ключевых элементах: во-первых, жирные, темные «свинцовые» контуры, которые делят изображение на отдельные фракции. Во-вторых, чистые, насыщенные, как бы светящиеся изнутри цвета внутри этих фракций.

Датасет

big
Original size 2490x510

Источники: Pexels, Unsplash, Pixabay, и не забывайте про Flickr Commons (там много старых, аутентичных изображений). Запросы: Ищу «stained glass», «stained glass window». Важно: Не беру только общие планы соборов. Обязательно нужны макро-снимки, где модель сможет «разглядеть» текстуру стекла и то, как выглядят эти черные спайки вблизи.

Финальная серия генераций

big
Original size 1024x1024
Original size 1036x46
Original size 913x883
Original size 1078x48

В итоговой серии (на fluffy white cat виден успех: модель отказалась от имитации шерсти и сгруппировала ее в гладкие, плоские 'стеклышки'. Это доказывает, что LoRA научилась стилю, а не просто «перекрашиванию».

Original size 1000x40

Модели удалось:

Original size 880x867
  1. Уверенно добавлять черные контуры (самое важное!)
Original size 807x703
  1. Значительно «уплощать» цвета внутри сегментов
Original size 999x924
Original size 827x864
  1. (Ключевой момент) Игнорировать фотографические тени и блики, заменяя их чистым, «светящимся» цветом.

Детали генерации

Original size 2316x1204

Ключом к успеху стала подготовка данных. Использование префикса a stained_glass_art of, позволило BLIP определить объект (e.g., a cat), а LoRA научилась, что stained_glass_art — это «метод», применяемый к этому объекту.

Original size 1006x221
Мозаичный Мир
1
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more