
Концепция

Проект направлен на создание персонализированной нейросети для генерации тату-эскизов в моём авторском стиле.
Основная цель — ускорить этап создания эскизов: на основе текстового описания клиента система создаёт несколько вариантов эскизов, которые сохраняют особенности моего стиля и могут быть доработаны вручную уже для сеанса.
Это позволяет:
Датасет

Для обучения использовались 44 оригинальных эскиза, выполненных мной ранее.
Каждый файл был размечен кратким описанием композиции и стиля, что позволило нейросети корректно связать визуальные признаки с текстовыми описаниями.
Результаты генерации

После дообучения модели (на основе Stable Diffusion XL с LoRA-тюнингом) была получена серия изображений, демонстрирующих способность нейросети воспроизводить авторский стиль.






Анализ результатов

Модель успешно передаёт ключевые элементы моего художественного стиля:
Эскизы получаются в едином стиле: даже при разных текстовых описаниях сохраняется визуальная структура, свойственная моим работам.
Нейросеть корректно интерпретирует запрос в объекты (животных, цветы, бытовые предметы) и адаптирует их к стилистике моей графики.
Погрешности в генерации некоторых объектов я приписываю тому, что нейросеть не видела моих примеров создания определенных объектов, поэтому итоговый результат получается более абстрактным. Но это не является проблемой, так как у меня не было большого опыта рисования тех же банок или купюр, нейросеть может помочь мне с «фундаментом» для эскиза, если потребность в таком появится.
Код

Проект был реализован на Kaggle.com GPU P100
Модель была обучена с использованием: — Stable Diffusion XL — LoRA-тюнинга (500 шагов) — кастомных промптов для каждого изображения