1. Можно ли как то генерировать лицо в двух вариантах, что одно и то же лицо было в профиль и анфас? Если нет, то можно ли как то лицо смотрящее в камеру повернуть вбок ну если не на 90 градусов, то хотя бы на 45.
2.Мне нужно чтоб лицо было освещено равномерно без жёстких теней, типа света падающего сбоку из окна, как сделать?
Если кто разбирается, напишите плиз какие запросы писать по первому и по второму пункту.
Один из способов по первому пункту это использовать контрол нет и карты глубины, которую можно сделать в Дазе, либо в любом другом софте(ну либо другие модели опен поз или канни), далее нужно залочить удачный Сид, по дефолту он там на минус 1 стоит, чтобы постоянно генерировать что-то новое, когда находите удачный, копируте его и вставляете вместо -1.
По второму пункту, свет можно нарисовать в фотошопе типо такого закинуть пнг в image to image и сгенерировать изображение с той же самой картой глубины и с базовым описанием. Способов много, но генерировать пытаться всё через теги дело очень тяжёлое, там очень много от самой модели зависит.
Zairus спасибо за ответ. Я сгенерировала одну картинку, лицо в анфас, то есть смотрящее на нас в камеру. Хочу иметь это же лицо но в профиль.
У вас карты глубины это дазовская модель повёрнутая несколько раз на разный угол, и потом вы с неё сделали карты глубины ? контрол нет я уже скачала и модели к нему тоже. У меня есть одна картинка портрет хочу иметь эту девушку в профиль. Заранее спасибо.
А вот дальше я ничего не поняла. Можете в личку по шагам написать что делать ?
Все что касаемо SD рекомендую смотреть тут - https://youtube.com/@XpucT?feature=shared
На бусти у него тоже есть отдельные уроки, но в целом все основное доступно...
Актуальные сборки тут - https://huggingface.co/XpucT
P.S. Zairus спасибо за интересный гайд.
Видите, тут в принципе товарищ LightZergo прав, человек там очень хорошо всё про базу рассказывает и с ней лучше всё-таки разобраться для своего удобства. Я не буду прям всё расписывать, но покажу просто как я бы эту ситуацию решил, если бы мне было нужно. Я пользуюсь веб интерфейсом от automatic 1111.
Вот например я сгенировал картинку, она мне понравилась.
Но хочу, чтобы было в анфас и что-то похожее на девушку с картинки.
Для начало нужно заблочить seed.
Нужно просто нажать на зеленые стрелочки.
Далее идём и делаем карту глубины для этой картинки.
Потом нам нужно идти во вкладку img to img, а точнее в inpaint, там зарисовываем область головы и шеи, ну вообщем примерно так
Потом ищем где-нибудь картинку, где что-то похожее на то что нам нужно и идём в фотошоп, гимп, не важно и грубо совмещаем с нашей базовой картинкой(которая у нас в профиль в данном случае) и получаем примерно такого франкенштейна. Идём в контрол нет и там генерируем новую карту глубины. Первую можно использовать, чтобы в фотошопе немного подрехтовать новую, потому что она будет кривоватая, чтобы какие-то основные детали сохранить типо брони или одежды, я здесь честно её не использовал, потому что область Inpaint маленькая, но на всякий случай сделал.
Вставляем нашу новую Франкетшнейновскую карту глубины в контрол нет, не забыть там отключить препроцессор, по ситуации вес Control weight, нужно уменьшать по дефолту он там 1. И уже с тем же самым описанием в инпейнте при примерном денойзинге в 0.7, 0.75, (разрешение зависит от ситуации и от размера картинки), генерируем новое изображение.
Это довольно грязный метод, вопросы к анатомии могут возникнут в некоторых ситуациях. Но придится с чем-то мирится, если мы работаем без предварительной подготовки, как в моём первом примере. Чтобы база была на чём то основана, типо Дазовской модельки, которую мы можем позить как хотим и на основе карт Глубины, контуров и чего угодно, что поддерживает контрол нет, либо Open Pose, тоже довольно хорошее средство. Как еще один из вариантов можно использовать теги, типо full face, turning head и всё такое, но они могут не помочь и скорее всего не помогут, если модель умная, то в теории сработать может. Очень много хороших туториалов на ютубе в принципе, там на все случаи жизни. Мой личный совет, использовать 3d модели для базовых поз, так у вам будет гораздо больше возможностей контроля и способов повлиять на вашу работу не теряя связи между картинками. Да елси выставить Денойзинг на мксимум у вас скорее всего сработают теги, но общего с предыдущим изображением останется мало. Как-то так.