Добавить в цитаты Настройки чтения

Страница 10 из 12

Сегодня мы познакомимся с одним важным инструментом для того, чтобы дать ИИ понять, на что именно ему нужно обратить внимание при генерации изображения – это функция «вес слова». Как мы с ней работаем? В полях Prompt и Negative Prompt выделяем скобками те слова, которые вам кажутся наиболее важными, при этом чем больше скобок окружают слово или словосочетание, тем больший вес оно приобретает в «глазах» нейросети. Допустим, запись может выглядеть так: (реалистичное лицо), ((гладкая текстура кожи)), (((идеально нарисованные пальцы))) и т.д. Непосредственно в тексте эти слова будут автоматически выделяться разными цветами – синим, красным и т.п.

Ну что, начинаем работать? В этот раз мы с самого начала пропишем наши «условия» как в поле Prompt, так и в Negative Prompt. Тем самым мы сразу дадим нейросети понять, что мы желаем и чего не желаем видеть на снимке. Ну а слова в скобках уже сами будете выделять: вы лучше знаете, что для вас важнее.

Шаг 1

«Высокореалистичная уличная фотография: на переднем плане молодой человек в костюме, сидя на корточках, кормит голубей. Птицы гуляют по мощеной площади. На заднем плане на площади европейского города работает фонтан. Совершенная анатомия лица, идеальные реалистичные руки и пальцы, идеальная текстура кожи человека. Высокореалистичная текстура зданий, тротуара, воды в фонтане и фигур людей. Композиция с энергичным, необычным ракурсом. Естественный уличный свет днем после 17 часов, непрямые лучи солнца дают мягкое, но в то же время динамичное освещение картины. Длинный телеобъектив установлен под широким углом, чтобы создать глубину и ощущение перспективы в кадре. Увеличение масштаба с помощью зум-объектива, чтобы показать мужчину в центре кадра: акцент на его фигуре. -ar 3:2, high res, 8k, -testp, -beta -beta -beta».

Highly realistic street photography: in the foreground, a young man in a suit feeds pigeons while squatting. Birds walk on the paved square. In the background a fountain is working in the square of a European city. Perfect face anatomy, ideal realistic hands and fingers, perfect human-like skin texture. Highly realistic texture of buildings, pavement, fountain water, and people’s figures. A composition with an energetic, unusual angle. Natural street light in the afternoon, after 5 p.m. , the indirect rays of the sun give a soft, but at the same time dynamic lighting of the picture. The long telephoto lens is mounted at a wide angle to create depth and a sense of perspective in the frame. Zoom in to show the man as the center of the shot: focus on his solitary figure. -ar 3:2, HQ, -testp,8k, -beta -beta -beta.

Negative Prompt

«Уродливое нереалистичное лицо человека, неестественная поза человека, ужасно смоделированные руки и пальцы, нереалистично нарисованная вода в фонтане, нереалистичные птицы».

Ugly unrealistic human face, u

В основном промпте мы ввели термин, употребляемый при работе с нейросетью: -ar 3:2. Вы наверняка догадались, что буквы -ar – это не что иное, как сокращение от Aspect Ratio – «формат изображения». И хотя эта функция есть в отдельном поле приложения, но если теперь вы вдруг увидите в сети промпт с такими символами, то будете знать, что они означают.

Еще вы, наверное, заметили, что мы прямо на первом этапе работы ввели специальные символы, характерные для промптов, которые обычно прописывали в конце. Мы это сделали для того, чтобы нейросеть с самого начала принялась улучшать качество снимка и в конце довела его до совершенства.

Рис. 17. Мужчина, кормящий птиц на городской площади





Итак, вот что у меня получилось примерно с двадцатой попытки получить мало-мальски вразумительное изображение при постоянных изменениях и дополнениях в окнах Prompt и Negative Prompt: довольно адекватная (хотя и пустоватая на среднем плане) композиция, анатомически верная фигура сидящего на корточках человека, человеческое (слава богу!) лицо с чертами, не вызывающими ступора. Строение кисти, правда, немного настораживает, ну да ладно, в глаза вроде не сильно бросается, исправим в дальнейшей работе.

Лицо мужчины окончательно приобрело свой человеческий вид после того, как я перевел его в высокое разрешение. Чтобы сделать это, вам нужно на странице снимка с его описаниями (в разделе History вашего личного кабинета) нажать внизу желтую кнопку High-res fix («перевод в высокое разрешение»), на которой пока что в красном поле написано Unlock («разблокировать»). Когда вы разблокируете эту функцию путем просмотра рекламы, вам станет доступна шкала с тремя режимами улучшения качества снимка: Followoriginal, Normal, MoreCreative («Близко к оригиналу», «Нормальный», «Более творческий»). Можете поэкспериментировать с каждым из них, а можете сразу выбрать третий, он дает самое высокое качество.

Так как изображение человека – самая «опасная зона» при работе с нейросетью, то на остальные ляпы пока можно не обращать внимания, хотя их здесь предостаточно: птички неопределенной породы; какие-то плоские, почти картонные дома; явно рисованный фонтан и летающая над ним птица – судя по размерам, не меньше орла.

Теперь будем исправлять и улучшать изображением, придавая ему максимально близкое сходство с настоящим снимком. Для этого нам необходимо задать настройки для фотоаппарата – так до нейросети скорее дойдет, что мы хотим получить фотографию, а не образчик реалистического рисунка.

Шаг 2

«Canon 5DS R, объектив Canon EF 70-200mm f/2.8L IS II USM, штатив. 1/200 с, f/7.1, ISO 200, зум установлен на фокусное расстояние 105 мм».

Canon 5DS R, a Canon EF 70-200mm f/2.8L IS II USM lens; tripod. 1/200 s, f/7.1, ISO 200, the lens zoom is set to 105mm focal length.

Рис. 18. Мужчина, кормящий птиц на городской площади

Итак, давайте посмотрим, есть ли у нас улучшения… Да, фотография однозначно стала более качественной! Благодаря неглубокому полю резкости, полученному в результате установки диафрагмы в режим f/7.1, у изображения появился объем, что позволило, как говорят фотографы, «отбить» мужчину от фона и выдвинуть его зрительно на первый план. Лицо персонажа теперь более живое, улучшилась анатомия его правой кисти – строение пальцев больше не вызывает вопросов. Фонтан стал более реалистичным и уже не выглядит как иллюстрация к сказке Андерсена. Улетел орел, паривший над фонтаном – пожелаем ему доброго пути! У строений благодаря «воздуху» на снимке появился объем, и они больше не создают впечатление картонных коробок.

Словом, мы еще раз убедились в том, что использование числовых настроек камеры сразу поднимает снимок на новый качественный уровень! Нейросеть сама ведь состоит из набора цифровых символов, поэтому иногда число может дать ей более понятную (и гораздо более краткую, чем словесное описание) инструкцию. Так что советую разобраться с базовыми установками фотоаппарата на уровне экспозиции (выдержка + диафрагма + светочувствительность) и ознакомиться с основными типами объективов.