Руководство по генерации изображений нейросетью

Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.

Новости

Стоимость тарифов с 8 января:

PRO text: 150 руб
PRO image: 160 руб
Ultra: 270 руб
PRO+ text: 590 руб
PRO+ image: 630 руб
Ultra+: 1090 руб
VIP: 6000 руб

Теперь пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792

В январе 2024 после покупки PRO, Ultra+ или VIP пользователь получает скидку 10% на покупку следующего любого тарифа

С ноября 2023 года за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 3 попытки за одну генерацию!!!

Описание генератора изображений

Вам доступны четыре режима для генерации картинок:

создать изображение
обработать
анализ изображения
улучшить запрос
увеличить (х4)

Создать изображение

Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).

Доступны четыре версии генерации изображений:

V1 — версия для анимационных и мультяшных изображений.
V2 — для кинематографических сценариев и сцен с тёмными эффектами. Мультяшная и кинематографическая модель
V3 — фотореализм, портретные снимки людей и животных.
V4 — это объединение версий v1-v3. Для абстрактных изображений, животных, природы, арт объектов. Эта модель лучше распознает текстовый запрос и может рисовать картинки в разных стилях: как в реалистичном, так и в анимационном. Разрешение изображения по умолчанию 1024×1024.

v4 - ограничения!!! В режиме v4 запрещено генерировать контент 18+, в том числе легко эротический контент, знаменитостей, города, достопримечательности. В случае запроса вышеперечисленных тематик картинка будет сгенерирована в версии v1.

V5 — модель для генерации постеров, логотипов, креативных изображений с текстом.

Параметры V5:

скорость генерации: 30-40 секунд вне зависимости от настроек steps, разрешения изображения
ограничения на использование: 18+, насилие, наркотики и символика, нарушающая законы ряда стран
данные V5 не являются конфиденциальными и могут быть использованы для дообучения нейросети
тексты для изображений генерирует только на английском языке. Запросы на русском языке автоматически переводятся на английский
можно подобрать надпись на русском, если использовать латинские буквы
модель умеет рисовать знаменитостей и брендовые компании, в отличие от модели V4
в V5 рекомендуется ставить соотношение сторон: 1024х1024, 1024х640 или 640х1024

По умолчанию установлена модель v3. Чтобы применить нужную версию, используйте параметр v_model в таком формате: v_model: v2

Примеры запросов:

рыжий кот сидит на крыше; v_model: v1

красивая девушка стоит на берегу моря; v_model: v2

Примеры изображений

A MiXit logo is smashed by the MiXit logo cosmetics, foam, 4k, remarkable, professional realistic photo, photography, cinematic, photo, typography

Donald Trump standing behind a American flag holding a sign with text Hello, cinematic; v_model: v5

bed, the inscription "COH" on the wall; v_model: v5

Elon Musk stands in front of a huge rocket with a poster in his hands with the inscription "MACK"; v_model: v5

A Nike logo is smashed by the Adidas logo, 4k, remarkable; v_model: v5

geometric, symmetry, triangle, pyramid, complex, tapestry, logo; v_model: v5

computer brand logo called "MAKC", cinematic, high detail, product, typography, photo; v_model: v5

Smiling cat holding a sign with the inscription "CAT" in his hands

Модели v1, v2, v3, v4

роскошные розовые пионы в вазе; v_model: v1

роскошные розовые пионы в вазе; v_model: v2

роскошные розовые пионы в вазе; v_model: v3

роскошные розовые пионы в вазе; v_model: v4

ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v1

ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v2

ангел крупным планом, ночное небо, крылья, звезды, луна; v_model:v3

красивая молодая женщина, платиновые волосы, без макияжа, черно-белый полосатый свитер, в темно-красных наушниках, у окна, Leica S, Kodak Portra 800, естественный мягкий свет, мягкие размытые тени

Девушка с длинными кудрявыми рыжими волосами, веснушки на лице, натуральная кожа; height: 1024, width: 1024

девушка волчица с белым окрасом смотрит в объектив камеры в капюшоне; V_model: v1

девушка волчица с белым окрасом смотрит в объектив камеры в капюшоне; V_model: v2

девушка волчица с белым окрасом смотрит в объектив камеры в капюшоне; V_model: v3

Померанский шпиц бежит по весеннему лесу и улыбается, весёлая атмосфера; style: anime

красивый пушистый кот с блестящей золотистой шерстью и зелёными глазами; style: portrait

продукт, духи для женщин с названием "McDonalds", яркая презентация товара

Обработать

Нейросеть обрабатывает изображение пользователя по текстовому запросу.

Больше примеров и подробностей о функции обработки по ссылке.

Анализ изображений

Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.

Примеры анализа изображений:

Запрос: Что ты знаешь про сервис, название которого указано на картинке? Опиши подробно информацию про эту компанию.

Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.

TurboText предлагает множество функций, которые упрощают создание высококачественного контента для предприятий, в том числе:

Удобный интерфейс: TurboText может использовать любой, независимо от его технических знаний.

Широкий выбор шаблонов. TurboText предлагает широкий выбор шаблонов для разных типов контента, что упрощает начало работы.

Запрос: Объясни на русском, в чём суть этого мема?

Ответ: Этот мем о том, что коты всегда готовы повеселиться. В 6 утра они будят свою хозяйку Наташу, чтобы она им помогла выбраться. На фото изображены различные породы кошек, в том числе турецкий ангорский, турецкий ванд, кашмирский, домашний длинношерстный, азиатский полудлинношерстный и персидский.

Запрос: Опиши подробно эту схему

Ответ: Диаграмма показывает компоненты атомной электростанции. Атомная электростанция — это тип электростанции, которая использует ядерную энергию для производства электроэнергии.

На схеме показаны следующие компоненты:

Парогенератор: это устройство, которое превращает воду в пар при соответствующем условии.

Бетонная оболочка: это защитная оболочка, которая окружает реактор и обеспечивает утечку радиации.

Вода под давлением: это теплоноситель, который переносит тепло от реактора к парогенератору.

Структурная каркасная конструкция: это несущественная конструкция, поддерживающая бетонную оболочку и другие компоненты реактора.

Регулирующие стержни: это стержни, которые установлены в реакторе для регулирования режима режима.

Насос: это устройство, которое перекачивает воду под давлением в реактор.

Улучшить запрос

Режим в боте, помогающий пользователям создавать правильные текстовые запросы нейросети для генерации картинок. Достаточно ввести одно слово, после чего искусственный интеллект сам придумает до трех вариантов подходящих развернутых запросов для генерации изображения.

Увеличить

Нейросеть увеличивает изображение в 4 раза и повышает его качество. Максимальное разрешение — 4096х4096.

Возможности и ограничения

Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.

для генерации картинки нужно ввести от 1 до 60 слов
время генерации — от 10 до 20 секунд
размер изображения по умолчанию — 768х768
введите в текстовом запросе размер 1024х1024, чтобы повысить качество картинки (например, «Милый толстый рыжий кот в очках и ковбойской шляпе играет на гитаре в весеннем лесу, width: 1024, height: 1024)
изображение можно увеличить до 4096х4096
между словами в текстовом запросе необходимо ставить запятые. Количество пробелов на результат не влияет
при запросе с разрешением 1024х1024 нейросеть генерирует только одно изображение
между текстовым запросом и параметрами ставится точка с запятой ;
бесплатный режим — 10 попыток
PRO-режим или Ultra (вместе с попытками в текстах) — по 100 попыток в каждом режиме (стоимость 150 и 270 ₽)
PRO image+ и PRO text+ — 720 попыток в PRO image+, 216 попыток в PRO text+ (стоимость 630 ₽ и 590 ₽)
ULTRA+ — Все возможности тарифа PRO_text+ и PRO_image+ (стоимость 1090 ₽)
VIP-тариф — 10000 попыток для генерации изображений + 3000 попыток для текстов (стоимость 6 000 ₽)

Пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792

Обратите внимание: С 1 октября за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 2 попытки за одну генерацию!!!

Текстовые запросы и параметры

Чтобы изображения получались с первого раза, прорабатывайте текстовый запрос как можно более точно: указывайте детали, стили, дополнительные элементы и т.п. Ниже список подсказок по параметрам, которые можно добавлять в текстовые запросы.

в моделях v4 и v5 пользователи бесплатного тарифа получают 2 варианта изображения по одному запросу; платные тарифы — 3 изображения.
команда /default_params — в ней сможете указать параметры по умолчанию, которые будут использоваться в генерации изображений (width, height, style и т.д.). Сделано для того, чтобы не приходилось вводить их вручную постоянно.
style — стиль изображения. Этот параметр нужно добавить в запрос и через двоеточие указать желаемый стиль — style: realism. Также доступны такие стили: realism, cartoon, anime, cinematic, cyberpunk, steampunk, portrait, dark. Стиль по умолчанию — realism. (не доступно в моделях V4 и V5)

Пример использования параметра style:

seed – идентификатор изображения. Чтобы получить одно и то же изображение, вводите одинаковый seed. (не доступно в моделях V4 и V5)
width – ширина изображения. По умолчанию 768, максимум 1024
height – высота изображения. По умолчанию 768, максимум 1024

рекомендуется использовать такие размеры: 1024х1024, 1024х768, 768х1024, 768х768

face_restore — параметр для коррекции лица. При использовании изображение увеличивается в 2 раза. Параметр работает только с изображениями 768х768 и менее. Учитывайте, что при добавлении face_restore замедляется скорость генерации на 2 секунды. (не доступно в моделях V4 и V5)

Пример коррекции лица:

голубоглазая блондинка с короткой стрижкой; face_restore

face_restore, как и другие параметры, отделяется от текстового запроса точкой с запятой. Например: голубоглазая блондинка с короткой стрижкой; face_restore

steps – кол-во шагов. Чем больше шагов, тем выше детализация картинки. Максимально возможное количество шагов — 100 при разрешении не более 768х768. При разрешении 1024х1024 максимальное количество шагов 55, устанавливается автоматически. (не доступно в моделях V4 и V5)
negative_prompt – удаление отдельных деталей на картинке (лишние части тела, предметы, животных). Для активации параметра нужно повторить запрос к картинке, на которой нужно удалить объекты, и зафиксировать seed. (не доступно в моделях V4 и V5). Как на примере ниже:

1 запрос

белый шпиц танцует, стоит на задних лапах

следующий запрос для устранения лишней лапы. Фиксируем seed и максимально увеличиваем количество шагов steps.

белый шпиц танцует, стоит на задних лапах; negative_prompt: пятая лапа, seed: 477457978, steps: 100

Запросов в negative_prompt можно перечислить несколько через запятую, но в таком случае параметр лучше размещать в конце всего текстового запроса. Нейросеть реагирует на одно-два слова в запросе negative_prompt, фразы из 3+ слов не влияют на результат.

scale — уровень контрастности изображения. Диапазон значений — от 1 до 20 (не доступно в моделях V4 и V5)

scale 5 — блеклое, естественное, как в пасмурную погоду

scale 10 — солнечное освещение, больше яркости

если на изображении необходимо выделить детали, то прописывайте такие параметры:((сложные детали)), hdr, ((сложные детали, гипердетализация)), высокая детализация. (не доступно в моделях V4 и V5)
каждое слово в текстовом запросе имеет приоритет над следующим, поэтому самое важное следует располагать ближе к началу. Чем дальше от начала идет слово, тем меньший вес оно имеет. Например:

Не правильно 👇

высокая детализация, 4 к, темный густой лес, красная шапочка сидит на пеньке, яркие большие голубые глаза

Правильно 👇

красная шапочка сидит на пеньке, яркие большие голубые глаза, на фоне темный густой лес, высокая детализация, 4 к

чтобы повысить вес токена, используйте коэффициент усиления от 0.1 до 2 (оптимально – от 0.5 до 1.5) в таком формате — (токен:коэффициент). Чем выше установлен коэффициент, тем больше приоритета нейросеть отдаст токену. Круглые скобки нужны для отделения ключевых слов и повышения их веса. (не доступно в моделях V4 и V5).

Например:

девушка с розовыми волосами, украшения с бриллиантами на шее; seed: 6926903312

девушка с розовыми волосами, (розовые волосы:1.5), украшения с бриллиантами на шее; seed: 6926903312

чтобы снизить вес токена в текстовом запросе, используйте квадратные кавычки []. (не доступно в моделях V4 и V5). Например:

девушка с розовыми волосами, [розовые волосы:0.5], украшения с бриллиантами на шее; seed: 6926903312

Примеры использования параметров в текстовых запросах:

лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, кинематографичный, установочный снимок, чрезвычайно высокая детализация, seed: 123456789, width: 1024, height: 1024
морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, seed: 123456789, steps: 100, width: 1024, height: 768
вулкан на пляже, красивый закат, драматическое освещение, кинематографический, установочный снимок, чрезвычайно высокая детализация, объемное освещение, световые лучи, seed: 987654321, width: 1024, height: 1024, steps: 100
Марго Робби в стиле мультфильма "Холодное сердце", ледяное тело, вся одежда во льду, scale: 20
милый щенок на снегу в ботинках, (ботинки:1.2), красный ошейник, (голубые глаза:1.5), seed: 864038316
Комиссар Грета Тунберг, Warhammer 40000, злая, ((сложные детали)), детализированные глаза, hdr, ((гипердетализация)), кинематографический кадр, виньетка
животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо
постер к фильму «Взрыв мозга», экшен-сцена, невероятные спецэффекты; style: cinematic

Стили

В текстовом описании можно указать один или несколько стилей для генерации изображения. Подходит для запросов на русском и английском языках.

В V4 добавлены стили художников Mark Ryden, Ryohei Hase, Anton Semenov, Shaun Tan, Tizian, Warhole.

В моделях V2 и V3 доступны стили по ссылке https://sdxl.parrotzone.art/ (название стиля и примеры к нему).

Стили и примеры генерации (доступны для моделей V1-V3):

https://docs.google.com/spreadsheets/d/1uI2yzeHZPdiM1ruleQ0dfGwOfbOyAeFdaR_AeZRvXDM/edit?usp=sharing

Ralph McQuarrie — простые формы ретрофутуризм

Syd Mead — детальные как картины ретрофутуризм

Robert McCall — старый ретрофутуризм без деталей

Klaus Burgle — ч/б фото ретрофутуризм

Ron Cobb — стильные картины, баланс, формы

John Berkey — черезчур детальное, путается

Norman Rockwell — ретрофутуризм

Tristram James Ellis, Michelangelo — античное нежное

Albert Bierstadt — древности, ренессанс

Georges Desvallières — более современное, но все еще старинное

Peregrine Heathcote — упрощённые абстракции

Giovanni Battista Piazzetta — ренессанс

Valentin de Boulogne — ЛЮТЫЙ ренессанс

Ivan Aivazovsky — вода

Ivan Shishkin — деревья, небо

Asher Brown Durand — навроде Шишкина, растения

Maxfield Parrish — навроде Шишкина, нежное

Hans Thoma — детальные ландшафты вроде Шишкина

Thomas Kinkade — красивые пейзажи точками, нежные

Asher Brown Durand — футуризм ландшафты, хорошо сочетается с классикой

Gustave Dore — ЧБ старинные детальные ландшафты вроде Шишкина

gonzalo fuenmayor — ЧБ окружения

Eddie Mendoza — футуризм

Ryan Dening — футуризм

Thomas Kinkad — красочный футуризм

Tyler Edlin — мрачный детальный футуризм

Blizzard Concept Artists — футуризм

Sparth Liang Mark G Liulian Craig Mullins, Finnian MacManus — красивые ландшафты/виды

James Gurney — красиво, растения, динозавры

George Stubbs — красочные спокойные иллюстрации

Kawase Hasui — красочные спокойные ландшафты

Jakub Różalski — около-классические ландшафты

Anton Fadeev — красочные яркие ландшафты

Anato Finnstark — красочные яркие ландшафты

Ismail Inceoglu — красочные яркие ландшафты

Finnian MacManus — футуризм ландшафты окружения

Stefan Koidl — около-сталенхаг

Simon Stalenhag -—сталенхаг

Ludwig Deutsch and Rudolf Ernst — около-сталенхаг

Brock Hofer — линии

Wes Anderson — линии

Denis Villeneuve — линии

Jean Giraud — красивые персонажи сглаженные и абстрактные

Tom Bagshaw — красивые персонажи сглаженные и абстрактные

Edward Hopper — красивые персонажи сглаженные и абстрактные

Rene Margitte — красивые персонажи сглаженные и абстрактные

artgerm — персонажи

Alexander Trufanov — персонажи

Andrei Riabovitchev — красивые персонажи

James Jean — красивые персонажи

Edward Robert Hughes, Henry Justice Ford — красивые персонажи

Rolf Armstrong, Monia Merlo — красивые персонажи

Kezie Demessance — красочные персонажи

Ha Gyung — красочные персонажи

Zac Retz — красочные персонажи

Peter Mohrbacher — красивые персонажи и ландшафты (MTG стиль)

Portrait painting by Arthur Rackham, Eugene de Blaas, Frederic Leighton

— иллюстрации

Naranbaatar Ganbold — детальная прорисовка ЧБ форм персонажей

Katsuya Terada — интересные чб абстрактные персонажи

Alexandros Pyromallis Intaglio — ЧБ персонажи

Marc Simonetti — мрачные эпичные ландшафты

Jonathan Solter -— эпичные ландшафты

Greg Rutkowski — мрачные персонажи-ландшафты

sidwill — мрачные персонажи

Dragan Bibin — мрачные персонажи

Frank Frazetta — мрачные персонажи

jacques callot — чб гравюры детальные

Pieter Claesz — чб гравюры книжные

Geof Darrow — цветные иллюстрации! с линиями

Hasui Kawase — традиционное японское

Zdzisław Beksiński — всякое стрёмное

Wayne Barlowe — всякое стрёмное

Arthur Rackham — всякое стрёмное

Dariusz Zawadzki — всякое стрёмное

Ute Osterwalder — экспериментальные персонажи

Hajime Sorayama — экспериментальные персонажи

Carlos Schwabe — экспериментальные персонажи

Adolf Hirémy-Hirschl — экспериментальные персонажи

Carl Spitzweg — крутые грубые мазки и свет

Еще примеры картинок и запросов к ним

салат, удивительное фото, вкусное и сочное, Фотография еды, Гурман, объектив f2, 8, 50 мм, Замысловатая детализация, 8k

Мерцающие светлячки освещают путь через причудливый лес высоких грибов и сверкающих ручьев

животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо

Котёнок в очках загорает на пляже, лазурный берег, максимальная детализация, реалистичный стиль

невероятно красивое мороженое из фруктов, яркие краски, брызги повсюду, идеальная форма; v_model: v4, style: cyberpunk

Девушка на фоне большого города; style: realism, steps: 70

горячая кружка какао со взбитыми сливками сверху, с вишней и корицей для украшения, шоколадная стружка; v_model: v2

девушка с розовыми волосами; style: cyberpunk

стеклянная банка с горящим деревом внутри, стоит на скале, боке, океан на заднем плане, латунная крышка, драматическое освещение, гиперреалистичное, высокодетализированное, запутанное, острый фокус

Рентгеновский снимок пуделя; v_model: v4

Очень толстая девочка, героиня сказки "Красная шапочка", кушает пирожки в лесу, истощенные волки наблюдают за девочкой; v_model: v4

Источник: https://turbocheck.ru/post/rukovodstvo-po-generacii-izobrazhenij-nejrosetju