Руководство по генерации изображений нейросетью
Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.
Сгенерировать изображение в Telegram-боте
Новости
Стоимость тарифов с 8 января:
- PRO text: 150 руб
- PRO image: 160 руб
- Ultra: 270 руб
- PRO+ text: 590 руб
- PRO+ image: 630 руб
- Ultra+: 1090 руб
- VIP: 6000 руб
Теперь пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792
В январе 2024 после покупки PRO, Ultra+ или VIP пользователь получает скидку 10% на покупку следующего любого тарифа
С ноября 2023 года за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 3 попытки за одну генерацию!!!
Описание генератора изображений
Вам доступны четыре режима для генерации картинок:
- создать изображение
- обработать
- анализ изображения
- улучшить запрос
- увеличить (х4)
Создать изображение
Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).
Доступны четыре версии генерации изображений:
- V1 — версия для анимационных и мультяшных изображений.
- V2 — для кинематографических сценариев и сцен с тёмными эффектами. Мультяшная и кинематографическая модель
- V3 — фотореализм, портретные снимки людей и животных.
- V4 — это объединение версий v1-v3. Для абстрактных изображений, животных, природы, арт объектов. Эта модель лучше распознает текстовый запрос и может рисовать картинки в разных стилях: как в реалистичном, так и в анимационном. Разрешение изображения по умолчанию 1024×1024.
v4 - ограничения!!! В режиме v4 запрещено генерировать контент 18+, в том числе легко эротический контент, знаменитостей, города, достопримечательности. В случае запроса вышеперечисленных тематик картинка будет сгенерирована в версии v1.
- V5 — модель для генерации постеров, логотипов, креативных изображений с текстом.
Параметры V5:
- скорость генерации: 30-40 секунд вне зависимости от настроек steps, разрешения изображения
- ограничения на использование: 18+, насилие, наркотики и символика, нарушающая законы ряда стран
- данные V5 не являются конфиденциальными и могут быть использованы для дообучения нейросети
- тексты для изображений генерирует только на английском языке. Запросы на русском языке автоматически переводятся на английский
- можно подобрать надпись на русском, если использовать латинские буквы
- модель умеет рисовать знаменитостей и брендовые компании, в отличие от модели V4
- в V5 рекомендуется ставить соотношение сторон: 1024х1024, 1024х640 или 640х1024
По умолчанию установлена модель v3. Чтобы применить нужную версию, используйте параметр v_model в таком формате: v_model: v2
Примеры запросов:
рыжий кот сидит на крыше; v_model: v1
красивая девушка стоит на берегу моря; v_model: v2
Примеры изображений
V5
Модели v1, v2, v3, v4
Обработать
Нейросеть обрабатывает изображение пользователя по текстовому запросу.
Больше примеров и подробностей о функции обработки по ссылке.
Анализ изображений
Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.
Примеры анализа изображений:
Запрос: Что ты знаешь про сервис, название которого указано на картинке? Опиши подробно информацию про эту компанию.
Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.
TurboText предлагает множество функций, которые упрощают создание высококачественного контента для предприятий, в том числе:
Удобный интерфейс: TurboText может использовать любой, независимо от его технических знаний.
Широкий выбор шаблонов. TurboText предлагает широкий выбор шаблонов для разных типов контента, что упрощает начало работы.
Запрос: Объясни на русском, в чём суть этого мема?
Ответ: Этот мем о том, что коты всегда готовы повеселиться. В 6 утра они будят свою хозяйку Наташу, чтобы она им помогла выбраться. На фото изображены различные породы кошек, в том числе турецкий ангорский, турецкий ванд, кашмирский, домашний длинношерстный, азиатский полудлинношерстный и персидский.
Запрос: Опиши подробно эту схему
Ответ: Диаграмма показывает компоненты атомной электростанции. Атомная электростанция — это тип электростанции, которая использует ядерную энергию для производства электроэнергии.
На схеме показаны следующие компоненты:
Парогенератор: это устройство, которое превращает воду в пар при соответствующем условии.
Бетонная оболочка: это защитная оболочка, которая окружает реактор и обеспечивает утечку радиации.
Вода под давлением: это теплоноситель, который переносит тепло от реактора к парогенератору.
Структурная каркасная конструкция: это несущественная конструкция, поддерживающая бетонную оболочку и другие компоненты реактора.
Регулирующие стержни: это стержни, которые установлены в реакторе для регулирования режима режима.
Насос: это устройство, которое перекачивает воду под давлением в реактор.
Улучшить запрос
Режим в боте, помогающий пользователям создавать правильные текстовые запросы нейросети для генерации картинок. Достаточно ввести одно слово, после чего искусственный интеллект сам придумает до трех вариантов подходящих развернутых запросов для генерации изображения.
Увеличить
Нейросеть увеличивает изображение в 4 раза и повышает его качество. Максимальное разрешение — 4096х4096.
Возможности и ограничения
Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.
- для генерации картинки нужно ввести от 1 до 60 слов
- время генерации — от 10 до 20 секунд
- размер изображения по умолчанию — 768х768
- введите в текстовом запросе размер 1024х1024, чтобы повысить качество картинки (например, «Милый толстый рыжий кот в очках и ковбойской шляпе играет на гитаре в весеннем лесу, width: 1024, height: 1024)
- изображение можно увеличить до 4096х4096
- между словами в текстовом запросе необходимо ставить запятые. Количество пробелов на результат не влияет
- при запросе с разрешением 1024х1024 нейросеть генерирует только одно изображение
- между текстовым запросом и параметрами ставится точка с запятой ;
- бесплатный режим — 10 попыток
- PRO-режим или Ultra (вместе с попытками в текстах) — по 100 попыток в каждом режиме (стоимость 150 и 270 ₽)
- PRO image+ и PRO text+ — 720 попыток в PRO image+, 216 попыток в PRO text+ (стоимость 630 ₽ и 590 ₽)
- ULTRA+ — Все возможности тарифа PRO_text+ и PRO_image+ (стоимость 1090 ₽)
- VIP-тариф — 10000 попыток для генерации изображений + 3000 попыток для текстов (стоимость 6 000 ₽)
Пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792
Обратите внимание: С 1 октября за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 2 попытки за одну генерацию!!!
Текстовые запросы и параметры
Чтобы изображения получались с первого раза, прорабатывайте текстовый запрос как можно более точно: указывайте детали, стили, дополнительные элементы и т.п. Ниже список подсказок по параметрам, которые можно добавлять в текстовые запросы.
- в моделях v4 и v5 пользователи бесплатного тарифа получают 2 варианта изображения по одному запросу; платные тарифы — 3 изображения.
- команда /default_params — в ней сможете указать параметры по умолчанию, которые будут использоваться в генерации изображений (width, height, style и т.д.). Сделано для того, чтобы не приходилось вводить их вручную постоянно.
- style — стиль изображения. Этот параметр нужно добавить в запрос и через двоеточие указать желаемый стиль — style: realism. Также доступны такие стили: realism, cartoon, anime, cinematic, cyberpunk, steampunk, portrait, dark. Стиль по умолчанию — realism. (не доступно в моделях V4 и V5)
Пример использования параметра style:
- seed – идентификатор изображения. Чтобы получить одно и то же изображение, вводите одинаковый seed. (не доступно в моделях V4 и V5)
- width – ширина изображения. По умолчанию 768, максимум 1024
- height – высота изображения. По умолчанию 768, максимум 1024
рекомендуется использовать такие размеры: 1024х1024, 1024х768, 768х1024, 768х768
- face_restore — параметр для коррекции лица. При использовании изображение увеличивается в 2 раза. Параметр работает только с изображениями 768х768 и менее. Учитывайте, что при добавлении face_restore замедляется скорость генерации на 2 секунды. (не доступно в моделях V4 и V5)
Пример коррекции лица:
face_restore, как и другие параметры, отделяется от текстового запроса точкой с запятой. Например: голубоглазая блондинка с короткой стрижкой; face_restore
- steps – кол-во шагов. Чем больше шагов, тем выше детализация картинки. Максимально возможное количество шагов — 100 при разрешении не более 768х768. При разрешении 1024х1024 максимальное количество шагов 55, устанавливается автоматически. (не доступно в моделях V4 и V5)
- negative_prompt – удаление отдельных деталей на картинке (лишние части тела, предметы, животных). Для активации параметра нужно повторить запрос к картинке, на которой нужно удалить объекты, и зафиксировать seed. (не доступно в моделях V4 и V5). Как на примере ниже:
1 запрос
следующий запрос для устранения лишней лапы. Фиксируем seed и максимально увеличиваем количество шагов steps.
Запросов в negative_prompt можно перечислить несколько через запятую, но в таком случае параметр лучше размещать в конце всего текстового запроса. Нейросеть реагирует на одно-два слова в запросе negative_prompt, фразы из 3+ слов не влияют на результат.
- scale — уровень контрастности изображения. Диапазон значений — от 1 до 20 (не доступно в моделях V4 и V5)
- если на изображении необходимо выделить детали, то прописывайте такие параметры:((сложные детали)), hdr, ((сложные детали, гипердетализация)), высокая детализация. (не доступно в моделях V4 и V5)
- каждое слово в текстовом запросе имеет приоритет над следующим, поэтому самое важное следует располагать ближе к началу. Чем дальше от начала идет слово, тем меньший вес оно имеет. Например:
Не правильно 👇
высокая детализация, 4 к, темный густой лес, красная шапочка сидит на пеньке, яркие большие голубые глаза
Правильно 👇
красная шапочка сидит на пеньке, яркие большие голубые глаза, на фоне темный густой лес, высокая детализация, 4 к
- чтобы повысить вес токена, используйте коэффициент усиления от 0.1 до 2 (оптимально – от 0.5 до 1.5) в таком формате — (токен:коэффициент). Чем выше установлен коэффициент, тем больше приоритета нейросеть отдаст токену. Круглые скобки нужны для отделения ключевых слов и повышения их веса. (не доступно в моделях V4 и V5).
Например:
- чтобы снизить вес токена в текстовом запросе, используйте квадратные кавычки []. (не доступно в моделях V4 и V5). Например:
Примеры использования параметров в текстовых запросах:
- лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, кинематографичный, установочный снимок, чрезвычайно высокая детализация, seed: 123456789, width: 1024, height: 1024
- морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, seed: 123456789, steps: 100, width: 1024, height: 768
- вулкан на пляже, красивый закат, драматическое освещение, кинематографический, установочный снимок, чрезвычайно высокая детализация, объемное освещение, световые лучи, seed: 987654321, width: 1024, height: 1024, steps: 100
- Марго Робби в стиле мультфильма "Холодное сердце", ледяное тело, вся одежда во льду, scale: 20
- милый щенок на снегу в ботинках, (ботинки:1.2), красный ошейник, (голубые глаза:1.5), seed: 864038316
- Комиссар Грета Тунберг, Warhammer 40000, злая, ((сложные детали)), детализированные глаза, hdr, ((гипердетализация)), кинематографический кадр, виньетка
- животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо
- постер к фильму «Взрыв мозга», экшен-сцена, невероятные спецэффекты; style: cinematic
Стили
В текстовом описании можно указать один или несколько стилей для генерации изображения. Подходит для запросов на русском и английском языках.
В V4 добавлены стили художников Mark Ryden, Ryohei Hase, Anton Semenov, Shaun Tan, Tizian, Warhole.
В моделях V2 и V3 доступны стили по ссылке https://sdxl.parrotzone.art/ (название стиля и примеры к нему).
Стили и примеры генерации (доступны для моделей V1-V3):
https://docs.google.com/spreadsheets/d/1uI2yzeHZPdiM1ruleQ0dfGwOfbOyAeFdaR_AeZRvXDM/edit?usp=sharing
Ralph McQuarrie — простые формы ретрофутуризм
Syd Mead — детальные как картины ретрофутуризм
Robert McCall — старый ретрофутуризм без деталей
Klaus Burgle — ч/б фото ретрофутуризм
Ron Cobb — стильные картины, баланс, формы
John Berkey — черезчур детальное, путается
Norman Rockwell — ретрофутуризм
Tristram James Ellis, Michelangelo — античное нежное
Albert Bierstadt — древности, ренессанс
Georges Desvallières — более современное, но все еще старинное
Peregrine Heathcote — упрощённые абстракции
Giovanni Battista Piazzetta — ренессанс
Valentin de Boulogne — ЛЮТЫЙ ренессанс
Ivan Aivazovsky — вода
Ivan Shishkin — деревья, небо
Asher Brown Durand — навроде Шишкина, растения
Maxfield Parrish — навроде Шишкина, нежное
Hans Thoma — детальные ландшафты вроде Шишкина
Thomas Kinkade — красивые пейзажи точками, нежные
Asher Brown Durand — футуризм ландшафты, хорошо сочетается с классикой
Gustave Dore — ЧБ старинные детальные ландшафты вроде Шишкина
gonzalo fuenmayor — ЧБ окружения
Eddie Mendoza — футуризм
Ryan Dening — футуризм
Thomas Kinkad — красочный футуризм
Tyler Edlin — мрачный детальный футуризм
Blizzard Concept Artists — футуризм
Sparth Liang Mark G Liulian Craig Mullins, Finnian MacManus — красивые ландшафты/виды
James Gurney — красиво, растения, динозавры
George Stubbs — красочные спокойные иллюстрации
Kawase Hasui — красочные спокойные ландшафты
Jakub Różalski — около-классические ландшафты
Anton Fadeev — красочные яркие ландшафты
Anato Finnstark — красочные яркие ландшафты
Ismail Inceoglu — красочные яркие ландшафты
Finnian MacManus — футуризм ландшафты окружения
Stefan Koidl — около-сталенхаг
Simon Stalenhag -—сталенхаг
Ludwig Deutsch and Rudolf Ernst — около-сталенхаг
Brock Hofer — линии
Wes Anderson — линии
Denis Villeneuve — линии
Jean Giraud — красивые персонажи сглаженные и абстрактные
Tom Bagshaw — красивые персонажи сглаженные и абстрактные
Edward Hopper — красивые персонажи сглаженные и абстрактные
Rene Margitte — красивые персонажи сглаженные и абстрактные
artgerm — персонажи
Alexander Trufanov — персонажи
Andrei Riabovitchev — красивые персонажи
James Jean — красивые персонажи
Edward Robert Hughes, Henry Justice Ford — красивые персонажи
Rolf Armstrong, Monia Merlo — красивые персонажи
Kezie Demessance — красочные персонажи
Ha Gyung — красочные персонажи
Zac Retz — красочные персонажи
Peter Mohrbacher — красивые персонажи и ландшафты (MTG стиль)
Portrait painting by Arthur Rackham, Eugene de Blaas, Frederic Leighton
— иллюстрации
Naranbaatar Ganbold — детальная прорисовка ЧБ форм персонажей
Katsuya Terada — интересные чб абстрактные персонажи
Alexandros Pyromallis Intaglio — ЧБ персонажи
Marc Simonetti — мрачные эпичные ландшафты
Jonathan Solter -— эпичные ландшафты
Greg Rutkowski — мрачные персонажи-ландшафты
sidwill — мрачные персонажи
Dragan Bibin — мрачные персонажи
Frank Frazetta — мрачные персонажи
jacques callot — чб гравюры детальные
Pieter Claesz — чб гравюры книжные
Geof Darrow — цветные иллюстрации! с линиями
Hasui Kawase — традиционное японское
Zdzisław Beksiński — всякое стрёмное
Wayne Barlowe — всякое стрёмное
Arthur Rackham — всякое стрёмное
Dariusz Zawadzki — всякое стрёмное
Ute Osterwalder — экспериментальные персонажи
Hajime Sorayama — экспериментальные персонажи
Carlos Schwabe — экспериментальные персонажи
Adolf Hirémy-Hirschl — экспериментальные персонажи
Carl Spitzweg — крутые грубые мазки и свет
Еще примеры картинок и запросов к ним
Источник: https://turbocheck.ru/post/rukovodstvo-po-generacii-izobrazhenij-nejrosetju