Полное руководство по Nano Banana Pro: 10 советов для профессионального создания ассетов
Перевел Александр Доброкотов для Ai Molodca (подписываетесь или не подписывайтесь — управляйте своей жизнью сами).
Оригинал статьи лежит здесь.
Nano Banana Pro — это значительный скачок вперёд по сравнению с моделями предыдущего поколения, переход от «забавной» генерации изображений к «функциональному» профессиональному созданию ассетов. Модель превосходно справляется с рендерингом текста, постоянством персонажей, визуальным синтезом, знанием о мире (Поиск) и выводом в высоком разрешении (4K).
После ознакомления с руководством разработчика о том, как начать работу с AI Studio и API, это руководство охватывает основные возможности и способы эффективного промптинга.
Авторы: Guillaume Vernade, Developer Advocate Gemini, Google DeepMind
Содержание статьи:
- Золотые правила промптинга
- Рендеринг текста, инфографика и визуальный синтез
- Постоянство персонажей и вирусные превью
- Заземление через Google Поиск
- Продвинутое редактирование, реставрация и колоризация
- Трансформация измерений (2D ↔ 3D)
- Высокое разрешение и текстуры
- Мышление и рассуждение
- Быстрое создание раскадровки и концепт-арта
- Структурный контроль и управление компоновкой
🛑 Раздел 0: Золотые правила промптинга
Nano-Banana Pro — это «мыслящая» модель. Она не просто сопоставляет ключевые слова; она понимает намерение, физику и композицию. Чтобы получить лучшие результаты, прекратите использовать «набор тегов» (например, собака, парк, 4k, реалистично) и начните действовать как креативный директор.
1. Редактируйте, а не перегенерируйте
Модель исключительно хорошо понимает разговорные правки. Если изображение правильно на 80%, не генерируйте новое с нуля. Вместо этого просто попросите о конкретном изменении, которое вам нужно.
Пример: "Отлично, но измени освещение на закатное и сделай текст неоново-синим."
2. Используйте естественный язык и полные предложения
Общайтесь с моделью так, как если бы вы давали задание художнику. Используйте правильную грамматику и описательные прилагательные.
❌ Плохо: "Крутая машина, неон, город, ночь, 8k."
✅ Хорошо: "Кинематографический широкий план футуристического спортивного автомобиля, мчащегося по дождливой токийской улице ночью. Неоновые вывески отражаются от мокрого асфальта и металлического корпуса машины."
3. Будьте конкретны и описательны
Расплывчатые промпты дают общие результаты. Определите объект, обстановку, освещение и настроение.
- Субъект: Вместо "женщина" скажите "элегантная пожилая женщина в винтажном костюме в стиле Chanel."
- Материальность: Описывайте текстуры. "Матовая поверхность," "брашированная сталь," "мягкий бархат," "мятая бумага."
4. Предоставляйте контекст ("Зачем" или "Для кого")
Поскольку модель "мыслит", предоставление контекста помогает ей принимать логичные художественные решения.
Пример: "Создай изображение сэндвича для бразильской высококлассной гастрономической книги рецептов." (Модель выведет профессиональную подачу, малую глубину резкости и идеальное освещение).
1. Рендеринг текста, инфографика и визуальный синтез
Nano-Banana Pro обладает передовыми возможностями для рендеринга читаемого, стилизованного текста и синтеза сложной информации в визуальные форматы.
Лучшие практики:
- Компрессия: Попросите модель "сжать" плотный текст или PDF в визуальные материалы.
- Стиль: Укажите, хотите ли вы "отполированный редакционный", "техническую диаграмму" или вид "рисунка на доске от руки".
- Кавычки: Чётко указывайте текст, который хотите видеть, в кавычках.
Примеры промптов:
Инфографика финансового отчёта (загрузка данных):
[Загрузка PDF последнего финансового отчёта Google] "Создай чистую, современную инфографику, резюмирующую ключевые финансовые показатели из этого отчёта. Включи графики для 'Роста выручки' и 'Чистой прибыли', и выдели ключевую цитату CEO в стилизованном блоке."
Ретро-инфографика:
"Создай инфографику в ретро-стиле 1950-х годов об истории американских закусочных. Включи отдельные секции для 'Еда,' 'Музыкальный автомат' и 'Декор.' Убедись, что весь текст читаем и стилизован под эпоху."
Техническая диаграмма:
"Создай ортографический чертёж, описывающий это здание в плане, фасаде и разрезе. Чётко обозначь 'Северный фасад' и 'Главный вход' техническим архитектурным шрифтом. Формат 16:9."
Конспект на доске (образовательный):
"Резюмируй концепцию 'Архитектуры трансформерных нейросетей' как нарисованную от руки диаграмму на доске для университетской лекции. Используй маркеры разных цветов для блоков Энкодера и Декодера, и включи читаемые подписи для 'Self-Attention' и 'Feed Forward'."
2. Постоянство персонажей и вирусные превью
Nano-Banana Pro поддерживает до 14 референсных изображений (6 с высокой точностью). Это позволяет использовать "Фиксацию личности" — размещение конкретного человека или персонажа в новых сценариях без искажения лица.
Лучшие практики:
- Фиксация личности: Явно указывайте: "Сохрани черты лица человека точно такими же, как на Изображении 1."
- Выражение/действие: Опишите изменение в эмоции или позе, сохраняя личность.
- Вирусная композиция: Объедините субъектов с жирной графикой и текстом за один проход.
Примеры промптов:
"Вирусное превью" (Личность + Текст + Графика):
"Создай превью для вирусного видео, используя человека с Изображения 1. Постоянство лица: Сохрани черты лица человека точно такими же, как на Изображении 1, но измени его выражение на взволнованное и удивлённое. Действие: Размести человека слева, указывающим пальцем вправо. Объект: Справа размести качественное изображение вкусного тоста с авокадо. Графика: Добавь жирную жёлтую стрелку, соединяющую палец человека с тостом. Текст: Наложи массивный текст в поп-стиле посередине: '3分钟搞定!' (Готово за 3 минуты!). Используй толстую белую обводку и тень. Фон: Размытый, яркий кухонный фон. Высокая насыщенность и контраст."
Сценарий "Пушистые друзья" (групповое постоянство):
[Загрузка 3 изображений разных плюшевых существ] "Создай забавную историю из 10 частей с этими 3 пушистыми друзьями, отправляющимися в тропический отпуск. История захватывающая с эмоциональными взлётами и падениями и заканчивается счастливым моментом. Сохрани одежду и личность постоянными для всех 3 персонажей, но их выражения и углы должны варьироваться во всех 10 изображениях. Убедись, что в каждом изображении только по одному экземпляру каждого персонажа."
Создание брендовых ассетов:
[Загрузка 1 изображения продукта] "Создай 9 потрясающих модных снимков, как будто они из отмеченной наградами модной редакции. Используй этот референс как стиль бренда, но добавь нюансы и разнообразие в диапазон, чтобы они передавали профессиональный дизайнерский подход. Пожалуйста, сгенерируй девять изображений по одному."
3. Заземление через Google Поиск
Nano-Banana Pro использует Google Поиск для генерации изображений на основе данных в реальном времени, текущих событий или фактической проверки, снижая галлюцинации на актуальные темы.
Лучшие практики:
- Запрашивайте визуализации динамических данных (погода, акции, новости).
- Модель будет "Мыслить" (рассуждать) о результатах поиска перед генерацией изображения.
Примеры промптов:
Визуализация события:
"Создай инфографику о лучших временах для посещения национальных парков США в 2025 году на основе текущих туристических трендов."
4. Продвинутое редактирование, реставрация и колоризация
Модель превосходно справляется со сложным редактированием через разговорный промптинг. Это включает "Инпейнтинг" (удаление/добавление объектов), "Реставрацию" (исправление старых фото), "Колоризацию" (манга/ч/б фото) и "Смену стиля".
Лучшие практики:
- Семантические инструкции: Не нужно вручную создавать маски; просто естественно скажите модели, что изменить.
- Понимание физики: Можно запросить сложные изменения вроде "наполни этот стакан жидкостью" для проверки генерации физики.
Примеры промптов:
Удаление объектов и инпейнтинг:
"Удали туристов с фона этой фотографии и заполни пространство логичными текстурами (булыжники и витрины магазинов), которые соответствуют окружающей среде."
Колоризация манги/комиксов:
[Загрузка чёрно-белой панели манги] "Раскрась эту панель манги. Используй яркую палитру в аниме-стиле. Убедись, что световые эффекты на энергетических лучах светятся неоново-синим, а одежда персонажа соответствует его официальным цветам."
Локализация (перевод текста + культурная адаптация):
[Загрузка изображения рекламы на автобусной остановке в Лондоне] "Адаптируй эту концепцию для токийского окружения, включая перевод слогана на японский. Измени фон на оживлённую улицу Сибуя ночью."
Контроль освещения/сезона:
[Загрузка изображения дома летом] "Преврати эту сцену в зимнее время. Сохрани архитектуру дома точно такой же, но добавь снег на крышу и во двор, и измени освещение на холодный, пасмурный день."
5. Трансформация измерений (2D ↔ 3D)
Мощная новая возможность — преобразование 2D-схем в 3D-визуализации или наоборот. Это идеально для дизайнеров интерьеров, архитекторов и создателей мемов.
Примеры промптов:
2D-план этажа в 3D-доску дизайна интерьера:
"На основе загруженного 2D-плана этажа создай профессиональную презентационную доску дизайна интерьера в одном изображении. Компоновка: Коллаж с одним большим главным изображением сверху (широкоугольная перспектива гостиной) и тремя меньшими изображениями внизу (Главная спальня, Домашний офис и 3D-вид плана этажа сверху). Стиль: Примени стиль Современного минимализма с тёплым дубовым паркетом и кремово-белыми стенами ВО ВСЕХ изображениях. Качество: Фотореалистичный рендеринг, мягкое естественное освещение."
Конвертация 2D-мема в 3D:
"Преврати мем с собакой 'This is Fine' в фотореалистичный 3D-рендер. Сохрани композицию идентичной, но сделай собаку похожей на плюшевую игрушку, а огонь — как реалистичное пламя."
6. Высокое разрешение и текстуры
Nano-Banana Pro поддерживает нативную генерацию изображений от 1K до 4K. Это особенно полезно для детализированных текстур или крупноформатной печати.
Лучшие практики:
- Явно запрашивайте высокие разрешения (2K или 4K), если ваш API/интерфейс это позволяет.
- Описывайте высокоточные детали (несовершенства, текстуры поверхности).
Примеры промптов:
Генерация 4K-текстур:
"Используй нативный высокоточный вывод для создания захватывающей дух, атмосферной среды мшистого лесного покрова. Управляй сложными световыми эффектами и деликатными текстурами, убедившись, что каждая травинка мха и луч света отрендерены в пиксельно-идеальном разрешении, подходящем для 4K-обоев."
Сложная логика (режим мышления):
"Создай гиперреалистичную инфографику гурманского чизбургера, разобранного для показа текстуры поджаренной булочки бриошь, обжаренной корочки котлеты и блестящего расплава сыра. Подпиши каждый слой с его вкусовым профилем."
7. Мышление и рассуждение
Nano-Banana Pro по умолчанию использует процесс "Мышления", где генерирует промежуточные изображения-размышления (не тарифицируемые) для уточнения композиции перед рендерингом финального вывода. Это позволяет анализировать данные и решать визуальные задачи.
Примеры промптов:
Решение уравнений:
"Реши log_{x^2+1}(x^4-1)=2 в C на белой доске. Покажи шаги чётко."
Визуальное рассуждение:
"Проанализируй это изображение комнаты и создай изображение 'до', показывающее, как комната могла выглядеть во время строительства, показывая каркас и незаконченный гипсокартон."
8. Быстрое создание раскадровки и концепт-арта
Вы можете генерировать последовательное искусство или раскадровки без сетки, обеспечивая связный нарративный поток в одной сессии. Это также популярно для "Концепт-арта фильмов" (например, фейковые утечки предстоящих фильмов).
Пример промпта:
"Создай захватывающе интригующую историю из 9 частей с 9 изображениями с участием женщины и мужчины в отмеченной наградами рекламе люксового багажа. История должна иметь эмоциональные взлёты и падения, заканчиваясь элегантным кадром женщины с логотипом. Личность женщины и мужчины и их одежда должны оставаться постоянными, но они могут и должны быть показаны с разных углов и расстояний. Пожалуйста, генерируй изображения по одному. Убедись, что каждое изображение в формате 16:9 ландшафт."
9. Структурный контроль и управление компоновкой
Входные изображения не ограничиваются референсами персонажей или объектами для редактирования. Вы можете использовать их для строгого контроля композиции и компоновки финального вывода. Это переломный момент для дизайнеров, которым нужно превратить набросок на салфетке, вайрфрейм или конкретную сетку в отполированный ассет.
Лучшие практики:
- Черновики и эскизы: Загрузите рисунок от руки, чтобы определить точно, где должен находиться текст и объект.
- Вайрфреймы: Используйте скриншоты существующих компоновок или вайрфреймов для генерации высокоточных UI-макетов.
- Сетки: Используйте изображения сеток, чтобы заставить модель генерировать ассеты для тайловых игр или LED-дисплеев.
Примеры промптов:
От эскиза к финальной рекламе:
"Создай рекламу для [продукта], следуя этому эскизу."
UI-макет из вайрфрейма:
"Создай макет для [продукта], следуя этим рекомендациям."
Пиксель-арт и LED-дисплеи:
"Сгенерируй пиксель-арт спрайт единорога, который идеально вписывается в это изображение сетки 64x64. Используй высококонтрастные цвета." (Совет: Разработчики затем могут программно извлечь центральный цвет каждой ячейки для управления подключённой LED-матрицей 64x64).
Спрайты:
"Спрайт-лист женщины, делающей сальто назад на дроне, сетка 3x3, последовательность, покадровая анимация, квадратный формат. Следуй структуре прикреплённого референсного изображения точно." (Совет: Затем можно извлечь каждую ячейку и создать gif)