Полное руководство по Nano Banana Pro: 10 советов для профессионального создания ассетов

Полное руководство по Nano Banana Pro: 10 советов для профессионального создания ассетов


Перевел Александр Доброкотов для Ai Molodca (подписываетесь или не подписывайтесь — управляйте своей жизнью сами).
Оригинал статьи лежит здесь.

Nano Banana Pro — это значительный скачок вперёд по сравнению с моделями предыдущего поколения, переход от «забавной» генерации изображений к «функциональному» профессиональному созданию ассетов. Модель превосходно справляется с рендерингом текста, постоянством персонажей, визуальным синтезом, знанием о мире (Поиск) и выводом в высоком разрешении (4K).

После ознакомления с руководством разработчика о том, как начать работу с AI Studio и API, это руководство охватывает основные возможности и способы эффективного промптинга.

Авторы: Guillaume Vernade, Developer Advocate Gemini, Google DeepMind

Содержание статьи:

  1. Золотые правила промптинга
  2. Рендеринг текста, инфографика и визуальный синтез
  3. Постоянство персонажей и вирусные превью
  4. Заземление через Google Поиск
  5. Продвинутое редактирование, реставрация и колоризация
  6. Трансформация измерений (2D ↔ 3D)
  7. Высокое разрешение и текстуры
  8. Мышление и рассуждение
  9. Быстрое создание раскадровки и концепт-арта
  10. Структурный контроль и управление компоновкой

🛑 Раздел 0: Золотые правила промптинга

Nano-Banana Pro — это «мыслящая» модель. Она не просто сопоставляет ключевые слова; она понимает намерение, физику и композицию. Чтобы получить лучшие результаты, прекратите использовать «набор тегов» (например, собака, парк, 4k, реалистично) и начните действовать как креативный директор.


1. Редактируйте, а не перегенерируйте

Модель исключительно хорошо понимает разговорные правки. Если изображение правильно на 80%, не генерируйте новое с нуля. Вместо этого просто попросите о конкретном изменении, которое вам нужно.

Пример: "Отлично, но измени освещение на закатное и сделай текст неоново-синим."


2. Используйте естественный язык и полные предложения

Общайтесь с моделью так, как если бы вы давали задание художнику. Используйте правильную грамматику и описательные прилагательные.

Плохо: "Крутая машина, неон, город, ночь, 8k."

Хорошо: "Кинематографический широкий план футуристического спортивного автомобиля, мчащегося по дождливой токийской улице ночью. Неоновые вывески отражаются от мокрого асфальта и металлического корпуса машины."


3. Будьте конкретны и описательны

Расплывчатые промпты дают общие результаты. Определите объект, обстановку, освещение и настроение.

  • Субъект: Вместо "женщина" скажите "элегантная пожилая женщина в винтажном костюме в стиле Chanel."
  • Материальность: Описывайте текстуры. "Матовая поверхность," "брашированная сталь," "мягкий бархат," "мятая бумага."

4. Предоставляйте контекст ("Зачем" или "Для кого")

Поскольку модель "мыслит", предоставление контекста помогает ей принимать логичные художественные решения.

Пример: "Создай изображение сэндвича для бразильской высококлассной гастрономической книги рецептов." (Модель выведет профессиональную подачу, малую глубину резкости и идеальное освещение).

1. Рендеринг текста, инфографика и визуальный синтез

Nano-Banana Pro обладает передовыми возможностями для рендеринга читаемого, стилизованного текста и синтеза сложной информации в визуальные форматы.

Лучшие практики:

  • Компрессия: Попросите модель "сжать" плотный текст или PDF в визуальные материалы.
  • Стиль: Укажите, хотите ли вы "отполированный редакционный", "техническую диаграмму" или вид "рисунка на доске от руки".
  • Кавычки: Чётко указывайте текст, который хотите видеть, в кавычках.

Примеры промптов:

Инфографика финансового отчёта (загрузка данных):

[Загрузка PDF последнего финансового отчёта Google]
"Создай чистую, современную инфографику, резюмирующую ключевые финансовые показатели из этого отчёта. Включи графики для 'Роста выручки' и 'Чистой прибыли', и выдели ключевую цитату CEO в стилизованном блоке."

Ретро-инфографика:

"Создай инфографику в ретро-стиле 1950-х годов об истории американских закусочных. Включи отдельные секции для 'Еда,' 'Музыкальный автомат' и 'Декор.' Убедись, что весь текст читаем и стилизован под эпоху."

Техническая диаграмма:

"Создай ортографический чертёж, описывающий это здание в плане, фасаде и разрезе. Чётко обозначь 'Северный фасад' и 'Главный вход' техническим архитектурным шрифтом. Формат 16:9."

Конспект на доске (образовательный):

"Резюмируй концепцию 'Архитектуры трансформерных нейросетей' как нарисованную от руки диаграмму на доске для университетской лекции. Используй маркеры разных цветов для блоков Энкодера и Декодера, и включи читаемые подписи для 'Self-Attention' и 'Feed Forward'."

2. Постоянство персонажей и вирусные превью

Nano-Banana Pro поддерживает до 14 референсных изображений (6 с высокой точностью). Это позволяет использовать "Фиксацию личности" — размещение конкретного человека или персонажа в новых сценариях без искажения лица.

Лучшие практики:

  • Фиксация личности: Явно указывайте: "Сохрани черты лица человека точно такими же, как на Изображении 1."
  • Выражение/действие: Опишите изменение в эмоции или позе, сохраняя личность.
  • Вирусная композиция: Объедините субъектов с жирной графикой и текстом за один проход.

Примеры промптов:

"Вирусное превью" (Личность + Текст + Графика):

"Создай превью для вирусного видео, используя человека с Изображения 1. 
Постоянство лица: Сохрани черты лица человека точно такими же, как на Изображении 1, но измени его выражение на взволнованное и удивлённое. 
Действие: Размести человека слева, указывающим пальцем вправо. 
Объект: Справа размести качественное изображение вкусного тоста с авокадо. 
Графика: Добавь жирную жёлтую стрелку, соединяющую палец человека с тостом. 
Текст: Наложи массивный текст в поп-стиле посередине: '3分钟搞定!' (Готово за 3 минуты!). Используй толстую белую обводку и тень. 
Фон: Размытый, яркий кухонный фон. Высокая насыщенность и контраст."

Сценарий "Пушистые друзья" (групповое постоянство):

[Загрузка 3 изображений разных плюшевых существ]
"Создай забавную историю из 10 частей с этими 3 пушистыми друзьями, отправляющимися в тропический отпуск. История захватывающая с эмоциональными взлётами и падениями и заканчивается счастливым моментом. Сохрани одежду и личность постоянными для всех 3 персонажей, но их выражения и углы должны варьироваться во всех 10 изображениях. Убедись, что в каждом изображении только по одному экземпляру каждого персонажа."

Создание брендовых ассетов:

[Загрузка 1 изображения продукта]
"Создай 9 потрясающих модных снимков, как будто они из отмеченной наградами модной редакции. Используй этот референс как стиль бренда, но добавь нюансы и разнообразие в диапазон, чтобы они передавали профессиональный дизайнерский подход. Пожалуйста, сгенерируй девять изображений по одному."


3. Заземление через Google Поиск

Nano-Banana Pro использует Google Поиск для генерации изображений на основе данных в реальном времени, текущих событий или фактической проверки, снижая галлюцинации на актуальные темы.

Лучшие практики:

  • Запрашивайте визуализации динамических данных (погода, акции, новости).
  • Модель будет "Мыслить" (рассуждать) о результатах поиска перед генерацией изображения.

Примеры промптов:

Визуализация события:

"Создай инфографику о лучших временах для посещения национальных парков США в 2025 году на основе текущих туристических трендов."

4. Продвинутое редактирование, реставрация и колоризация

Модель превосходно справляется со сложным редактированием через разговорный промптинг. Это включает "Инпейнтинг" (удаление/добавление объектов), "Реставрацию" (исправление старых фото), "Колоризацию" (манга/ч/б фото) и "Смену стиля".

Лучшие практики:

  • Семантические инструкции: Не нужно вручную создавать маски; просто естественно скажите модели, что изменить.
  • Понимание физики: Можно запросить сложные изменения вроде "наполни этот стакан жидкостью" для проверки генерации физики.

Примеры промптов:

Удаление объектов и инпейнтинг:

"Удали туристов с фона этой фотографии и заполни пространство логичными текстурами (булыжники и витрины магазинов), которые соответствуют окружающей среде."

Колоризация манги/комиксов:

[Загрузка чёрно-белой панели манги]
"Раскрась эту панель манги. Используй яркую палитру в аниме-стиле. Убедись, что световые эффекты на энергетических лучах светятся неоново-синим, а одежда персонажа соответствует его официальным цветам."

Локализация (перевод текста + культурная адаптация):

[Загрузка изображения рекламы на автобусной остановке в Лондоне]
"Адаптируй эту концепцию для токийского окружения, включая перевод слогана на японский. Измени фон на оживлённую улицу Сибуя ночью."

Контроль освещения/сезона:

[Загрузка изображения дома летом]
"Преврати эту сцену в зимнее время. Сохрани архитектуру дома точно такой же, но добавь снег на крышу и во двор, и измени освещение на холодный, пасмурный день."

5. Трансформация измерений (2D ↔ 3D)

Мощная новая возможность — преобразование 2D-схем в 3D-визуализации или наоборот. Это идеально для дизайнеров интерьеров, архитекторов и создателей мемов.

Примеры промптов:

2D-план этажа в 3D-доску дизайна интерьера:

"На основе загруженного 2D-плана этажа создай профессиональную презентационную доску дизайна интерьера в одном изображении. 
Компоновка: Коллаж с одним большим главным изображением сверху (широкоугольная перспектива гостиной) и тремя меньшими изображениями внизу (Главная спальня, Домашний офис и 3D-вид плана этажа сверху). 
Стиль: Примени стиль Современного минимализма с тёплым дубовым паркетом и кремово-белыми стенами ВО ВСЕХ изображениях. 
Качество: Фотореалистичный рендеринг, мягкое естественное освещение."

Конвертация 2D-мема в 3D:

"Преврати мем с собакой 'This is Fine' в фотореалистичный 3D-рендер. Сохрани композицию идентичной, но сделай собаку похожей на плюшевую игрушку, а огонь — как реалистичное пламя."

6. Высокое разрешение и текстуры

Nano-Banana Pro поддерживает нативную генерацию изображений от 1K до 4K. Это особенно полезно для детализированных текстур или крупноформатной печати.

Лучшие практики:

  • Явно запрашивайте высокие разрешения (2K или 4K), если ваш API/интерфейс это позволяет.
  • Описывайте высокоточные детали (несовершенства, текстуры поверхности).

Примеры промптов:

Генерация 4K-текстур:

"Используй нативный высокоточный вывод для создания захватывающей дух, атмосферной среды мшистого лесного покрова. Управляй сложными световыми эффектами и деликатными текстурами, убедившись, что каждая травинка мха и луч света отрендерены в пиксельно-идеальном разрешении, подходящем для 4K-обоев."

Сложная логика (режим мышления):

"Создай гиперреалистичную инфографику гурманского чизбургера, разобранного для показа текстуры поджаренной булочки бриошь, обжаренной корочки котлеты и блестящего расплава сыра. Подпиши каждый слой с его вкусовым профилем."

7. Мышление и рассуждение

Nano-Banana Pro по умолчанию использует процесс "Мышления", где генерирует промежуточные изображения-размышления (не тарифицируемые) для уточнения композиции перед рендерингом финального вывода. Это позволяет анализировать данные и решать визуальные задачи.

Примеры промптов:

Решение уравнений:

"Реши log_{x^2+1}(x^4-1)=2 в C на белой доске. Покажи шаги чётко."

Визуальное рассуждение:

"Проанализируй это изображение комнаты и создай изображение 'до', показывающее, как комната могла выглядеть во время строительства, показывая каркас и незаконченный гипсокартон."

8. Быстрое создание раскадровки и концепт-арта

Вы можете генерировать последовательное искусство или раскадровки без сетки, обеспечивая связный нарративный поток в одной сессии. Это также популярно для "Концепт-арта фильмов" (например, фейковые утечки предстоящих фильмов).

Пример промпта:

"Создай захватывающе интригующую историю из 9 частей с 9 изображениями с участием женщины и мужчины в отмеченной наградами рекламе люксового багажа. История должна иметь эмоциональные взлёты и падения, заканчиваясь элегантным кадром женщины с логотипом. Личность женщины и мужчины и их одежда должны оставаться постоянными, но они могут и должны быть показаны с разных углов и расстояний. Пожалуйста, генерируй изображения по одному. Убедись, что каждое изображение в формате 16:9 ландшафт."

9. Структурный контроль и управление компоновкой

Входные изображения не ограничиваются референсами персонажей или объектами для редактирования. Вы можете использовать их для строгого контроля композиции и компоновки финального вывода. Это переломный момент для дизайнеров, которым нужно превратить набросок на салфетке, вайрфрейм или конкретную сетку в отполированный ассет.

Лучшие практики:

  • Черновики и эскизы: Загрузите рисунок от руки, чтобы определить точно, где должен находиться текст и объект.
  • Вайрфреймы: Используйте скриншоты существующих компоновок или вайрфреймов для генерации высокоточных UI-макетов.
  • Сетки: Используйте изображения сеток, чтобы заставить модель генерировать ассеты для тайловых игр или LED-дисплеев.

Примеры промптов:

От эскиза к финальной рекламе:

"Создай рекламу для [продукта], следуя этому эскизу."

UI-макет из вайрфрейма:

"Создай макет для [продукта], следуя этим рекомендациям."

Пиксель-арт и LED-дисплеи:

"Сгенерируй пиксель-арт спрайт единорога, который идеально вписывается в это изображение сетки 64x64. Используй высококонтрастные цвета."
(Совет: Разработчики затем могут программно извлечь центральный цвет каждой ячейки для управления подключённой LED-матрицей 64x64).

Спрайты:

"Спрайт-лист женщины, делающей сальто назад на дроне, сетка 3x3, последовательность, покадровая анимация, квадратный формат. Следуй структуре прикреплённого референсного изображения точно."
(Совет: Затем можно извлечь каждую ячейку и создать gif)



Report Page