Состязательная нейросеть

Состязательная нейросеть

ЧЁРНЫЙ ЯЩИК

Искусственный интеллект очень хорош в распознавании предметов: покажите ему миллион фотографий, и он сможет с необычайной точностью сказать вам, какие изображают пешехода, пересекающего улицу. Но ИИ безнадежен в самостоятельном создании изображений пешеходов. Если он пытается нарисовать пешехода, получается смесь из реалистичных, но нелепых картин, изображающих пешеходов в разных позах, которые можно использовать для тренировки беспилотных автомобилей.

Проблема в том, что создание чего-то совершенно нового требует воображения - и до определённого момента это ставило ИИ в тупик.

Решение впервые пришло в голову Айану Гудфеллоу, тогда ещё аспиранту Монреальского университета, во время научного спора в баре в 2014 году.

Подход, известный как генеративная состязательная сеть или GAN, задействует две нейронные сети (упрощенные математические модели человеческого мозга, которые лежат в основе самого современного машинного обучения) и сталкивает их друг с другом в цифровой версии «кошки-мышки».

Обе сети обучаются в одном наборе данных. Одной, обозначенной как генератор, поручено создавать вариации на уже существующие изображения, например, рисование пешехода с лишней рукой. Вторую, обозначенную как дискриминатор, просят определить, является ли пример, который она видит, реальным изображением – или подделкой, произведенной генератором. Проще говоря, дискриминатор решает, может ли трехрукий человек быть реальным.

Со временем генератор обучается создавать изображения, которые дискриминатор не отличает от настоящих. По существу, генератор учится распознавать, а затем рисовать реалистичные образы пешеходов.

Эта технология стала одним из самых перспективных достижений в области ИИ за последнее десятилетие. Она способна помочь машинам генерировать продукты, которые обманут даже людей.

GAN были использованы для создания реалистично звучащих речевых и фотореалистичных фальшивых образов. В одном убедительном примере исследователи из Nvidia загрузили GAN с фотографиями знаменитостей, чтобы создать сотни «настоящих» лиц людей, которых нет. Другая исследовательская группа сделала убедительные поддельные картины, похожие на работы Ван Гога. Развиваясь, GAN могут перерисовывать изображения по-новому: делать летний пейзаж заснеженным или превращать лошадей в зебр.

Результаты не всегда идеальны: GAN могут создать велосипед с двумя рулями или, скажем, лицо с бровями в неправильном месте. Но поскольку изображения и звуки часто поразительно реалистичны, некоторые эксперты считают, что существует некая точка, в которой GAN начинают понимать основную структуру мира, которую они видят и слышат.

И это означает, что вместе с воображением ИИ может получить способность понимать то, что он видит в мире.

(Автор - Джеми Кондлайф, перевод - ЧЁРНЫЙ ЯЩИК)