Форма этой штуки
@ai_longreadsГде мы сейчас находимся и что, вероятнее всего, произойдёт дальше
Это AI-перевод статьи, сделанный каналом Про AI: Лучшие Статьи и Исследования.
Форма этой штуки
The Shape of the Thing Автор: Ethan Mollick Оригинальный текст:
В октябре 2023 года я написал о «Форме тени этой штуки», размышляя о той Штуке, в которую ИИ может превратиться в ближайшие годы. Думаю, теперь мы видим эту Штуку гораздо отчётливее — а заодно и некоторые последствия, которые она несёт с собой. Как я уже обсуждал в недавних публикациях, мы вступили в новую фазу развития ИИ. После появления ChatGPT взаимодействие человека и ИИ приобрело форму того, что я назвал со-интеллектом (co-intelligence) — люди обменивались промптами с ИИ в режиме диалога, чтобы получить помощь с задачами. Начиная с конца 2025 года мы вошли в новую эру благодаря ИИ-агентам вроде Claude Code, OpenAI Codex и OpenClaw. Это ИИ-системы, которым можно просто поручить работу — иногда на несколько часов человеческого труда — и получить разумные и полезные результаты за считанные минуты. Это эра управления ИИ, а не работы вместе с ним.
Этот новый подход к ИИ стал результатом стремительного экспоненциального роста возможностей искусственного интеллекта. А значит, невозможно понять, где мы сейчас и куда движемся, без понимания этого нарастающего потенциала.
По экспоненте вверх
Экспоненциальный рост сложно визуализировать, поэтому вместо графиков и диаграмм я хочу начать с выдр. Если вы следили за моими публикациями об ИИ, вы знаете о моём «Тесте с выдрой», в котором я предлагаю различным моделям генерации изображений показать «выдру в самолёте, использующую Wi-Fi». Как видно ниже, прогресс с 2022 года (когда вышел ChatGPT) до 2025-го был стремительным и впечатляющим.
Так что же произошло с того момента — с апреля 2025 года? Когда изображения стали практически идеальными, новым рубежом стало видео, где также наблюдается экспоненциальный прогресс. Для демонстрации я дал самой продвинутой (и всё ещё не выпущенной в США) модели генерации видео от создателей TikTok — Bytedance — промпт: Документальный фильм о том, как выдры воспринимают «Тест с выдрой» Итана Моллика, в котором ИИ оценивается по способности создавать изображения выдр, сидящих в самолётах. Вот самый первый результат — обязательно включите звук:
Помимо единственной ошибки в произношении, результат практически идеален — вплоть до того, что выдры анимированы с человеческими выражениями лиц. Конечно, модели генерации видео — это впечатляюще, но они не обязательно отражают то, на что способен полезный агентный (agentic) ИИ. Так что если посмотреть на бенчмарки (benchmark, эталонные тесты) способностей ИИ — увидим ли мы ту же экспоненциальную кривую?
Безусловно — и в первую очередь на самом известном сегодня графике в мире ИИ: METR Long Tasks. Он пытается измерить прогресс ИИ, оценивая, какой объём человеческой работы ИИ может выполнить автономно с определённой степенью надёжности. У этого теста есть свои критики, и даже сама METR указывала на потенциальные проблемы. Но если вам не нравится график METR, вы обнаружите, что большинство графиков способностей ИИ демонстрируют ту же самую кривую.
В качестве примера я выбрал четыре сложных и разнообразных теста для ИИ и отобразил прогресс на графике ниже. В верхнем левом углу — результаты Google-Proof Q&A benchmark, теста на знания, где аспиранты с помощью Google набирают лишь 34% вне своей области и около 70% в своей, тогда как лучшие ИИ теперь набирают 94%. Или посмотрите на GDPval, где отраслевые эксперты сравнивают ИИ с опытными специалистами на сложных задачах, и где новейшие ИИ достигают или превосходят уровень лучших людей в 82% случаев. Та же закономерность прослеживается в Humanity's Last Exam — наборе очень сложных задач, составленных университетскими профессорами и требующих значительной экспертизы для решения. Или можно взять способность ИИ решать головоломки (можете попробовать сами — это увлекательно!). Каждый из этих тестов демонстрирует аналогичный стремительный рост способностей с минимальными признаками замедления — по крайней мере, пока не достигнут максимально возможный балл.
Помимо экспоненциальных графиков, важно признать, что все эти тесты имеют свои недостатки, а ИИ остаётся «неровным» — способным выполнять одни задачи на высоком уровне, проваливая другие. Более того, несмотря на эти впечатляющие результаты тестов, компании ещё только начинают внедрять ИИ, а значит, пока что в большинстве организаций мало что изменилось. Но «большинство организаций» — это не все организации. Мы уже начинаем видеть первые проявления новых подходов к организации работы, использующих возможности ИИ-агентов.
Радикальные изменения в работе
Несколько недель назад команда из трёх человек в StrongDM — компании по информационной безопасности, специализирующейся на контроле доступа — объявила о создании Software Factory (Фабрика программного обеспечения). Это способ работы с ИИ-агентами, при котором ИИ полностью самостоятельно пишет, тестирует и выпускает готовое ПО без участия людей. Процесс включает два весьма радикальных правила: «Код не должен писаться людьми» и «Код не должен проверяться людьми». Для работы фабрики каждый инженер-человек должен тратить на токены (tokens, единицы текста) ИИ суммы, сопоставимые со своей зарплатой — не менее 1000 долларов в день.
Основная идея Фабрики в том, что она берёт дорожные карты будущих продуктов, написанные людьми, и превращает их в готовые продукты. Кодирующие агенты используют эти дорожные карты для создания ПО, а тестирующие агенты проверяют его в симулированной клиентской среде (которую тестирующие агенты создают по мере необходимости). Группы агентов обмениваются обратной связью, итерируя до тех пор, пока результаты не удовлетворят ИИ. Затем люди оценивают готовый продукт, и результаты отправляются клиентам — без того, чтобы кто-либо когда-либо прикасался к коду или даже видел его.
Разумеется, здесь масса деталей, которые заставляют этот подход работать, и команда StrongDM щедро поделилась многими из них публично. Они также пригласили умных сторонних наблюдателей понаблюдать за работой Фабрики и прокомментировать увиденное, так что вы можете прочитать отчёты Саймона Уиллисона и Дэна Шапиро, чтобы лучше понять сильные и слабые стороны их подходов. Однако во многих отношениях конкретные детали Software Factory важны меньше, чем сам факт того, что столь радикальные эксперименты с организацией работы теперь не только возможны, но и, вероятно, необходимы. ИИ достаточно хорош, чтобы изменить принципы работы организаций, и эксперименты только начинаются — при том что модели продолжают совершенствоваться.
Волна за волной
Практичные агенты, неровный экспоненциальный рост и возможность радикально экспериментировать с природой работы — всё это создаёт своего рода катящуюся и непредсказуемую среду для ИИ-прорывов. По мере того как возможности ИИ преодолевают пороговые значения, открываются радикально новые сценарии использования, которые иногда буквально за ночь меняют представления людей о том, на что способен ИИ. Одновременно организации, экспериментирующие с ИИ, выясняют, как заставить его работать на себя, что ведёт к внезапным объявлениям о новых стратегиях или масштабным сдвигам в том, какие типы сотрудников компании ценят больше всего. Кроме того, по мере совершенствования ИИ всё больше политиков заинтересуются его регулированием, порождая конфликты с ИИ-компаниями.
Это не умозрительные рассуждения — потому что всё это произошло за одну неделю. 22 февраля малоизвестная финансовая фирма Citrini Research опубликовала вымышленный сценарий о том, как внедрение ИИ может уничтожить ряд устоявшихся бизнесов к 2028 году. В материале было много явно надуманных элементов, но он задел за живое на Уолл-стрит, вызвав серьёзные колебания фондового рынка. 26 февраля финансовая компания Block объявила о 40-процентных сокращениях, подразумевая, что причина — в ИИ. Вероятно, роль ИИ была сильно преувеличена, и ИИ просто использовали как прикрытие для массовых увольнений. А в завершение той недели, 27 февраля, произошёл весьма публичный конфликт между Пентагоном и ИИ-компанией Anthropic по поводу того, кто должен контролировать правила использования Claude правительством.
Во многом каждый из этих случаев был не тем, чем казался на первый взгляд. Отчёт Citrini был вымышленным сценарием, сокращения в Block не были связаны с ИИ, а конфликт вокруг ИИ на войне затрагивал множество сложных вопросов, которые до сих пор до конца не прояснены. Но я считаю, что эта одна неделя — хорошая иллюстрация того, как будет ощущаться ближайшее будущее. Внезапные откровения о возможностях ИИ, ведущие к быстрым реакциям рынка. Всё более реальное влияние ИИ на рабочие места (даже при том, что идут активные дебаты о том, будет ли это влияние в краткосрочной перспективе положительным или отрицательным). И нарастающее переплетение ИИ-компаний с политикой по всему миру. По мере повышения ставок нестабильность, скорее всего, будет только усиливаться.
Конечно, возможно, что всё успокоится. Может быть, совершенствование ИИ упрётся в стену, организации постепенно адаптируются к изменениям, а волны потрясений станут более управляемыми по мере того, как люди поймут, что ИИ может и чего не может. История полна технологий, которые должны были изменить всё в одночасье, но вместо этого десятилетиями перестраивали экономику.
Но я бы на это не ставил.
Одна из причин в том, что ИИ-компании довольно открыто говорят нам, что будет дальше: рекурсивное самосовершенствование, или RSI (recursive self-improvement). Идея в том, что ИИ-системы всё чаще используются для создания ещё лучших ИИ-систем, формируя петлю обратной связи, которая может ускорить те самые кривые, которые я показал выше. На форуме в Давосе в январе глава Anthropic Дарио Амодеи объяснил: если создать модели, которые хорошо программируют и хорошо занимаются исследованиями ИИ, их можно использовать для создания следующего поколения моделей, ускоряя цикл. Он отметил, что инженеры внутри Anthropic практически перестали писать код самостоятельно. Когда OpenAI выпустила свою последнюю модель Codex в феврале, компания заявила, что это «наша первая модель, которая сыграла ключевую роль в собственном создании». А глава Google DeepMind Демис Хассабис признал на той же панели в Давосе, что замыкание петли самосовершенствования — это задача, над которой активно работают все ведущие лаборатории, хотя и предупредил, что пока остаются недостающие возможности и реальные риски.
Мы не знаем, как далеко это зайдёт. RSI оставалось теоретической концепцией на протяжении десятилетий, и лаборатории могут столкнуться с узкими местами — будь то вычислительные мощности, данные или сама сложность исследований в области ИИ. Мы также не знаем, упрутся ли большие языковые модели в потолок, за которым они не смогут стать лучше, или их «неровный фронтир» никогда не сгладится. Думаю, мы не можем знать ничего наверняка, но мне кажется, мы уже прошли точку, где рекурсивное самосовершенствование — это научная фантастика. Напротив, оно стоит как явный пункт в дорожной карте каждой крупной ИИ-компании. Если петля замкнётся, экспоненциальные кривые, за которыми мы наблюдаем, станут ещё круче — с неопределённой конечной точкой.
Так вот где мы сегодня: нестабильность той единственной февральской недели была превью того, каково это, когда растущие возможности ИИ начинают взаимодействовать с рынками, рабочими местами и правительствами одновременно. Это чувство неопределённости, скорее всего, будет только распространяться. Но неопределённость — это не беспомощность. Когда технология настолько мощна и настолько нестабильна, выбор, который делают люди и организации прямо сейчас, имеет решающее значение. Мы можем видеть форму этой Штуки, но мы ещё можем влиять на саму Штуку — и на то, что она означает для всех нас. У нас явно нет правил или ролевых моделей для того, как ИИ используется на работе, в школах или в правительстве. Это проблема, но это также означает, что каждая организация, которая сейчас находит хороший способ использовать ИИ, создаёт прецедент для всех остальных. Окно для того, чтобы придать форму этой Штуке, может быть открытым недолго, но оно открыто сейчас.
Подпишитесь на канал и каждый день читайте лучшие материалы про AI переведенные на русский!
Нашли интересную статью для перевода? Пришлите нашему боту: @ailongreadsbot