Среди агентов

@ai_longreads

Как я использую агентов для программирования и что, на мой взгляд, они означают для будущего

Это AI-перевод статьи, сделанный каналом Про AI: Лучшие Статьи и Исследования.

Среди агентов

Among the Agents Автор: Dean W. Ball Оригинальный текст

Введение

За последний месяц я:

Автоматизировал создание, отправку и отслеживание счетов;
Создал научно точные симуляции гидрологических систем в качестве учебного проекта;
Автоматизировал процесс исследования, включающий сбор и анализ всех предлагаемых законопроектов штатов, связанных с ИИ (хотя это не заменяет чтения законопроекта для всего, о чём я собираюсь писать);
Организовал сложную цепочку автономных этапов сбора, обработки, анализа и представления данных, связанных с производством и промышленной политикой;
Создал модель машинного обучения, способную предсказывать урожайность кукурузы в США с, по-видимому, очень высокой точностью (проверим на практике), основанную на климатических, почвенных, спутниковых данных наблюдения Земли и других источниках;
Воспроизвёл три исследовательские статьи по машинному обучению и модифицировал подход под свои исследовательские цели;
Провёл сотни экспериментов с языковыми моделями на уровне байтов — моя новая область интереса;
Создал автономного агента для рынков предсказаний;
Создал автономного трейдера опционов на основе конкретной инвестиционной гипотезы;
Построил десятки игр и симуляций для изучения различных физических и промышленных явлений;
Создал агента, который мониторит определённый арт-рынок, где я потенциально заинтересован в приобретении;
Создал новый личный блог с полноценной системой управления контентом в стиле Squarespace «под капотом»;
Другие вещи, о которых пока не могу говорить публично.

Разумеется, я делал всё это не один. Я делал это в сотрудничестве с агентами для программирования, такими как Gemini 3 Pro (и система командной строки Gemini), OpenAI Codex на GPT 5.2, и особенно Claude Opus 4.5 в Claude Code.

Эти агенты существуют уже почти год, но в последние недели и месяцы они стали настолько способными, что, по моему мнению, соответствуют некоторым определениям «искусственного общего интеллекта» (AGI). При этом мир практически не изменился. Это потому, что AGI — не конец истории ИИ, а скорее её начало. Ранее в этом году я писал:

Люди и компании, которые откроют больше и лучших способов работы с этой странной новой технологией, будут теми, кто преуспеет в эту эпоху. Страны, где таких людей и бизнесов больше всего, станут странами, которые «победят» в ИИ. Нам всем вместе предстоит выяснить, как использовать машинный интеллект наилучшим образом. Мир не изменится, пока люди его не изменят.

Я иногда шучу, что использование ИИ, и особенно агентов для программирования, немного похоже на игру на фортепиано. Фортепиано — самый лёгкий инструмент для начала (любой может извлечь приятный звук без подготовки, что неверно, скажем, для флейты или скрипки), но самый сложный в долгосрочной перспективе. ИИ представляет величайшую возможность и величайший вызов, который могут предложить компьютеры: чистый лист бумаги, мигающий курсор в пустом поле ввода. Вы можете напечатать что угодно, но понять, что печатать, — вот где настоящая сложность.

Особенно важно, на мой взгляд, чтобы как можно более интеллектуально разнообразная группа людей экспериментировала с этими агентами для программирования, которых я стал называть «младенческим AGI». Потому что хотя основной фокус этих инструментов — действительно программирование, они полезны не только программистам. Будь вы учёным или специалистом в области политики, лингвистом или дипломатом, литературным критиком или музыкантом, или просто любознательным человеком — я уверен, что эти инструменты могут вам что-то предложить.

Я в некотором роде «белая ворона» во всём этом, будучи «гуманитарием», который также научился программировать и возиться с компьютером в юном возрасте. Поэтому я чувствую особую ответственность продемонстрировать, как агенты для программирования могут быть полезны непрограммистам любого происхождения, возраста и интересов. Сегодня я хотел бы сделать именно это. Надеюсь, это будет полезно как можно более широкому кругу людей, и в этих целях я буду писать, предполагая отсутствие предшествующего опыта работы с агентами для программирования, интерфейсами командной строки или программированием. Прошу прощения у более технически подкованной части аудитории, для которой часть этого будет известной информацией. После этого я закончу краткими и предварительными наблюдениями о том, что эти новые агенты для программирования могут означать в 2026 году и далее.

Что такое агент для программирования?

Агенты для программирования — это языковые модели, встроенные в соответствующую программную инфраструктуру (её называют по-разному: «система ИИ», «каркас агента» (agent scaffolding) или «оболочка агента» (agent harness)). Существует множество приложений, позволяющих использовать агентов для программирования, например Cursor, Windsurf, Devin от Cognition (более ориентированный на корпоративное использование), система Droid от Factory AI или Antigravity от Google DeepMind. Но если вы новичок в программировании, многие из этих инструментов могут поначалу вас ошеломить (хотя вы можете захотеть попробовать их после приобретения опыта). Это так называемые интегрированные среды разработки (IDE), с бо́льшим акцентом на просмотр и редактирование кода, чем на самом деле необходимо большинству новых пользователей.

Как ни иронично, я думаю, что лучший способ начать использовать эти определённо футуристические инструменты — через самый древний интерфейс персональных компьютеров: командную строку. Командная строка — это текстовый способ управления компьютерами. Она часто гораздо эффективнее, хотя менее интуитивна, чем графический интерфейс (GUI) с окнами, курсором мыши и тому подобным.

Например, допустим, на моём компьютере есть файл "agiishere.txt", и я решил заменить каждое использование аббревиатуры "AGI" на "transformative AI". В графическом интерфейсе Mac я бы открыл Finder, перешёл в папку Documents (или куда бы ни был сохранён файл), открыл файл в текстовом редакторе и использовал функцию «найти и заменить». Чтобы сделать это в командной строке, я бы открыл приложение «Terminal» на Mac и напечатал:

cd ~/Documents && sed -i '' 's/agi/transformative ai/gI' 'agi_is_here.txt'

Это может выглядеть чуждо для тех, кто не знаком с интерфейсами командной строки, но это поразительно компактное выражение сложного пользовательского намерения, написанное на языке сценариев bash. Например, флаг "/gI" в конце означает "global" (желание заменить фразу по всему документу) и "Insensitive" (поиск без учёта регистра — "agi", "aGi" и так далее).

Важное замечание: терминальные приложения называются «эмуляторами», потому что они эмулируют опыт использования компьютера до появления графических интерфейсов. Это касается устройств ввода: тогда не было мышей, поэтому нет мышей и в эмуляторах сейчас. Вы не можете кликнуть по чему-либо внутри окна терминального эмулятора. Весь ввод — только с клавиатуры.

Claude Code от Anthropic, Codex от OpenAI и Gemini CLI от Google — это, строго говоря, приложения, работающие через командную строку вашего компьютера. После их установки вы открываете терминальный эмулятор (на Mac это приложение Terminal) и вводите, соответственно: "claude", "codex" или "gemini". Приложение запускается. В этот момент вы общаетесь с языковой моделью.

Языковая модель работает в облаке, но может читать и изменять файлы на вашем локальном компьютере. Продолжая предыдущий пример: вместо написания сложной bash-команды вы можете просто сказать: «Найди файл agiishere на моём компьютере и замени все упоминания 'agi' на 'transformative ai'». Это тривиально просто для передового агента для программирования, но уже это — более изощрённое использование компьютеров, чем способно подавляющее большинство людей.

Поскольку интерфейсы командной строки полностью текстовые, неудивительно, что языковые модели стали очень хорошо их использовать. Это значит, что они могут использовать ваш компьютер, а компьютер — один из самых мощных инструментов, когда-либо изобретённых человечеством. Вы разговариваете с этими агентами так же, как с чат-ботами, но они могут делать гораздо больше, потому что управляют вашим компьютером за вас.

Такие агенты существуют уже почти год, но я находил их недостаточно надёжными примерно до нескольких месяцев назад (не помогло и то, что с апреля по август я работал на правительство, и помимо чрезмерной занятости, вы, по понятным причинам, не можете запускать агентов для программирования на компьютерах Исполнительного управления Президента). А надёжность здесь имеет огромное значение, потому что легко может что-то пойти не так. Например, вы могли бы напечатать что-то столь простое, как:

rm -rf ~

Эта команда удаляет всё в вашей пользовательской директории, что, вероятно, означает все ваши файлы, фотографии, загрузки и тому подобное. Нет диалогового окна с вопросом, уверены ли вы. Это просто произойдёт. Командные строки могут быть опасны. На разработчиках моделей лежит ответственность обучать всё более качественные модели, избегающие таких сбоев, и проектировать интерфейсы, обеспечивающие надлежащий человеческий контроль над агентами. Но не менее важно, чтобы пользователи понимали, что делают агенты на их компьютерах, и распознавали, когда обстоятельства требуют дополнительной проверки.

Вот почему все агенты для программирования требуют явного разрешения пользователя на выполнение определённых действий (хотя это можно настроить). Если у вас есть какая-либо неопределённость относительно действия, для которого модель запрашивает ваше одобрение, помните, что вы всегда можете спросить саму модель, почему она хочет сделать то, что делает.

Даже с разрешением пользователя есть некоторые режимы сбоев, о которых следует знать. Во-первых, агенты для программирования довольно небрежны в использовании API — средств, с помощью которых программный инженер использует какой-либо сервис или программное обеспечение в коде. Агенты склонны ожидать, что API будут надёжными и производительными; в реальном мире это часто не так. Они также не думают о таких вещах, как лимиты запросов. Это может означать, что если их специально не направить внимательно изучить документацию API и спроектировать решение с учётом его ограничений, они в итоге будут заблокированы за нарушение правил или лимитов API.

Также агенты всё ещё склонны к излишней самоуверенности при решении амбициозных задач. Кажется, у них есть врождённое желание «впечатлить» пользователя результатом с первой попытки. Это желание даёт им стимул объявлять о победе слишком рано. Я справляюсь с этой проблемой, прося агентов писать надёжные планы перед началом работы, а если они создают программные приложения — составлять полные списки функций вместе с методами проверки завершённости и качества каждой функции.

Когда вы освоитесь, есть три важных и неочевидных для новичка факта, которые нужно усвоить. Первый мы уже обсудили: агенты для программирования могут управлять многими функциями вашего компьютера, но, что важно, не всеми, исключительно через командную строку. Второй: агенты могут скачивать произвольные файлы из интернета. Третий: агенты могут оркестрировать облачную вычислительную инфраструктуру; они могут управлять облачными виртуальными машинами и оборудованием для ИИ из вашей командной строки. Они также сами могут использовать API любой языковой модели или другого инструмента ИИ; ваши агенты сами могут использовать ИИ. При разумном использовании каждая из этих возможностей глубока.

Есть много тонкостей и других приложений для программирования с ИИ помимо чистой командной строки (даже Codex, Claude Code и Gemini имеют приложения с графическим интерфейсом). Я рекомендую прочитать недавний тред создателя Claude Code Бориса Черного как отправную точку для изучения этих тонкостей.

Значение агентов для программирования

Что означают агенты для программирования? У меня пока есть лишь предварительные мысли, и многое неизвестно. Однако несколько вещей кажутся ясными:

Агенты для программирования означают, что вы можете больше пробовать самостоятельно, вместо того чтобы зависеть от компаний или экспертов-посредников. В последние одно-два десятилетия цифровой мир стал сложным, настолько наполненным закрытыми сервисами-«огороженными садами», что большинство из нас инфантилизировалось. Агенты для программирования означают, что вы снова можете стать кем-то вроде цифрового первопроходца.

Вы можете быстрее осваивать неявные знания. Поскольку вы можете ускоренно создавать множество сложных программных проектов, вы быстрее узнаёте компромиссы, в основном невысказанные ограничения и другие неявные знания, присущие всем сложным начинаниям. Промежуточные знания такого рода — вещи вроде «о да, этот API регулярно ломается вот таким тихим образом» или «о да, здесь есть неотъемлемый компромисс между X и Y, который нужно правильно сбалансировать» — теперь можно приобрести быстро в процессе гибридного человеко-ИИ исследования.

Фундаментальные основы по-прежнему важны. Основы многих дисциплин, особенно компьютерных наук, всё ещё кажутся мне весьма релевантными. Изучение основ работы компьютеров чрезвычайно полезно для максимального использования агентов для программирования; это сделает вас лучшим «промптером». Изучение основ языков программирования также важно. Понимание вычислительного мышления теперь важнее. Понимание конкретного синтаксиса конкретного языка программирования теперь важнее меньше. Тот же урок может применяться и к другим дисциплинам. Возможно, снова стало возможным быть человеком эпохи Возрождения.

Проприетарный доступ к данным станет ещё большим дифференциатором, чем уже стал. С другой стороны, публичное размещение наборов данных — одно из самых высокорычажных действий, которые могут предпринять исследователи, правительства и исследовательские институты. Социальный статус публикации дифференцированных наборов данных, вероятно, всё ещё слишком низок.

Определение хорошего «пользовательского опыта» в программном обеспечении глубоко изменится. Ценность отполированного интерфейса во многих до сих пор потребительских и даже корпоративных приложениях снизится; ценность производительного, надёжного, расширяемого API возрастёт. «Огороженные сады» будут вызывать всё больше раздражения у обычных потребителей. Это раздражение всегда существовало в сообществах программистов и технически подкованных людей; агенты для программирования сделают эти культурные тенденции более распространёнными среди «обычных» людей.

Вырастет ценность непрезентабельных сервисов, предоставляющих доступ к сырым возможностям или данным с минимальным посредничеством. Сейчас потребительское и корпоративное ПО как услуга приоритизирует отличный пользовательский интерфейс — делая легким для нетехнического пользователя начало работы. Но компромисс часто в том, что они устанавливают более низкий потолок возможностей. Теперь будет много программных сервисов, где удобство для человека — гораздо меньший приоритет, и вместо этого премия будет на сервисы, дающие агентам ИИ максимальный рычаг и гибкость для достижения широкого спектра целей. Простой — вероятно, слишком упрощённый — способ сформулировать это: приложения будут значить меньше, чем инфраструктура.

Это может касаться и оборудования. Можно представить, например, что устройства домашней автоматизации, взимающие премию за отличный потребительский опыт, станут несколько менее привлекательными по сравнению с более дешёвыми, столь же функциональными и гораздо более расширяемыми конкурентами. Подумайте о разнице между такими компаниями, как Ubiquiti и Eero, в мире беспроводных сетей; Ubiquiti очень высокого качества, но требует гораздо больше технической экспертизы для управления.

Очень немногие создали действительно отличные продукты и сервисы для рынка «продвинутых пользователей с агентами для программирования». Те, кто создал, в основном сделали это непреднамеренно. Здесь, вероятно, есть большая и растущая возможность.

Хотя вышеуказанные тенденции создают возможности для новых фирм, они также создадут возможности для существующих компаний возводить барьеры. Фирмы, контролирующие какой-либо проприетарный сервис, данные или другой защищённый ров, могут быть не склонны предлагать свои продукты способами, максимально поддерживающими агентов ИИ, опасаясь, что их дифференциация со временем превратится в товар. Я ожидаю, что эта динамика, типичная для новых технологий, сохранится годами, если не дольше, и будет представлять один из самых конкретных барьеров для внедрения ИИ в реальном мире.

Я бы уже не удивился, если мы увидим ИИ в макроэкономической статистике к концу этого года — как с положительной стороны (рост, производительность), так и с отрицательной (дислокация на рынке труда).

Определение того, что такое «хорошо», и убеждение других, что ваша концепция «хорошего» верна в конкретном контексте, останется человеческим прикосновением. Работы, которые уже требуют этого (а их много), будут хорошо защищены. Работы, требующие только производства дискретных, чётко определённых результатов, уязвимы.

Правительства штатов внесут сотни законопроектов об искусственном интеллекте; почти ни один из них — возможно, буквально ни один — не будет написан с учётом агентов для программирования. Это будут регуляции чат-ботов. Вполне возможно, что политическая дискуссия, которая будет вестись в Америке в 2026 году, уже устарела.

К концу этого года наименее важным, что вы сможете делать с передовыми системами ИИ, будет получение ответов от чат-ботов, но именно так большинство людей всё ещё будут думать об «ИИ». Ожидайте когнитивного диссонанса в результате.

Подпишитесь на канал и каждый день читайте лучшие материалы про AI переведенные на русский!

Нашли интересную статью для перевода? Пришлите нашему боту: @ailongreadsbot

Среди агентов

Среди агентов

Введение

Что такое агент для программирования?

Значение агентов для программирования

Report Page