Claude Dispatch и сила интерфейсов
@ai_longreadsЗачастую нам не хватает не возможностей ИИ, а подходящих инструментов для работы с ним. Исследования показывают, что интерфейс чат-бота сам по себе создаёт когнитивную нагрузку, которая сводит на нет преимущества искусственного интеллекта.
Это AI-перевод статьи, сделанный каналом Про AI: Лучшие Статьи и Исследования.
Claude Dispatch и сила интерфейсов
Claude Dispatch and the Power of Interfaces Автор: Ethan Mollick Оригинальный текст:
ИИ уже сейчас гораздо более способен, чем осознаёт большинство людей. Значительная часть этого так называемого «нереализованного потенциала возможностей» обусловлена не ограничениями ИИ (хотя у него, безусловно, всё ещё много ограничений), а тем, как люди с ним взаимодействуют. Подавляющее большинство людей обращается к ИИ через чат-ботов, причём обычно через бесплатные версии с менее способными моделями. Чат-бот подходит для быстрого вопроса, но он плохо приспособлен для реальной работы.
Более того, недавнее исследование показывает, что при использовании чат-интерфейсов для работы мы платим «когнитивный налог». В новой статье небольшая группа финансовых специалистов выполняла сложное задание по оценке стоимости с помощью GPT-4o, а исследователи измеряли их когнитивную нагрузку по транскриптам — реплика за репликой. Люди действительно получали прирост продуктивности от использования ИИ, но часть этого выигрыша, похоже, нивелировалась тем, что ИИ подавал информацию так, что это полностью перегружало пользователей: гигантские стены текста, предложения перейти к новым темам и разрастающиеся обсуждения. Препятствием оказался именно интерфейс чат-бота, а не сама работа. И стоило разговору стать хаотичным — он таким и оставался. ИИ, оптимизированный для того чтобы быть полезным, просто отзеркаливал ту неорганизованную структуру, которую предлагал пользователь, а пользователь, перегруженный информацией, не пытался навести порядок. Обе стороны лишь усугубляли проблему. Больше всего страдали менее опытные сотрудники — именно те, кто мог бы извлечь наибольшую пользу из ИИ... если бы мог отследить, что они с ним делают.
Это не должно вас удивлять, если вы хоть раз использовали чат-бот для решения задач. Вы задаёте конкретный вопрос и получаете пять абзацев, где-то в которых содержится ответ, а ИИ заодно предлагает три новых направления, о которых вы не спрашивали. Сам интерфейс создаёт когнитивные издержки, которые перевешивают преимущества интеллекта ИИ. Так как же выглядит лучший интерфейс?
Специализированные интерфейсы
Один вариант — создавать конкретные интерфейсы для конкретных задач или типов работы. Из всех специализированных ИИ-интерфейсов единственные действительно завершённые — это интерфейсы для программирования. Именно этого и следовало ожидать: лаборатории ИИ укомплектованы программистами, модели интенсивно обучаются на коде, а люди, создающие эти инструменты, зачастую делают их для себя.
Я уже писал о Claude Code — агентном (агентный) инструменте для программирования от Anthropic, который может часами работать автономно. Codex от OpenAI и Antigravity от Google делают похожие вещи. Я использовал Claude Code для всего — от заработка (небольших) денег до создания игр — ни разу не прикасаясь к коду. Codex тоже невероятно полезен и обладает аналогичными возможностями. Эти инструменты великолепны, но они действительно созданы для программистов. Они предполагают, что вы знаете Python и Git. Их интерфейсы выглядят как компьютерный класс 1980-х. Для 99% интеллектуальных работников, которые не являются разработчиками, эти мощные ИИ-инструменты не оптимизированы.
Из всех ИИ-лабораторий Google, похоже, больше всех экспериментирует с созданием специализированных интерфейсов для других профессий. Все они пока несколько сыроваты, но показывают, как может выглядеть будущее, когда ИИ-инструменты будут создаваться для других категорий интеллектуальных работников. Stitch от Google намекает на то, каким может быть ИИ-нативный дизайн — бесконечный холст, где вы описываете приложение на естественном языке и получаете несколько взаимосвязанных экранов с согласованной дизайн-системой. В аналогичном ключе Pomelli позволяет вставить URL вашего сайта и автоматически генерирует рекламные кампании для социальных сетей в фирменном стиле — используя язык маркетинга, а не промптинга, чтобы это ощущалось менее техническим. И, пожалуй, самый известный — NotebookLM — предоставляет способ исследовать, отображать и работать с разнообразными источниками информации. Каждый из этих инструментов показывает, куда всё движется, но пока ни один не является таким трансформирующим инструментом для своей области, каким Claude Code стал для программистов. Впрочем, есть и другой интерфейс, который переживает взрывной рост, — персональный агент.
Использование уже существующих интерфейсов
Если вы ещё не слышали о нём, OpenClaw — это агент с открытым исходным кодом, его символ — красный лобстер, он представляет собой кошмар для безопасности и стал самым быстрорастущим проектом с открытым исходным кодом в истории. OpenClaw столь успешен, потому что является настоящим персональным агентом. Система спроектирована так, что вы можете общаться со своим ИИ-агентом через WhatsApp, Telegram или Slack — те же приложения, которые вы используете для переписки с людьми. Вы говорите ему проверить почту, забронировать столик, найти файл — и он идёт и делает всё это на вашем компьютере. Он решил проблему интерфейса способом, который задним числом кажется очевидным: вместо чат-бота или командной строки он позволил общаться с ИИ так, как вы общались бы с человеком, — через уже привычные интерфейсы вроде WhatsApp.
Однако OpenClaw сложен в использовании и несёт множество рисков для безопасности. Ответ Anthropic — Claude Cowork с функцией Dispatch. Cowork, запущенный в январе, — это версия Claude Code для интеллектуальных работников. Он даёт Claude доступ к вашим локальным файлам и приложениям через десктопное рабочее пространство. Он также подключается к десяткам приложений через коннекторы, а когда коннектора нет — переключается на прямое управление мышью и клавиатурой. Dispatch, появившийся пару недель назад, добавляет ключевой элемент: вы можете писать Claude с телефона, пока он работает на вашем компьютере. Вы сканируете QR-код, и ваш телефон превращается в пульт управления ИИ-агентом, сидящим за вашим компьютером.
Сочетание Dispatch и Claude Code создаёт интерфейс, который ощущается как общение с компетентным помощником. Например, я попросил Claude с телефона подготовить утренний брифинг, и он прочитал мои календари, электронную почту и онлайн-каналы, а затем выдал отчёт о том, что мне нужно сделать дальше. Но Cowork выполняет и более сложную работу. Со своего телефона я попросил его посмотреть недавнюю презентацию, которую я делал, и проверить, актуален ли график на слайде 3, — а если нет, обновить его. Можно видеть, что в одном месте он немного застрял (сайт заблокировал скачивание файла), но в остальном результаты были очень впечатляющими. Он открыл и «просмотрел» PowerPoint и обследовал весь мой компьютер в поисках более свежих данных. Когда я дал ему ссылку на более свежую онлайн-статью, он скачал PDF, нашёл обновлённый график, вырезал изображение графика и обновил мой PowerPoint. Это сложная и изощрённая работа, которая, даже если не всегда безупречна, обычно достаточно хороша, чтобы сэкономить массу времени.
Настолько ли это гибко, как OpenClaw? Нет. Cowork работает в «песочнице» — безопаснее, но с большими ограничениями (что не означает отсутствия рисков для безопасности). Экосистема коннекторов растёт, но пока неполная. А идея о том, что Cowork может использовать ваш компьютер, впечатляет как концепция, но на практике подвержена ошибкам. Однако ключевой вывод тот же, что нащупал OpenClaw: людям не нужен чат-бот. Им нужен агент, который работает с их реальными файлами, их реальными инструментами и доступен так же, как они общаются с людьми.
Интерфейсы по запросу
Всё вышесказанное исходит из того, что интерфейсы нужно проектировать заранее. Но новейшие ИИ-системы на самом деле могут создать интерфейс для вас. Например, за последние несколько недель Claude получил возможность генерировать визуализации прямо в диалоге. Это не статичные изображения. Они интерактивные, настраиваемые, и Claude может их модифицировать по мере того, как вы задаёте уточняющие вопросы.
Это иной подход к проблеме интерфейса. Вместо того чтобы компании создавали специализированный интерфейс для каждого вида работы, ИИ генерирует нужный интерфейс на лету. Я полагаю, что будущее — это не один интерфейс, управляющий всем. Это ИИ, который генерирует нужный интерфейс для конкретного момента: агент на вашем рабочем столе, диаграмма в диалоге, кастомное приложение для решения проблемы. Мы переходим от адаптации под интерфейс ИИ к тому, что ИИ адаптирует свой интерфейс под вас.
Возможности ИИ обгоняют его доступность. Модели уже давно достаточно умны для выдающихся вещей, но мы заставляли людей получать доступ к этому интеллекту через чат-ботов. И, как показывает исследование когнитивной нагрузки, формат чат-бота активно работает против пользователей. По мере улучшения интерфейсов мы увидим, что произойдёт, когда гораздо больше людей смогут реально использовать то, на что способен ИИ. Каждый новый интерфейс, который хоть отчасти закрывает этот разрыв, будет ощущаться как скачок в возможностях ИИ — даже когда модели не менялись (хотя они всё ещё продолжают меняться). Моя догадка в том, что немалая часть «разочарования в ИИ», которое порой высказывают люди, вызвана не тем, что ИИ плох, а тем, что интерфейсы неправильные. Мы создали одну из самых мощных технологий последнего времени, а потом заставили людей пользоваться ею, печатая в окне чата. Скоро это изменится.
Подпишитесь на канал и каждый день читайте лучшие материалы про AI переведенные на русский!
Нашли интересную статью для перевода? Пришлите нашему боту: @ailongreadsbot