Эндрю Нг: Состояние ИИ-агентов | Интервью LangChain
Дмитрий Жечков (https://t.me/llm_notes)Ссылка на интервью: https://www.youtube.com/watch?v=4pYzYmSdSH4
Введение
Ведущий представляет Эндрю Нга, отмечая его вклад в развитие LangChain и образовательные курсы по глубокому обучению. Эндрю Нг был одним из первых, кто поддержал LangChain, пригласив команду создать курс на платформе DeepLearning.AI.
Агентность vs Агенты
Ведущий: Вы часто говорите об "агентности" приложений, а не о том, является ли что-то агентом. Можете пояснить эту концепцию?
Эндрю Нг: Около полутора лет назад я заметил, что люди тратят много времени на споры о том, что является агентом, а что нет. Вместо этого я предложил рассматривать различные степени агентности - от небольшой автономии до высокой автономии. Это позволяет сосредоточиться на создании систем, а не на терминологических спорах.
Текущее состояние разработки агентов
Эндрю Нг: Моя команда регулярно использует LangGraph для решения сложных задач. Однако я вижу множество бизнес-возможностей в довольно линейных рабочих процессах или линейных с небольшими ответвлениями.
Многие бизнес-процессы включают:
- Просмотр форм на веб-сайтах
- Веб-поиск
- Проверка баз данных на соответствие требованиям
- Копирование и вставка данных между формами
Основная проблема заключается в том, что предприятиям все еще сложно понять, как превратить существующие процессы в агентные рабочие потоки.
Ключевые навыки для разработчиков агентов
Эндрю Нг выделяет несколько критически важных навыков:
1. Система оценки (Evals)
- Многие команды слишком долго полагаются только на человеческую оценку
- Важно быстро внедрять автоматизированные системы оценки
- Начинать можно с простых eval'ов, которые можно создать за 20 минут
- Постепенно улучшать их качество
2. Тактические знания
- Умение быстро принимать решения о том, что делать дальше в проекте
- Понимание, когда прекратить работу над компонентом, который не может быть исправлен
- Опытные команды знают, когда найти обходной путь вместо попыток исправить проблемный компонент
Недооцененные инструменты и технологии
Голосовые приложения
Эндрю Нг особенно выделяет голосовой стек:
- Видит большой интерес со стороны крупных предприятий
- Голосовой ввод менее пугающий для пользователей, чем текстовые промпты
- Люди более склонны к спонтанному общению голосом
- Основная проблема - латентность (желательно менее 500 мс, максимум 1 секунда)
Решения для латентности:
- Использование "пре-ответов" (например, "Хм, это интересно" или "Дайте подумать")
- Фоновые звуки контакт-центра вместо полной тишины
Программирование с ИИ-помощниками
- Все сотрудники AI Fund, включая администратора и юрисконсульта, умеют программировать
- Это повышает продуктивность в различных профессиональных функциях
- Рекомендует всем изучить хотя бы один язык программирования (например, Python)
MCP (Model Context Protocol)
Эндрю Нг положительно оценивает MCP:
- Заполняет важный пробел на рынке
- Стандартизирует интерфейсы для инструментов и источников данных
- Сокращает время, затрачиваемое на "сантехнику" интеграций
Текущие проблемы MCP:
- Многие MCP-серверы в интернете не работают
- Проблемы с аутентификацией
- Нужны механизмы иерархического обнаружения для больших API
Мульти-агентные системы
Эндрю Нг считает эту область очень ранней:
- Сложно заставить работать даже одного агента
- Успешные примеры в основном когда одна команда создает несколько агентов
- Мало примеров успешного взаимодействия агентов от разных команд
"Vibe Coding" и ИИ-помощники в программировании
Эндрю Нг не любит термин "vibe coding":
- Название вводит в заблуждение - это глубоко интеллектуальная деятельность
- Программирование с ИИ-помощниками очень утомительно
- Позволяет писать код на языках, которыми владеешь хуже (например, JavaScript для Python-разработчика)
Важность обучения программированию:
- Критикует советы не изучать программирование из-за ИИ
- История показывает: когда программирование становится проще, больше людей начинают программировать
- Понимание работы компьютера помогает более точно инструктировать ИИ
Советы для стартапов
Два главных предиктора успеха стартапа:
1. Скорость выполнения
- Самый важный фактор успеха
- Опытные команды работают намного быстрее, чем многие могут представить
2. Технические знания
- Самый редкий ресурс
- Знания о маркетинге и продажах более распространены
- Технологии развиваются так быстро, что глубокие технические знания критически важны
AI Fund работает исключительно с глубоко техническими людьми, которые понимают, как ускорить разработку в два раза.
Заключение
Эндрю Нг подчеркивает, что область ИИ-агентов все еще находится на раннем этапе развития, но видит огромный потенциал в автоматизации бизнес-процессов. Ключ к успеху - сочетание технической экспертизы, правильных инструментов оценки и способности быстро итерировать и принимать решения.