Проверяемость

@ai_longreads

Карпатый рассуждает о том, что проверяемость задачи — это ключевой фактор, определяющий, насколько легко её можно автоматизировать с помощью современного ИИ.

Это AI-перевод статьи, сделанный каналом Про AI: Лучшие Статьи и Исследования.

Проверяемость

Original Title: Verifiability Автор: karpathy Дата публикации: 17 ноября 2025

ИИ сравнивают с различными историческими прецедентами: электричеством, промышленной революцией и так далее. На мой взгляд, самая сильная аналогия — это сравнение ИИ с новой вычислительной парадигмой, потому что и то, и другое фундаментально связано с автоматизацией обработки цифровой информации.

Если бы вы прогнозировали влияние вычислительной техники на рынок труда примерно в 1980-х годах, самой предсказательной характеристикой задачи или профессии была бы специфицируемость (specifiability), то есть, преобразуете ли вы информацию механически, по рутинному, легко описываемому алгоритму (примеры: машинопись, бухгалтерия, люди-вычислители и т.д.)? В то время это был класс программ, которые вычислительные возможности той эпохи позволяли нам писать (вручную, руками). Я называю написанные вручную программы «Software 1.0».

С появлением ИИ мы теперь способны создавать новые программы, которые раньше никогда не смогли бы написать вручную. Мы делаем это, задавая цели (например, точность классификации, функции вознаграждения), и ищем в пространстве программ с помощью градиентного спуска, чтобы найти нейронные сети, которые хорошо работают с учётом этой цели. Об этом мой пост в блоге про Software 2.0, написанный некоторое время назад. В этой новой парадигме программирования наиболее предсказательной характеристикой становится проверяемость (verifiability). Если задача или работа проверяема, то её можно оптимизировать напрямую или через обучение с подкреплением, и нейронная сеть может быть обучена работать исключительно хорошо. Речь идёт о том, в какой степени ИИ может что-то «практиковать». Среда должна быть:

Чем более проверяема задача или работа, тем больше она поддаётся автоматизации в новой парадигме программирования. Если она не проверяема, то приходится полагаться на магию обобщения нейронной сети — скрестив пальцы — или на более слабые средства вроде имитации. Именно это движет «изрезанной» границей прогресса в больших языковых моделях. Задачи, которые проверяемы, прогрессируют быстро, возможно, даже превосходя способности ведущих экспертов (например, математика, программирование, количество времени, потраченное на просмотр видео, всё, что похоже на головоломки с правильными ответами), в то время как многие другие отстают (творческие, стратегические задачи, задачи, сочетающие реальные знания, состояние, контекст и здравый смысл).

Подпишитесь на канал и каждый день читайте лучшие материалы про AI переведенные на русский!

Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot

Проверяемость

Проверяемость

Report Page