DickPick бррр нет, DeepSick, ой DeepSeek
Yury Ruzavin | экономист, финансовый консультант, бизнес-аналитикDeepSeek — это молодой китайский AI-стартап, созданный в 2023 году как спин-офф хедж-фонда High-Flyer. На прошлой неделе компания представила свою «рассуждающую» модель искусственного интеллекта под названием R1. Она способна строить логические цепочки на уровне, сравнимом с моделью o1 от OpenAI, а в некоторых случаях даже превосходит её.
Я лично проверил приложении на Android и могу сказать, что у китайского варианта ИИ более "человечный" подход, а также больше уверенности в утверждениях. На ошибки глубоко не тестировал, чтобы не разочаровываться, как в ChatGPT.
Главным отличием DeepSeek является открытость: компания выпустила R1 в формате open-weight. Это означает, что параметры, по которым обучалась модель, доступны, хотя конкретные данные для обучения остаются закрытыми. Кроме того, был опубликован подробный технический отчёт, что позволяет разработчикам по всему миру использовать достижения компании и интегрировать их в собственные проекты. Такой подход может серьёзно повлиять на глобальное распределение сил в области искусственного интеллекта.
Цифра в $6 млн, которая фигурирует в обсуждениях как стоимость обучения R1, вводит в заблуждение. Эта сумма основана на оценке расходов на обучение другой модели компании — V3, и не учитывает затрат на предварительные исследования, эксперименты и дообучение. Реальная стоимость разработки R1, вероятно, составляет десятки миллионов долларов. Тем не менее, это всё равно значительно меньше, чем траты конкурентов. DeepSeek добилась такого сокращения расходов благодаря оптимизации: модель обучалась с использованием меньших вычислительных ресурсов и более дешёвых чипов. Кроме того, обучение проводилось методом чистого обучения с подкреплением (Reinforcement Learning, RL), а не через обучение с учителем (Supervised Fine-Tuning, SFT). RL основывается на самостоятельном опыте модели с системой вознаграждений и наказаний, что делает его более экономичным.
Экономичность подхода DeepSeek вызвала заметную реакцию на рынке. Компания продемонстрировала, что разработка передовых AI-моделей может обходиться дешевле, что ставит под сомнение стратегии американских технологических гигантов, которые инвестируют миллиарды долларов в инфраструктуру и чипы. Однако, несмотря на первоначальный ажиотаж, влияние DeepSeek на рынок пока остаётся неоднозначным.
Ситуация напоминает «парадокс Джевонса» — экономическое явление, когда рост эффективности использования ресурса приводит к увеличению его потребления. Если этот принцип сработает и здесь, то спрос на чипы, такие как те, что производит Nvidia, может вырасти ещё больше. Про это я рассуждал как раз накануне в чате. Ну и традиционно не просто рассуждал, а подкрепил слова — делом. Если кратко, то обвал в NVDA - обычная рыночная перестраховка "на всякий случай". Понятно, что гарантий тут никто не даст, однако угрозы для компании я пока не вижу, наоборот, вчера появилась точка входа в акции.
А какие проблемы и риски есть у самой DeepSeek?
У новой модели DeepSeek есть проблема, свойственная пока всем нейросетям: она часто «галлюцинирует» и выдает совершенно неверные ответы, как и ChatGPT. Все сервера у компании в Китае, а сама она собирает о своих пользователе практически всю информацию, какую может, включая паттерны нажатий клавиш. А ещё нейросеть цензурируется и пока это скорее самоцензура, хотя понятно, что компартия уже держит "руку на пульсе" и будет использовать ИИ в войне технологий с США.