Китай стремительно сокращает разрыв с США в области ИИ

Китай стремительно сокращает разрыв с США в области ИИ

The New York Times

В последние недели китайские технологические компании представили системы, конкурирующие с американскими, и они уже находятся в руках потребителей и разработчиков программного обеспечения.

В этом месяце на Всемирной конференции по искусственному интеллекту в Шанхае основатель стартапа Цуй Дунци продемонстрировал видео, которое он недавно выложил в сеть. В ролике была показана старая фотография женщины с двумя малышами. Затем фотография ожила: женщина подняла малышей на руки, и они засмеялись от удивления.

Видео было создано с помощью технологии ИИ китайской интернет-компании Kuaishou. Технология напоминает генератор видео под названием Sora, который американская компания OpenAI представила в этом году. Но в отличие от Sora, программа доступна широкой публике.

«Мои американские друзья до сих пор не могут использовать Sora», - говорит Цуй. «А вот у нас уже есть лучшие решения».

ИИ сгенерировал видеоролики, созданные на основе текстовых подсказок, с помощью Kling - видеогенератора, созданного китайской компанией Kuaishou.

Текстовый запрос: "Мона Лиза своими руками надевает очки".
Текстовый запрос: "Котенок сидит в самолете и смотрит в окно".
Текстовый запрос: "Эйнштейн играет на гитаре".
Текстовый запрос: "Милая овчарка бежит, прыгает теннисный мяч, теплая атмосфера".

В то время как Соединенные Штаты занимают лидирующие позиции в области разработки ИИ, Китай нагоняет их. В последние недели несколько китайских компаний представили технологии ИИ, которые конкурируют с ведущими американскими системами. И эти технологии уже находятся в руках потребителей, предприятий и независимых разработчиков программного обеспечения по всему миру.

В то время как многие американские компании опасаются, что технологии ИИ могут ускорить распространение дезинформации или нанести другой серьезный вред, китайские компании охотнее предоставляют свои технологии потребителям и даже делятся программным кодом с другими компаниями и разработчиками программного обеспечения. Такой вид обмена компьютерным кодом, называемый открытым исходным кодом, позволяет другим быстрее создавать и распространять свои собственные продукты, используя те же технологии.

Открытый исходный код стал краеугольным камнем в развитии компьютерного программного обеспечения, интернета, а теперь и искусственного интеллекта. Идея заключается в том, что технологии развиваются быстрее, если их компьютерный код находится в свободном доступе для всех желающих изучать, использовать и совершенствовать.

Усилия Китая могут иметь огромное значение для развития технологий ИИ в ближайшие годы. Эта технология может повысить производительность труда работников, послужить источником будущих инноваций и питать новую волну военных технологий, включая автономное оружие.

Когда в конце 2022 года компания OpenAI дала старт буму ИИ, выпустив онлайн чат-бота ChatGPT, Китаю было трудно конкурировать с технологиями, появившимися у американских компаний, таких как OpenAI и Google. (The New York Times подала в суд на OpenAI и ее партнера, Microsoft, заявив о нарушении авторских прав на новостной контент, связанный с системами ИИ). Но прогресс Китая сейчас ускоряется.

Более месяца назад компания Kuaishou выпустила свой видеогенератор Kling в Китае, а в среду он стал доступен для пользователей по всему миру. Незадолго до появления Kling компания 01.AI, соучредителем которой является Кай-Фу Ли, инвестор и технолог, участвовавший в создании китайских офисов Google и Microsoft, выпустила технологию чат-ботов, которая показала почти такие же результаты, как и ведущие американские технологии, в общих эталонных тестах, оценивающих производительность чат-ботов в мире.

Кай-Фу Ли, соучредитель стартапа 01.AI. В этом году компания представила новую версию своей технологии, которая находится на вершине рейтинга лучших технологий мира.
Фото: Криста Шлютер для The New York Times

Новая технология от китайского технологического гиганта Alibaba также поднялась на вершину таблицы лидеров, оценивающей системы ИИ с открытым исходным кодом. «Мы опровергли распространенное мнение о том, что у Китая нет таланта или технологий, чтобы конкурировать с США», - говорит профессор Ли. «Это мнение просто неверно».

В интервью дюжина технологов и исследователей из китайских технологических компаний заявили, что технологии с открытым исходным кодом являются ключевой причиной того, что развитие ИИ в Китае продвигается так быстро. Они рассматривают ИИ с открытым исходным кодом как возможность для страны занять лидирующие позиции.

Но это будет нелегко. Соединенные Штаты по-прежнему занимают лидирующие позиции в области исследований ИИ. И американские чиновники решили не останавливаться на достигнутом.

Белый дом ввел торговое эмбарго, чтобы помешать китайским компаниям использовать самые мощные версии компьютерных чипов, которые необходимы для создания искусственного интеллекта. Группа законодателей представила законопроект, который облегчит Белому дому контроль за экспортом программного обеспечения для ИИ, созданного в США. Другие пытаются ограничить развитие технологий с открытым исходным кодом, которые способствовали росту аналогичных систем в Китае.

Ведущие американские компании также исследуют новые технологии, которые призваны затмить возможности современных чат-ботов и видеогенераторов.

«Китайские компании хороши в воспроизведении и совершенствовании того, что уже есть у США», - говорит Йиран Чен, профессор электротехники и компьютерной инженерии в Университете Дьюка. «Они не так хороши в изобретении чего-то совершенно нового, что обойдет США через пять-десять лет».

Но многие представители китайской технологической индустрии считают, что технологии с открытым исходным кодом могут помочь им развиваться, несмотря на эти ограничения. И если регулирующие органы США будут препятствовать развитию американских проектов с открытым исходным кодом (о чем говорят некоторые законодатели), Китай может получить значительное преимущество. Если лучшие технологии с открытым исходным кодом придут из Китая, американские разработчики могут в итоге построить свои системы на основе китайских технологий.

«ИИ с открытым исходным кодом - это основа развития ИИ», - говорит Клеман Деланг, исполнительный директор компании Hugging Face, которая занимается многими мировыми проектами ИИ с открытым исходным кодом. По его словам, США построили свое лидерство в области ИИ благодаря сотрудничеству между компаниями и исследователями, «и похоже, что Китай может сделать то же самое».

Клеман Деланг (справа), руководитель компании Hugging Face, говорит, что технологии с открытым исходным кодом могут помочь Китаю добиться успехов в области ИИ.
Фото: Кенни Холстон/ The New York Times

В то время как любой человек, пользующийся компьютером, может изменить код программного обеспечения с открытым исходным кодом, для кардинального изменения системы ИИ требуется много данных, навыков и вычислительных мощностей. По словам Фу Хонгю, директора по управлению ИИ в исследовательском институте Alibaba AliResearch, открытый исходный код обычно предполагает, что строительные блоки системы служат фундаментом, на котором другие могут построить что-то новое.

Как и в других странах, в Китае ведутся активные споры о том, следует ли предоставлять доступ к новейшим технологическим достижениям всем желающим или хранить их в секрете. Некоторые, например Робин Ли, исполнительный директор Baidu, одной из немногих компаний в Китае, создавших собственную технологию ИИ полностью с нуля, считают, что технология наиболее выгодна и безопасна в руках ограниченного числа людей.

Системы ИИ требуют огромных ресурсов: талантов, данных и вычислительных мощностей. Пекин дал понять, что выгоды от таких инвестиций должны быть общими. Китайское правительство вливает деньги в проекты ИИ и субсидирует такие ресурсы, как вычислительные центры.

Однако китайские технологические компании сталкиваются с серьезным ограничением в развитии своих систем ИИ: соблюдение строгого цензурного режима Пекина, который распространяется и на технологии генеративного ИИ.

Новый видеогенератор Kling компании Kuaishou, похоже, был обучен следовать правилам. Текстовые запросы с любым упоминанием президента Китая Си Цзиньпина или таких спорных тем, как феминизм и кризис недвижимости в стране, выдавали сообщения об ошибках. На запрос изображения Всекитайского собрания народных представителей в этом году было выдано видео, на котором делегаты сдвигаются со своих мест.

Компания Kuaishou не ответила на вопросы о том, какие меры были приняты для предотвращения создания Kling вредоносного, поддельного или политически окрашенного контента.

Текстовый запрос: "Астронавт отталкивается от лунной поверхности и направляется в космос".
Текстовый запрос: "Огромная панда играет на гитаре на берегу озера".
Текстовый запрос: "Китайский мальчик в очках ест вкуснейший чизбургер в ресторане быстрого питания, а его глаза закрыты от удовольствия".
Текстовый запрос: "Пара, держась за руки, гуляет под звездным небом, а звезды эпично пересекают небо".
Видео сгенерировано на основе старого фото без текстовых подсказок.

Выкладывая в свободный доступ свои самые передовые технологии ИИ, китайские технологические гиганты демонстрируют готовность внести свой вклад в общий технологический прогресс страны, поскольку Пекин считает, что мощь и прибыль технологической индустрии должны быть направлены на достижение цели самодостаточности.

Некоторые в Китае опасаются, что страна будет испытывать трудности с накоплением вычислительных чипов, необходимых для создания все более мощных технологий. Однако это еще не помешало китайским компаниям создать новые мощные технологии, способные конкурировать с американскими системами.

В конце прошлого года компания доктора Ли 01.AI подверглась насмешкам в социальных сетях, когда кто-то обнаружил, что компания построила свою систему ИИ с использованием технологии с открытым исходным кодом, изначально созданной Meta, владельцем Facebook и Instagram. Некоторые увидели в этом символ зависимости Китая от американской изобретательности.

Шесть месяцев спустя 01.AI представила новую версию своей технологии. Теперь она занимает верхнюю строчку рейтинга лучших технологий мира. Примерно в то же время команда из Стэнфордского университета в Калифорнии представила Llama 3-V, утверждая, что она превосходит другие ведущие модели. Но вскоре китайские исследователи заметили, что модель основана на системе с открытым исходным кодом, изначально созданной в Китае.

Это была обратная сторона споров вокруг 01.AI в прошлом году: не китайские разработчики строили на основе американских технологий, а американские разработчики строили на основе китайских продуктов.

По мнению Деланга, если регулирующие органы ограничат проекты с открытым исходным кодом в Соединенных Штатах, а китайские технологии с открытым исходным кодом станут золотым стандартом, подобное может стать нормой.

«Если тенденция сохранится, то это будет становиться все более и более сложной задачей для США», - говорит он.

Report Page