Академия Alibaba DAMO создает крупнейшую в мире модель предварительного обучения ИИ с параметрами, намного превосходящими Google и Microsoft

Академия Alibaba DAMO создает крупнейшую в мире модель предварительного обучения ИИ с параметрами, намного превосходящими Google и Microsoft

Dalyokiy
Источник: Alibaba DAMO Academy

Академия Alibaba DAMO объявила о последнем этапе разработки мультимодальной модели M6, параметры которой подскочили с 1 триллиона до 10 триллионов, что намного превышает триллионную модель, ранее выпущенную Google и Microsoft. Таким образом, на сегодняшний день, М6 является крупнейшим в мире искусственным интеллектом предварительного обучения.

По данным компании, M6 достиг высочайшего уровня энергоэффективности в отрасли, используя 512 графических процессоров для обучения 10 триллионов моделей в течение 10 дней, потребляя всего 1% своей энергии.

M6 - это общая модель искусственного интеллекта, разработанная DAMO Academy, с мультимодальными и многозадачными функциями. Его когнитивные и творческие способности превосходят традиционный искусственный интеллект, и он особенно хорош в дизайне, письме и вопросах и ответах. Его можно широко использовать в областях электронной коммерции, производства, литературы и искусства, научных исследований и так далее. По сравнению с традиционным ИИ, большая модель имеет в сотни или тысячи раз больше «нейронов» и заранее вводит значительный объем данных, демонстрируя способность к обучению «делать выводы от других», как и у людей.

В то же время DAMO Academy также запустила MUGE, крупнейший в настоящее время китайский набор мультимодальных оценочных данных, который охватывает задачи графического описания, генерации текста изображений и кросс-модального поиска, заполняя пробелы, вызванные отсутствием соответствующие авторитетные китайские критерии оценки.

Чжоу Цзинжэнь, руководитель лаборатории аналитики данных и разведки в DAMO Academy, сказал: "Далее мы глубоко изучим когнитивные механизмы мозга и постараемся улучшить когнитивные способности M6 до уровня, близкого к человеческому. Например, моделируя межмодальное извлечение человеческих знаний и понимание людей, строится базовая структура общих алгоритмов ИИ. С другой стороны, креативность M6 в различных сценариях постоянно совершенствуется, чтобы обеспечить отличную прикладную ценность."

Report Page