Китайский стартап DeepSeek улучшил ИИ-модель V3

26.03.2025 10:54 | АФН

Китайский ИИ-стартап DeepSeek выпустил крупное обновление для своей языковой модели V3.

DeepSeek-V3-0324 доступна на платформе Hugging Face.

Новая версия нейросети улучшена в областях рассуждений, программирования и письма. Она обходит предшественника и решения от конкурирующих компаний в ряде бенчмарков.

DeepSeek стала заметным игроком на рынке искусственного интеллекта в январе. Тогда компания выпустила ориентированную на рассуждения модель с открытым исходным кодом DeepSeek-R1, которая разработана на существенно меньший бюджет.

V3 с 671 млрд параметров появилась в декабре 2024 года.

CEO китайского стартапа 01.AI Ли Кай-фу считает, что Китай сократил разрыв с США в развитии искусственного интеллекта до трех месяцев, поскольку компании вроде DeepSeek научились использовать чипы и применять алгоритмы более эффективно.

Страна уже стала лидером в области разработки ПО для инфраструктуры, добавил он.

«Раньше, я думаю, разрыв составлял от шести до девяти месяцев, и мы отставали во всем. А сейчас я думаю, что, возможно, на три месяца отстаем в некоторых основных технологиях, а в других специфических областях опережаем», - сказал Кай-фу.

Санкции США создавали краткосрочные проблемы, но также заставляли китайские компании внедрять инновации, подчеркнул эксперт.

Напомним, после резкого взлета популярности ИИ-моделей DeepSeek на компанию обратили внимание власти Китая. Сотрудники работают в новых, более жестких условиях.

Ранее OpenAI рекомендовала правительству США запретить решения китайского конкурента, поскольку проект «субсидируется государством» и «контролируется им».

Февраль 2025

Пн

Вт

Ср

Чт

Пт

Сб

Вс

Март 2025

Пн

Вт

Ср

Чт

Пт

Сб

Вс

Общество

afn.by заблокирован Мининформом

Помоги сайту