Последнее обновление: 29.03.2025 11:34

Китайский стартап DeepSeek улучшил ИИ-модель V3

Китайский ИИ-стартап DeepSeek выпустил крупное обновление для своей языковой модели V3.

DeepSeek-V3-0324 доступна на платформе Hugging Face.

Новая версия нейросети улучшена в областях рассуждений, программирования и письма. Она обходит предшественника и решения от конкурирующих компаний в ряде бенчмарков.

DeepSeek стала заметным игроком на рынке искусственного интеллекта в январе. Тогда компания выпустила ориентированную на рассуждения модель с открытым исходным кодом DeepSeek-R1, которая разработана на существенно меньший бюджет.

V3 с 671 млрд параметров появилась в декабре 2024 года.

CEO китайского стартапа 01.AI Ли Кай-фу считает, что Китай сократил разрыв с США в развитии искусственного интеллекта до трех месяцев, поскольку компании вроде DeepSeek научились использовать чипы и применять алгоритмы более эффективно.

Страна уже стала лидером в области разработки ПО для инфраструктуры, добавил он.

«Раньше, я думаю, разрыв составлял от шести до девяти месяцев, и мы отставали во всем. А сейчас я думаю, что, возможно, на три месяца отстаем в некоторых основных технологиях, а в других специфических областях опережаем», - сказал Кай-фу.

Санкции США создавали краткосрочные проблемы, но также заставляли китайские компании внедрять инновации, подчеркнул эксперт.

Напомним, после резкого взлета популярности ИИ-моделей DeepSeek на компанию обратили внимание власти Китая. Сотрудники работают в новых, более жестких условиях.

Ранее OpenAI рекомендовала правительству США запретить решения китайского конкурента, поскольку проект «субсидируется государством» и «контролируется им».



<Февраль 2025
ПнВтСрЧтПтСбВс
272829303112
3456789
10111213141516
17181920212223
242526272812
3456789
Март 2025
ПнВтСрЧтПтСбВс
242526272812
3456789
10111213141516
17181920212223
24252627282930
31123456
Общество