DeepSeek представила оптимизированную под китайские чипы модель V3.1
Китайская компания DeepSeek разработала ИИ-модель V3.1, адаптированную для использования чипов местного производства с режимом «мышление» и без него, сообщает в четверг South China Morning Post.
Издание отмечает расширенные «агентские» возможности (т.е. возможности автономной работы ИИ-модели «на борту» устройства – ред.) V3.1.
Смещение фокуса в сторону ИИ-агентов может свидетельствовать о том, что DeepSeek откажется от планов выпустить модель R2. По информации западных СМИ, с разработкой этого продукта возникли проблемы.
Утверждается, что власти КНР рекомендовали DeepSeek использовать процессоры Ascend, а не «системы Nvidia». Из-за этого разработчик столкнулся с постоянно возникающими техническими проблемами в процессе обучения R2. В конечном итоге в DeepSeek решили использовать чипы Nvidia на одном из этапов обучения модели.
Сообщается, что V3.1 оптимизирована для работы с «китайскими чипами следующего поколения, которые скоро появятся на рынке».