Българо-Китайска Търговско-промишлена палaта

DeepSeek освобождава V3.2-EXP експериментален модел, намалява цените на API с над 50% · Technode

DeepSeek стартира и е отворен DeepSeek-V3.2-EXP, експериментален модел с голям език, разположен като стъпка към своята архитектура от следващото поколение. Моделът въвежда Deepseek рядко внимание, финозърнест механизъм за рядко внимание, предназначен да подобри ефективността в обучението и извода с дълъг текст, като същевременно поддържа качеството на изхода.

Сравнен спрямо предишния модел V3.1-края при подравнени настройки за обучение, v3.2-EXP даде сравними резултати в наборите от данни за публична оценка. Моделът вече е достъпен на Прегръщащо лице и Modelscopeс придружаващата хартия, освободена на Github. DeepSeek също така актуализира своите приложения и платформи за разработчици до V3.2-EXP, заедно с намаляване на цените на API над 50%. [TechNode reporting]

Свързани

Нашия източник е Българо-Китайска Търговско-промишлена палaта