DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K

IT之家 8 月 20 日消息,DeepSeek 昨天深夜在 Hugging Face 上开源了新模型 V3.1-Base,根据介绍,该模型将上下文长度拓展至 128K,参数约为 …

Previous: