Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

Gitee AI 刚刚上线了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的 DeepSeek 模型。值得关注的是,本次上线的四个模型均部署在国产沐曦曦云 GPU 上

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

与全尺寸 DeepSeek 模型相比,较小尺寸的 DeepSeek 蒸馏版本模型更适合企业内部实施部署,可以极大的降低落地成本

同时,这次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平台,更是实现了从芯片到平台,从算力到模型,全国产研发、中国制造

100%国产AI的力量

国产模型 DeepSeek R1

DeepSeek R1 是一款大型混合专家(MoE)模型,拥有 6710 亿个参数,支持 128000 个 Token 的大输入上下文长度。在数学、代码和自然语言推理等任务上表现出色。

本次部署在沐曦曦云 GPU 上的是四个 DeepSeek R1 蒸馏模型,以更小参数量的资源占用,实现了性能与大参数模型旗鼓相当。

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

国产 GPU 沐曦曦云

曦云系列通用 GPU 产品(包括 C550、C500、C500X、C290、C280、N260 等型号)采用完全自主研发的 GPU IP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈,可广泛应用于智能、通用计算和数据处理等场景。

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

在本次部署适配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同时得到沐曦的算力供应商超讯通信的鼎力支持,最终实现了模型的快速部署、稳定调用。

国产平台 Gitee AI

2024 年初上线以来,Gitee AI 平台以 Serverless API、模型引擎、AI 应用为核心功能与服务,致力于让开发者轻松构建和部署 AI 应用,为企业客户提供更加智能、高效的 AI 应用解决方案。

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

100%国产AI免费跑

目前 Gitee AI 上的DeepSeek-R1-Distill系列模型现已面向全体开发者免费使用!免费使用!免费使用!

本次上线的模型参数虽小,但它们表现并不亚于大参数模型,如下图中的DeepSeek-R1-Distill-Qwen-14B,虽然参数较小,但简单任务相较于大参数模型其响应速度更快,同时也具备体现思考过程的能力:

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

模型自强、算力自强、平台自强,100%国产AI的新时代已然来临。与其在“制裁-替代-再制裁”的循环中疲于奔命,不如和我们一起在国产 AI 的土壤上,种出下一个时代的参天大树。

访问 Gitee AI,体验基于沐曦算力的 DeepSeek R1,开启你的100%国产AI开发之旅!

本文转载自:,不代表科技讯之立场。原文链接:https://newscdn.meijiezhushou.com.cn/news/d860ff894a6f49ed9f8a27bc5e755599

陈晨陈晨管理团队

相关推荐

发表回复

登录后才能评论