英伟达发布基于DeepSeek-R1 AI推理系统 创全球性能新纪录

英伟达发布基于DeepSeek-R1 AI推理系统 创全球性能新纪录

在3月19日举行的NVIDIA GTC 2025技术大会上,英伟达正式推出基于DeepSeek-R1大模型的AI推理系统。官方披露,搭载八块Blackwell架构GPU的NVIDIA DGX超级计算机,在运行完整版6710亿参数模型时,实现单用户每秒250个令牌的实时响应速度,系统整体吞吐量峰值突破每秒3万令牌,刷新全球大模型推理性能纪录。

此次发布的DeepSeek-R1系统采用英伟达最新Blackwell GPU集群,单机配置八块加速卡,支持FP8精度下的动态稀疏计算。技术文档显示,该模型在处理千亿级参数时,推理延迟较上一代Hopper架构降低45%,能源效率提升2.3倍,可同时承载超过1200个并发用户的交互需求。

英伟达现场演示了该系统在多模态场景下的应用表现:在实时视频流解析任务中,系统同步完成画面识别、语义理解和逻辑推理,响应时间稳定在900毫秒以内。企业级解决方案中,DeepSeek-R1已部署于金融高频交易风控、工业数字孪生仿真等20余个垂直领域。

据官方测试数据,该系统在语言生成基准测试中,单卡处理速度达每秒1800个汉字,较开源同类模型快4倍。在医疗影像分析场景,其推理准确率较传统方案提升12个百分点,误诊率降至0.37%。全球已有三家超算中心确认采购该架构,计划于2025年三季度投入运营。

英伟达同时宣布,DeepSeek-R1的云服务接口将于6月向开发者开放,支持API调用和私有化部署。目前,该系统兼容PyTorch、TensorFlow等主流框架,并针对生物制药、自动驾驶等数据密集型行业推出定制优化方案。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/710872.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论