英伟达NVIDIA推出企业级生成式AI微服务，加速AI应用部署与创新

科技探索者 • 2024年3月20日 10:04:00 • AI, 新闻

在人工智能领域，企业正面临着前所未有的机遇与挑战。为了满足市场对于快速、高效且定制化AI应用的需求，NVIDIA于太平洋时间2024年3月18日在其总部加利福尼亚州圣何塞，隆重推出了数十项企业级生成式AI微服务。这些微服务旨在为开发者提供一个强大的平台，帮助他们创建和部署定制化的生成式AI助手，同时确保企业对知识产权的完整所有权和控制权。

这些生成式AI微服务是基于NVIDIA CUDA平台开发的云原生服务目录，其中包括NVIDIA NIM微服务，该服务能够优化NVIDIA及其合作伙伴生态系统中20多个热门AI模型的推理性能。此外，用户还可以以NVIDIA CUDA-X微服务的形式，利用NVIDIA加速软件开发套件、库和工具，进行增强生成检索（RAG）、护栏、数据处理、高性能计算（HPC）等操作。值得一提的是，NVIDIA还发布了20多项针对医疗领域的NIM和CUDA-X微服务，进一步拓宽了AI在医疗行业的应用前景。

这些微服务的推出，为NVIDIA的全栈计算平台增添了新的一层。它们将模型开发人员、平台提供商和企业紧密地连接在一起，形成了一个强大的AI生态系统。通过这个标准化的路径，企业可以轻松地运行针对NVIDIA CUDA安装基础（包括云、数据中心、工作站和PC中的数以亿计的GPU）优化的定制AI模型。

NVIDIA创始人兼首席执行官黄仁勋表示，企业平台拥有大量的数据资源，这些数据可以转化为生成式AI助手，为企业带来巨大的商业价值。NVIDIA与合作伙伴生态系统共同开发的这些容器化AI微服务，将成为各行业企业成为AI公司的基石。

值得一提的是，NIM推理微服务的推出，极大地缩短了部署时间，从传统的几周缩短至几分钟。这些微服务提供了基于NVIDIA推理软件的预构建容器，包括Triton推理服务器和TensorRT-LLM，使开发者能够快速构建并部署AI应用。此外，NIM微服务还为语言、语音和药物发现等领域提供了行业标准API，让开发者能够利用自己基础设施中的专有数据，实现更加安全、高效的AI应用开发。

在实际应用中，这些生成式AI微服务已经得到了广泛应用。例如，ServiceNow宣布正在使用NIM来加快针对特定领域的全新助手和其他生成式AI应用的开发和部署。此外，用户还可以从亚马逊SageMaker、谷歌Kubernetes Engine和微软Azure AI等平台访问NIM微服务，并与Deepset、LangChain和LlamaIndex等流行的AI框架进行集成。

除了NIM微服务外，CUDA-X微服务也为AI应用的开发提供了强大的支持。这些微服务为数据准备、定制和训练提供了端到端的构建模块，助力企业加速开发生产级AI。通过利用NVIDIA Riva进行定制语音和翻译AI的开发，以及使用NVIDIA cuOpt进行路由优化，企业可以进一步提升AI应用的性能和准确性。此外，NeMo Retriever微服务的推出，使得开发者能够将AI应用与业务数据紧密链接，从而提高AI助手的准确性和洞察力。

综上所述，NVIDIA推出的企业级生成式AI微服务为企业提供了强大的技术支持和创新动力。这些微服务不仅简化了AI应用的开发和部署流程，还为企业带来了更高的灵活性和性能。随着AI技术的不断发展，相信这些微服务将在未来发挥更加重要的作用，推动AI应用的普及和创新。

原创文章，作者：科技探索者，如若转载，请注明出处：https://www.kejixun.com/article/638486.html

AI NVIDIA 生成式AI微服务英伟达

科技探索者管理团队

0 0

产品

苹果WWDC 2024临近，iOS 18预计带来重大AI升级

随着苹果全球开发者大会（WWDC）2024的临近，业界对新一代iOS 18操作系统的期待愈发高涨。据可靠消息，今年的WWDC将于美国太平洋时间6月10日至14日举行，届时iOS 1…

Apple
2024年4月27日
0
新闻

NVIDIA向OpenAI交付全球首台DGX H200 引领人工智能发展

NVIDIA在当地时间周四，向OpenAI位于旧金山的办公室交付了全球首台DGX H200，这一消息由OpenAI总裁格雷格·布洛克曼（Greg Brockman）在社交媒体上宣布

科技探索者
2024年4月26日
0
新闻

英伟达CEO黄仁勋将率先亮相2024台北国际电脑展，多家科技巨头CEO将发表主题演讲

有消息称，备受瞩目的2024台北国际电脑展（Computex）即将于6月4日至6月7日盛大举行。据官方消息，AMD、英特尔和高通等全球科技巨头已经确认其CEO将亲临现场并发表主题演…

科技探索者
2024年4月25日
0
AI

创业公司Kimi大模型产品火爆出圈，能否持续引领AI新趋势？

近日，一家仅成立一年的创业公司凭借一款效果出众的大模型产品Kimi，在AI领域掀起了一股新的波澜。这款面向C端用户的智能助手以其独特的长文本处理能力和多场景应用功能，赢得了市场的广…

AI
2024年4月24日
1
商业

英伟达股价波动中见机遇，Blackwell系列前景乐观提振投资者信心

在经历股价的大幅波动后，英伟达（Nvidia）的最新市场需求与产品潜力再次成为市场关注的焦点。根据Melius Research分析师Ben Reitzes的最新报告，尽管近期英伟…

商业头条
2024年4月24日
0
AI

微软 AI 超级计算团队迎来 Meta 前高管 Jason Taylor

Taylor 的加入将为微软的 AI 超级计算团队带来更多经验和专业知识，有望推动该团队在人工智能领域的进一步发展和创新

苹果派
2024年4月23日
0
新闻

英伟达CEO黄仁勋大胆预言：人形机器人将迎“白菜价”时代，未来或将走入千家万户！

在近日举办的CadenceLIVE Silicon Valley 2024活动中，英伟达CEO黄仁勋与Cadence总裁兼CEO阿尼鲁德·德夫甘进行了一场引人瞩目的“围炉谈话”。在…

秋秋
2024年4月22日
0
新闻

微软Clipchamp视频编辑工具推出AI新功能：快速清理无声部分内容

近日，微软公司旗下知名的视频编辑工具Clipchamp宣布上线了一项全新的AI功能——Silence Removal（无声部分移除）。这一创新功能通过人工智能技术，能够自动筛选出视…

好奇宝宝
2024年4月19日
0
新闻

OpenAI高管罕见合体访谈：未来AI发展将震惊世界

近日，人工智能领域的领军企业OpenAI的CEO Sam Altman和COO Brad Lightcap罕见合体，接受了投资人播客VC20的专访。在访谈中，两位高管共同回顾了Op…

百度
2024年4月18日
0
新闻

苹果iOS 18将推出全新AI功能，设备端运行引领行业创新

在人工智能领域持续创新的苹果公司，近日再次引发了业界的广泛关注。据彭博社知名记者马克·古尔曼透露，苹果正计划在其即将发布的iOS 18操作系统中首次推出全新的人工智能功能，而且这些…

Apple
2024年4月17日
0
AI

生成式AI投资激增，美国领跑全球，中国AI专利数领先

在全球AI领域私人投资连续两年下滑的背景下，生成式AI领域却异军突起，成为投资市场的新宠。据最新统计数据显示，去年生成式AI投资大幅增长，比2022年增长了近2倍，总额达到252亿…

AI
2024年4月17日
0
AI

Create2024百度AI开发者大会盛大开幕，科技巨头共襄盛会

深圳国际会展中心（宝安）今日迎来了科技圈的一大盛事——Create2024百度AI开发者大会。这场备受瞩目的科技盛宴吸引了全球近万名顶尖开发者和业界领袖，共同探讨人工智能的未来发展…

百度
2024年4月16日
0
新闻

英伟达全新旗舰显卡RTX 5090即将问世，核心数激增50%

近日，据多个消息来源透露，英伟达计划在今年第四季度推出两款全新的显卡产品——RTX 5090和RTX 5080。

苹果派
2024年4月15日
0
商业

NEAR 联创 Illia：为何 AI 需要 Web3？

近日，NEAR联创Illia出席了“2024香港Web3嘉年华”活动，并发表AI和Web3相关话题的重要演讲。本文特对其演讲进行了整理，略有删减。大家好，我是NEAR的联合创始人…

cl15
2024年4月11日
0
AI

美得克萨斯州引领潮流，率先采用AI阅卷评分系统

美国得克萨斯州在创新教育的道路上又迈出了一大步。近日，该州宣布在学术准备评估（STAAR）考试中引入“自动评分引擎”，成为美国首个公开采用人工智能阅卷评分的州。此举不仅标志着教育考…

AI
2024年4月11日
0
AI

AI电商时代来临？eBay上线人工智能驱动的时尚穿搭购物

随着人工智能（AI）技术的飞速发展，电子商务（电商）领域正在经历一场前所未有的变革。AI电商不仅仅是一个概念，它已经成为推动在线购物体验进步的强大动力。从个性化推荐到智能客服，AI…

商业头条
2024年4月10日
0
AI

Google Gemini 1.5 Pro推出公共预览版它可以听到声音

在最近的Google Next活动中，谷歌宣布了对其人工智能模型Gemini 1.5 Pro的重大更新，这一更新为模型带来了前所未有的听觉能力。Gemini 1.5 Pro现在能够…

AI
2024年4月10日
3
AI

英特尔追上了？Intel Gaudi 3芯片在大语言模型训练方面比Nvidia H100快50%

英特尔（Intel）表示，其新的Gaudi 3芯片在训练特定大型语言模型方面比Nvidia英伟达上一代H100处理器快50%。英特尔Intel在 Vision 活动中推出了新版本…

AI
2024年4月10日
0
产品

官宣：华为新款MateBook X Pro笔记本接入盘古大模型

今日，华为终端官方发布海报，正式宣布将推出全新MateBook X Pro笔记本，新款笔记本主打轻、强，并突出AI化。此前一天，华为终端官方预热海报已透露，智界S7与PC新品将同台…

HUAWEI
2024年4月10日
0
产品

英伟达NVIDIA RTX 50系列显卡预计2024年第四季度发布，助力高端市场再升级

英伟达NVIDIA，全球知名的图形处理器（GPU）制造商，近日传出重磅消息，其备受期待的GeForce RTX 50系列显卡预计将于2024年第四季度正式亮相。这一系列的发布，不仅…

李小白
2024年4月9日
2

发表回复

登录后才能评论

英伟达NVIDIA推出企业级生成式AI微服务，加速AI应用部署与创新

相关推荐

发表回复