谷歌推出Gemini 1.5 Pro模型：新增音频理解及系统指令功能，引领AI技术新突破

Google • 2024年4月11日 11:36:00 • AI, 产品

近日，科技巨头谷歌在AI领域再度迈出重要步伐，正式向全球180多个国家和地区推出其备受期待的Gemini 1.5 Pro模型。该模型不仅继承了Gemini系列的一贯优秀表现，还在原有基础上实现了重大升级，特别新增了音频理解能力，并引入了系统指令和JSON模式等新功能，为开发者提供了更为强大和灵活的控制手段。

据悉，Gemini 1.5 Pro模型自两个月前在Google Ai Studio中供部分开发者测试以来，就凭借其1M上下文窗口的出色性能和原生的音频理解能力受到了广泛关注。此次全球范围内的正式推出，无疑将进一步推动AI技术在各个领域的应用和发展。

在音频理解方面，Gemini 1.5 Pro模型实现了对上传的视频图像（帧）和音频（语音）的推理能力，这一功能的解锁为音频和视频处理领域带来了新的用例和可能性。开发者可以通过Google Ai Studio和Gemini API调用该模型，对音频和视频数据进行深度分析和处理，从而开发出更加智能和高效的应用。

此外，Gemini 1.5 Pro模型还新增了系统指令功能，允许开发者通过定义角色、格式、目标和规则等方式，对模型的响应进行精确指导。这一功能的引入将极大地提高模型的可控性和适应性，使得开发者能够针对不同用例对模型进行更加精准的引导。

同时，为了满足开发者对结构化数据的需求，Gemini 1.5 Pro模型还支持JSON模式输出。在JSON模式下，模型仅输出为JSON对象，便于从文本或图像中提取结构化数据。开发者可以使用cURL进行调用，后续还将支持Python SDK，进一步简化了数据处理的流程。

在函数调用方面，Gemini 1.5 Pro模型也进行了改进。开发者现在可以选择不同的模式来限制模型的输出，从而提高输出的可靠性和准确性。无论是选择文本、函数调用还是仅函数本身等模式，都能根据具体需求进行灵活调整。

除了上述功能升级外，谷歌还推出了下一代文本嵌入模型text-embedding-004/text-embedding-preview-0409。据谷歌称，该模型在MTEB基准测试中实现了更强的检索性能，并且优于具有可对比纬度的现有模型。这一新嵌入式模型的推出将为文本处理和分析提供更加高效和精准的工具。

总的来说，Gemini 1.5 Pro模型的推出标志着谷歌在AI技术领域的又一次重要突破。通过新增音频理解、系统指令和JSON模式等功能，该模型为开发者提供了更加强大和灵活的控制手段，将有望推动AI技术在各个领域的应用和发展。未来，我们期待看到更多基于Gemini 1.5 Pro模型的创新应用和产品问世，为人类生活带来更多便利和惊喜。

原创文章，作者：Google，如若转载，请注明出处：https://www.kejixun.com/article/645877.html

Gemini 1.5 Pro 谷歌

Google认证作者

0 0

手机

谷歌Pixel 8a迎来首个软件更新，新增AI壁纸功能并安装最新安全补丁

近日，谷歌在I/O大会的首日宣布了一系列新产品和更新，其中Pixel 8a作为中端市场的明星产品，也悄然迎来了它的首个软件更新。此次更新不仅为设备带来了最新的安全补丁，还引入了一项…

Google
2024年5月15日
0
新闻

谷歌正式发布Gemini 1.5 Flash大模型：轻量化、响应速度极快

5月15日消息，今天凌晨，谷歌正式召开了I/O大会，宣布谷歌已全面进入Gemini时代。

在一年前的I/O大会上，谷歌才首次发布Gemini大模型，而今年大模型、AI等已经成为了绝对的主角，甚至连新版安卓都没提。

潮玩君
2024年5月15日
0
手机

谷歌Pixel 9系列真机泄露图曝光：三款新机型包括Pixel 9 Pro XL

近日，网络上流传出一系列谷歌Pixel 9系列真机泄露图，详细展示了Pixel 9、Pixel 9 Pro以及首次亮相的Pixel 9 Pro XL三款新机的外观设计和部分规格。这…

Google
2024年5月15日
0
新闻

谷歌改进版搜索生成体验将登陆美国，全面升级人工智能服务

在今日举行的谷歌I/O大会上，谷歌首席执行官桑德尔·皮查伊宣布，该公司即将在美国全面推出改进版搜索生成体验（SGE），并计划不久后扩展至更多国家。这项新功能的推出标志着谷歌在人工智…

李小白
2024年5月15日
0
AI

Gemini 1.5 Flash vs Gemini原型：轻量高效与全能多面的AI对决

在人工智能领域，谷歌一直以其创新的技术和强大的产品引领着行业的发展。近日，谷歌在年度开发者大会I/O上发布了其双子座家庭的新成员——Gemini 1.5 Flash，这款轻量级的人…

AI
2024年5月15日
0
AI

谷歌发布新型AI模型Gemini 1.5 Flash，提升本地设备运行速度

在本周的谷歌年度开发者大会I/O上，谷歌宣布了双子座家庭的新成员——Gemini 1.5 Flash，一款专为速度和效率优化的新型人工智能模型。该模型不仅扩展了谷歌在人工智能领域的…

Google
2024年5月15日
0
AI

谷歌I/O大会揭幕新搜索功能：AI驱动，重塑搜索体验

谷歌正在引领一场搜索革命。在本周二的谷歌年度开发者大会I/O上，该公司宣布了其全球主流搜索引擎的重大新变化，这些变化由人工智能（AI）驱动，旨在将搜索体验提升到一个全新的水平。谷…

科技探索者
2024年5月15日
0
AI

谷歌发布新型视频生成模型Veo，挑战OpenAI的Sora

在人工智能领域，视频生成技术一直是研究的热点。近日，谷歌2024 I/O开发者大会上宣布推出一款名为Veo的新型视频生成模型，剑指OpenAI三个月前推出的Sora，展示了其在视频…

科技新闻
2024年5月15日
0
AI

谷歌I/O 2024：Gemini AI聊天机器人深度集成Android 15，引领智能设备新纪元

在今日举行的谷歌I/O 2024大会上，谷歌宣布了一项重大更新——Gemini AI聊天机器人将深度集成于即将发布的Android 15操作系统中，这一举措标志着人工智能技术在移动…

野游栗
2024年5月15日
0
新闻

谷歌I/O大会一览：人工智能成核心，推出多项创新更新

在今日举行的谷歌年度开发者大会I/O上，人工智能（AI）成为贯穿始终的主题。谷歌首席执行官桑德尔·皮查伊在大会闭幕时透露，会议期间公司提及“人工智能”的次数高达121次，凸显了谷歌…

Google
2024年5月15日
0
手机

谷歌Pixel 8a最新消息：新增Snapshot桌面小部件与Inside Out主题壁纸

科技媒体9to5Google近日发布了关于谷歌Pixel 8a手机的最新消息，这款备受欢迎的智能手机新增了两项引人注目的新特性：Snapshot桌面小部件和Inside Out主题…

Google
2024年5月15日
0
手机

谷歌Pixel 9系列最新爆料：三款新机搭载Tensor G4，内存最高达16GB

近日，备受期待的谷歌Pixel 9系列手机再次曝光，三款新机——Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL的实物照片和规格信息在俄罗斯网站rozetked…

Google
2024年5月14日
0
新闻

2024年谷歌I/O大会前瞻：期待中的技术盛宴

随着科技的飞速发展，全球开发者翘首以盼的谷歌I/O大会即将于5月14日拉开帷幕。今年的I/O大会无疑将为我们带来一场技术盛宴，其中Android 15的详细信息、人工智能的最新进展…

Google
2024年5月14日
0
手机

拒绝谷歌Pixel 8a静待Pixel 9 Pro的原因有以下几点

在当今的智能手机市场中，消费者面临着前所未有的选择困境。每当一款新品即将发布，旧款手机往往就会陷入尴尬的境地，因为它虽然仍然是一款优秀的产品，但新品的吸引力总是那么强烈，让人忍不住…

Google
2024年5月14日
0
新闻

Android 15新测试版发布：双指轻敲放大屏幕，更多创新功能抢先看

谷歌在推进Android系统更新方面始终保持着快速的步伐，近日，Android 15的测试版1.2再次亮相，为用户带来了诸多令人瞩目的新功能与优化。这款全新的操作系统自今年2月发布…

科技新闻
2024年5月12日
0
产品

谷歌推出iPad用户专享优惠：Pixel平板电脑399美元起，以旧换新活动火热进行中

谷歌近日针对iPad用户推出了一项极具吸引力的优惠活动，通过以旧换新方式，iPad用户可以几乎零成本获得全新的Pixel平板电脑。此次活动不仅覆盖了多款iPad型号，同时也为三星平…

Google
2024年5月12日
0
手机

谷歌Pixel 7 Pro 512GB版在Woot平台限时优惠至479美元，性价比爆表！

对于寻求高端安卓手机而不愿支付最新旗舰机价格的消费者来说，Woot平台上的一个惊喜优惠无疑是一个好消息。谷歌Pixel 7 Pro的512GB版本现正以惊人的479美元价格销售，比…

若安丶
2024年5月12日
0
产品

沃尔玛Walmart即将发布Onn Pro 4K谷歌电视盒子：售价49.88美元

近日，沃尔玛Walmart宣布即将推出旗下自有品牌Onn的全新流媒体设备——Onn Pro谷歌电视4K专业流媒体盒子，售价定为49.88美元。尽管没有给出确切的发布日期，但沃尔玛表…

Google
2024年5月11日
0
新闻

谷歌Chrome浏览器更新至124.0.6367.201/202，紧急修复RAM高危漏洞CVE-2024-4671

近日，谷歌发布了针对桌面平台Chrome浏览器的最新更新版本124.0.6367.201/202，紧急修复了一项编号为CVE-2024-4671的高危漏洞。该漏洞据称已被黑客利用，…

Google
2024年5月11日
0
新闻

谷歌“查找我的设备”网络开始逐步向全球推出

谷歌近日宣布，其备受期待的“查找我的设备”网络已开始逐步向全球范围内的Android设备推出，这一功能旨在帮助用户定位并找回丢失或被盗的电子设备，即使设备处于离线状态。谷歌在20…

Google
2024年5月11日
0

发表回复

登录后才能评论

谷歌推出Gemini 1.5 Pro模型：新增音频理解及系统指令功能，引领AI技术新突破

相关推荐

发表回复