Google Gemini 1.5 Pro推出公共预览版它可以听到声音

AI • 2024年4月10日 15:02:12 • AI

在最近的Google Next活动中，谷歌宣布了对其人工智能模型Gemini 1.5 Pro的重大更新，这一更新为模型带来了前所未有的听觉能力。Gemini 1.5 Pro现在能够处理和理解上传的音频文件，这意味着它可以直接从财报电话会议或视频音频中提取信息，而无需依赖书面文字记录。

此次更新的亮点是，Gemini 1.5 Pro在性能上已经超越了Gemini家族中最大最强的机型Gemini Ultra。谷歌声称，Gemini 1.5 Pro能够理解复杂的指令，而无需对模型进行微调，这标志着AI技术的一个重要进步。

然而，值得注意的是，Gemini 1.5 Pro的使用受限于能够访问Vertex AI和AI Studio的用户。目前，大多数人通过Gemini聊天机器人接触到Gemini语言模型，而Gemini Ultra则为Gemini Advanced聊天机器人提供动力。尽管Gemini Ultra功能强大，但在速度上不及Gemini 1.5 Pro。

除了Gemini 1.5 Pro，谷歌的另一大型AI模型Imagen 2也获得了更新。Imagen 2是一种文本到图像生成模型，它不仅增强了Gemini的图像生成能力，还新增了图像编辑功能，允许用户在图像中添加或删除元素。此外，谷歌还为通过Imagen模型创建的所有图片提供了SynthID数字水印功能，该功能在图像上添加了一个对观看者不可见的水印，以标记图像的来源。

谷歌还公开预览了一种新方法，将其人工智能响应与谷歌搜索结合起来，以便用最新的信息进行回答。这一举措意味着，即使是大型语言模型也能提供最新的信息，而不仅仅是基于内部数据的回答。值得一提的是，谷歌有意不让Gemini回答与2024年美国大选相关的问题，这表明了对信息敏感性的考量。

Gemini因生成与历史人物不准确的照片而受到批评，这一事件提醒我们，尽管人工智能技术取得了巨大进步，但仍需谨慎处理与历史和现实世界相关的数据。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.com/article/645533.html

AI认证作者

0 0

产品

苹果WWDC 2024临近，iOS 18预计带来重大AI升级

随着苹果全球开发者大会（WWDC）2024的临近，业界对新一代iOS 18操作系统的期待愈发高涨。据可靠消息，今年的WWDC将于美国太平洋时间6月10日至14日举行，届时iOS 1…

Apple
2024年4月27日
0
新闻

三星与谷歌深化AI合作，共同推进安卓体验创新

在人工智能技术的快速发展下，全球科技巨头三星与谷歌宣布将进一步深化合作，共同为运行安卓系统的智能手机开发新的人工智能功能。这一合作标志着两家公司在人工智能领域的合作关系进一步巩固，…

商业头条
2024年4月26日
0
AI

创业公司Kimi大模型产品火爆出圈，能否持续引领AI新趋势？

近日，一家仅成立一年的创业公司凭借一款效果出众的大模型产品Kimi，在AI领域掀起了一股新的波澜。这款面向C端用户的智能助手以其独特的长文本处理能力和多场景应用功能，赢得了市场的广…

AI
2024年4月24日
1
商业

微软CEO纳德拉：OpenAI的成功离不开微软早期关键支持

近日，微软公司首席执行官萨蒂亚·纳德拉在接受采访时强调了微软在人工智能领域的领军企业OpenAI的发展中所发挥的“关键作用”。纳德拉表示，如果没有微软的早期支持，OpenAI可能无…

商业头条
2024年4月23日
0
商业

苹果已收购法国AI初创公司Datakalab，强化本地化AI布局

苹果公司继续其在人工智能领域的积极扩张策略，近日已秘密收购总部位于巴黎的初创公司Datakalab。此次收购标志着苹果进一步推进其本地化AI能力的决心，并通过吸纳优秀初创公司来缩短…

Apple
2024年4月23日
0
AI

微软 AI 超级计算团队迎来 Meta 前高管 Jason Taylor

Taylor 的加入将为微软的 AI 超级计算团队带来更多经验和专业知识，有望推动该团队在人工智能领域的进一步发展和创新

苹果派
2024年4月23日
0
新闻

微软Clipchamp视频编辑工具推出AI新功能：快速清理无声部分内容

近日，微软公司旗下知名的视频编辑工具Clipchamp宣布上线了一项全新的AI功能——Silence Removal（无声部分移除）。这一创新功能通过人工智能技术，能够自动筛选出视…

好奇宝宝
2024年4月19日
0
新闻

OpenAI高管罕见合体访谈：未来AI发展将震惊世界

近日，人工智能领域的领军企业OpenAI的CEO Sam Altman和COO Brad Lightcap罕见合体，接受了投资人播客VC20的专访。在访谈中，两位高管共同回顾了Op…

百度
2024年4月18日
0
新闻

苹果iOS 18将推出全新AI功能，设备端运行引领行业创新

在人工智能领域持续创新的苹果公司，近日再次引发了业界的广泛关注。据彭博社知名记者马克·古尔曼透露，苹果正计划在其即将发布的iOS 18操作系统中首次推出全新的人工智能功能，而且这些…

Apple
2024年4月17日
0
AI

生成式AI投资激增，美国领跑全球，中国AI专利数领先

在全球AI领域私人投资连续两年下滑的背景下，生成式AI领域却异军突起，成为投资市场的新宠。据最新统计数据显示，去年生成式AI投资大幅增长，比2022年增长了近2倍，总额达到252亿…

AI
2024年4月17日
0
AI

Create2024百度AI开发者大会盛大开幕，科技巨头共襄盛会

深圳国际会展中心（宝安）今日迎来了科技圈的一大盛事——Create2024百度AI开发者大会。这场备受瞩目的科技盛宴吸引了全球近万名顶尖开发者和业界领袖，共同探讨人工智能的未来发展…

百度
2024年4月16日
0
新闻

苹果M4芯片将至，以人工智能为核心的M4芯片Mac系列成为新趋势

首批搭载M4芯片的Mac产品将包括新款iMac、低端14英寸MacBook Pro、高端14英寸和16英寸MacBook Pro机型以及更新的Mac mini。

科技探索者
2024年4月13日
0
新闻

美国网络安全机构称 Sisense 遭受数据泄露

美国网络安全监管机构于4月11日发布警报，指出人工智能企业Sisense已遭遇数据泄露，引发业界和公众的广泛关注。该机构敦促Sisense的客户立即重置可能已暴露或用于访问Sise…

科学
2024年4月13日
0
AI

法国AI公司Mistral推出超大模型Mixtral 8x22B，问鼎开源榜首

在人工智能领域，一场新的竞赛正在激烈展开。昨日，被誉为“欧洲版OpenAI”的法国公司Mistral AI悄然发布了一款全新的MoE（专家混合）大模型——Mixtral 8x22B…

AI
2024年4月12日
0
商业

NEAR 联创 Illia：为何 AI 需要 Web3？

近日，NEAR联创Illia出席了“2024香港Web3嘉年华”活动，并发表AI和Web3相关话题的重要演讲。本文特对其演讲进行了整理，略有删减。大家好，我是NEAR的联合创始人…

cl15
2024年4月11日
0
AI

谷歌Google AI 新版Gemini 1.5 Pro实现音频处理能力升级

近日，科技巨头谷歌宣布其最新版本的AI模型——Gemini 1.5 Pro现已具备音频处理能力，这一进步标志着人工智能技术在信息提取和分析领域迈出了重要一步。 Gemini是谷歌对…

科学
2024年4月11日
0
手机

Samsung Galaxy Z Flip5 512GB (Unlocked) ，美国亚马逊限时折扣，当前仅售1,019.99美元

Galaxy Z Flip5 512GB (Unlocked) – Graphite 是一款精致、时尚且功能强大的智能手机。让我们来看看它的亮点：这款手机目前在美国亚…

cl15
2024年4月11日
0
AI

美得克萨斯州引领潮流，率先采用AI阅卷评分系统

美国得克萨斯州在创新教育的道路上又迈出了一大步。近日，该州宣布在学术准备评估（STAAR）考试中引入“自动评分引擎”，成为美国首个公开采用人工智能阅卷评分的州。此举不仅标志着教育考…

AI
2024年4月11日
0
产品

Meta推出新款MTIA AI芯片：性能飙升三倍，引领数据中心效率革新

近日，科技巨头Meta在人工智能芯片领域取得了重大突破，继2023年5月推出MTIA v1芯片后，公司再次发布新闻稿，详细介绍了其最新研发的MTIA AI芯片。新款芯片在工艺、功耗…

科学
2024年4月11日
0
AI

谷歌推出Gemini 1.5 Pro模型：新增音频理解及系统指令功能，引领AI技术新突破

近日，科技巨头谷歌在AI领域再度迈出重要步伐，正式向全球180多个国家和地区推出其备受期待的Gemini 1.5 Pro模型。该模型不仅继承了Gemini系列的一贯优秀表现，还在原…

Google
2024年4月11日
0

发表回复

登录后才能评论

Google Gemini 1.5 Pro推出公共预览版 它可以听到声音

相关推荐

发表回复

Google Gemini 1.5 Pro推出公共预览版它可以听到声音