谷歌上线“省钱版”AI模型,Gemini 2.5 Flash主攻实时场景

谷歌上线“省钱版”AI模型,Gemini 2.5 Flash主攻实时场景

今日,谷歌正式推出全新AI模型Gemini 2.5 Flash,定位为“高性价比推理工具”,主打低成本实时响应能力。该模型即日起开放测试,并将率先登陆谷歌AI开发平台Vertex AI。‌
谷歌在技术博客中介绍,Gemini 2.5 Flash支持动态调节算力,开发者可根据任务复杂度灵活分配处理时间。例如处理简单客服咨询时,系统自动缩短响应耗时以降低计费成本;面对复杂文档解析则延长计算精度。谷歌称该特性可将综合成本压缩至旗舰模型Gemini 2.5 Pro的50%,适用于需高频调用AI的银行、电信等行业。‌
与OpenAI的o3-mini、深度求索的R1类似,Gemini 2.5 Flash被归类为“推理优化模型”,在回答前需执行事实校验,响应时间较生成式模型略长。但其平均延迟控制在0.8秒内,适配智能客服、会议纪要生成等实时场景。谷歌特别提到,该模型已应用于内部邮件摘要工具,单日处理量超200万条。‌
谷歌同步宣布,自2024年第三季度起,企业可通过谷歌分布式云(GDC)在自有服务器部署Gemini系列模型。目前正与英伟达合作适配Blackwell架构硬件,客户可通过谷歌或合作渠道采购搭载该芯片的本地算力设备,满足金融、医疗等敏感数据行业的合规需求。‌
值得注意的是,谷歌未披露Gemini 2.5 Flash的技术白皮书及安全测试结果。公司解释称,对于定义为“实验性”的模型暂不发布详细报告,但承诺已通过内部伦理审查。此前Gemini 1.5 Pro因图像生成偏差引发争议,此次策略调整引发开发者社区对模型透明度的讨论。

据Vertex AI后台数据显示,Gemini 2.5 Flash开放测试3小时内,已有超过1.2万家企业申请接入,其中63%来自客户服务、文档管理领域。谷歌计划在9月前完成首批企业用户的模型部署。

原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.com/article/714290.html

Google的头像Google认证作者

相关推荐

发表回复

登录后才能评论