
在近日的火山引擎AI创新巡展杭州站上,字节跳动旗下火山引擎总裁谭待正式发布豆包1.5深度思考模型。这款多模态大模型在数学推理、编程竞赛、科学分析等专业领域表现突出,其数学能力追平OpenAI o3-mini-high,编程与科学测试成绩接近o1模型水平,创意写作与人文知识问答同样展现广泛适用性。
技术细节显示,豆包1.5采用MoE混合专家架构,总参数达2000亿,激活参数仅200亿,较同类模型减少50%计算资源消耗。其API服务响应延迟低至20毫秒,支持每秒数万次高并发调用,显著降低企业使用成本。更引人注目的是,该模型整合视觉理解技术,能通过照片分析地质构造,旅行时实时翻译菜单并推荐菜品,甚至辅助企业绘制项目管理流程图。
同步开放的文生图模型Seedream3.0已登陆即梦AI与豆包平台,支持2K高清图像直出,在权威评测平台Artificial Analysis中跻身第一梯队。该模型在构图精准度、文字排版、画面真实感等方面表现优异,企业用户可即刻调用其创作能力。
视频搜索功能升级成为另一亮点。豆包1.5可精准定位视频片段,根据用户问题提取对应画面与语音信息,例如在科普视频中快速检索实验步骤。
谭待同时披露,豆包大模型生态发展迅猛。截至2025年3月,其日均Tokens处理量突破12.7万亿,较初期暴增106倍,覆盖办公、教育、娱乐等多元场景。目前,火山引擎已向企业开放豆包系列模型API接口,开发者可通过火山方舟平台接入测试。
此次升级标志着字节跳动在通用AI领域迈出关键一步。随着多模态技术持续突破,豆包模型正加速渗透至产业应用端,为智能服务提供更强大的底层支撑。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/715297.html