‌OpenAI推出“全能助手”o3和o4-mini:自动调用工具解题,编程竞赛进全球前200

‌OpenAI推出“全能助手”o3和o4-mini:自动调用工具解题,编程竞赛进全球前200

今日,OpenAI正式发布新一代多模态推理模型o3和o4-mini,首次实现智能调用并组合ChatGPT全功能工具链,包括网页搜索、Python数据分析、图像深度推理及文生图等能力。两款模型可自主判断工具使用场景,通过结构化输出解决复杂问题,被开发者称为“AI工具组合大师”。

技术细节显示,o4-mini在多领域测试中表现亮眼:其数学推理能力在AIME 2024/2025测试中分别达到93.4%和92.7%准确率,编程竞赛得分2700分(Codeforces全球前200名水平),科学推理准确率较前代提升35%。该模型采用创新训练方法,不仅学习文本生成,更掌握调用计算器、图像处理工具等外部程序完成特定任务的能力。例如面对复杂数学题时,可自动调用计算模块;处理图像数据时,能启动裁剪、旋转等预处理程序。

安全管控方面,OpenAI同步推出“安全导向推理监控系统”,重点防范模型在生物、化学等敏感领域提供风险建议。该系统通过1000小时红队测试,可识别并拦截涉及生物威胁的提问。

此次发布的两款模型突破传统文本交互局限,实现多模态深度协同。用户上传旅行照片时,模型可调用视觉分析模块识别地貌特征,结合地理数据库生成图文报告;处理企业流程图时,能联动图表生成工具自动优化排版。开发者强调,o4-mini激活成本较同类模型降低50%,API响应速度达20毫秒级。

目前,o3和o4-mini已集成至ChatGPT的“深度研究”功能,支持实时网络检索与研究报告编译。OpenAI CEO奥尔特曼透露,该系列模型是通向GPT-5的关键过渡产品,未来数月将推出更强大的迭代版本。

即日起,企业用户可通过OpenAI平台申请接入新模型API,个人用户可在ChatGPT工具集中体验部分功能。随着工具调用能力的开放,AI助手正从“信息提供者”转型为“问题终结者”,开启智能体应用新纪元。

原创文章,作者:聆听,如若转载,请注明出处:https://www.kejixun.com/article/715303.html

聆听的头像聆听认证作者

相关推荐

发表回复

登录后才能评论