Mistral推出Medium 3模型:性能对标Claude,成本直降60%

Mistral推出Medium 3模型:性能对标Claude,成本直降60%

当地时间5月7日,欧洲AI公司Mistral正式发布‌Mistral Medium 3‌大语言模型,主打“高性能+低成本”双重优势。官方宣称,这一中等量级模型在编程、STEM(科学/技术/工程/数学)及多模态理解等专业领域表现突出,企业级功能适配成本显著降低。‌
Mistral Medium 3在基准测试中表现达到或超过‌Claude Sonnet 3.7‌的90%,而成本仅为每百万Token输入0.4美元、输出2美元,较Claude输入1美元/输出5美元的定价成本下降最高60%。同时,其性能超越‌Llama 4 Maverick‌、‌Cohere Command A‌等开放与企业级模型,API调用成本也低于‌DeepSeek v3。‌
该模型支持‌持续预训练‌与‌全参数微调‌,可无缝集成企业私有知识库。官方强调,企业客户可通过可视化界面完成模型部署,硬件资源消耗较上一代降低30%。此外,其多模态接口支持图像、代码与结构化数据的联合处理。

技术亮点

  • 编程优化‌:内置20+编程语言调试工具,代码生成准确率提升至92%
  • 长文本处理‌:单次上下文窗口扩展至128K Token,支持超长技术文档解析
  • 实时学习‌:每小时可完成TB级数据增量训练,支持动态行业知识更新

据报道,Mistral在发布公告中预告将推出‌Medium 3‌系列的升级版本‌Large‌,参数规模与多任务能力将进一步扩大。当前Medium 3已开放云端API接入及本地化部署方案,企业用户可申请30天免费试用,包含1000万Token额度。‌
Mistral联合创始人透露,新模型已通过欧盟GDPR合规认证,并与AWS、谷歌云达成托管合作。第三方测试显示,其API响应速度较‌GPT-4 Turbo‌快17%,错误率降低23%。截至发稿,Anthropic、Cohere等竞品尚未对此次发布作出回应。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/718166.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论