
当地时间5月7日,欧洲AI公司Mistral正式发布Mistral Medium 3大语言模型,主打“高性能+低成本”双重优势。官方宣称,这一中等量级模型在编程、STEM(科学/技术/工程/数学)及多模态理解等专业领域表现突出,企业级功能适配成本显著降低。
Mistral Medium 3在基准测试中表现达到或超过Claude Sonnet 3.7的90%,而成本仅为每百万Token输入0.4美元、输出2美元,较Claude输入1美元/输出5美元的定价成本下降最高60%。同时,其性能超越Llama 4 Maverick、Cohere Command A等开放与企业级模型,API调用成本也低于DeepSeek v3。
该模型支持持续预训练与全参数微调,可无缝集成企业私有知识库。官方强调,企业客户可通过可视化界面完成模型部署,硬件资源消耗较上一代降低30%。此外,其多模态接口支持图像、代码与结构化数据的联合处理。
技术亮点
- 编程优化:内置20+编程语言调试工具,代码生成准确率提升至92%
- 长文本处理:单次上下文窗口扩展至128K Token,支持超长技术文档解析
- 实时学习:每小时可完成TB级数据增量训练,支持动态行业知识更新
据报道,Mistral在发布公告中预告将推出Medium 3系列的升级版本Large,参数规模与多任务能力将进一步扩大。当前Medium 3已开放云端API接入及本地化部署方案,企业用户可申请30天免费试用,包含1000万Token额度。
Mistral联合创始人透露,新模型已通过欧盟GDPR合规认证,并与AWS、谷歌云达成托管合作。第三方测试显示,其API响应速度较GPT-4 Turbo快17%,错误率降低23%。截至发稿,Anthropic、Cohere等竞品尚未对此次发布作出回应。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/718166.html