
当地时间4月6日,Meta在硅谷周末的平静中突然投下AI核弹。这家科技巨头在官网及开发者社区同步上线Llama 4系列,包含Scout、Maverick两款即时可用模型,以及预告中的Behemoth模型。这是Meta首个基于混合专家(MoE)架构的开源模型家族,扎克伯格称前两款为”目前最先进的多模态型号”。
Llama 4 Scout以16位专家架构实现170亿激活参数,单个H100 GPU即可运行,同时具备1000万token上下文窗口。其多模态训练数据涵盖30万亿token的文本、图像及视频资源,视觉理解能力获官方重点推介。更引人注目的是Llama 4 Maverick,采用128位专家架构的同参数规模设计,在代码能力上与DeepSeek-V3持平,但参数效率提升50%。实测显示该模型在文本推理、数学运算等场景超越GPT-4o和Gemini 2.0 Flash。
虽然最高规格的Behemoth仍在训练,Meta已披露其作为”新模型教师”的特殊定位。该模型使用16000块H100 GPU集群训练,能源消耗是前代的2.3倍,目标直指多模态数据清洗难题。目前Scout与Maverick已登陆Hugging Face等平台,Meta AI助手同步在40国更新至Llama 4版本,但多模态功能暂限美区英语用户。
此次发布被视作对DeepSeek等中国AI公司的直接回应。据开发者论坛消息,Meta内部曾组建特别小组研究DeepSeek-V3的成本控制方案。随着Llama 4入局,全球开源模型竞赛进入白热化阶段,Meta计划在4月29日举办首届LlamaCon大会,并预告第二季度推出独立版AI助手应用。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/713821.html