阿里云宣布通义千问720亿参数模型开源

今日,阿里云宣布开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio,目前已上线阿里魔搭社区。

阿里云宣布通义千问720亿参数模型开源

今日,阿里云宣布开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio,目前已上线阿里魔搭社区。

本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向 72B、1.8B 对话模型提供了 4bit / 8bit 量化版模型,便于开发者们推理训练。

阿里云此前已经开源了 70 亿参数模型 Qwen-7B 以及 140 亿参数模型 Qwen-14B。

据介绍,Qwen-72B 搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制自己的 AI 助手,要求大模型扮演某个角色,或者执行特定的回复任务。

官方表示,Qwen-72B 在 10 个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆 Llama 2-70B 和大部分商用闭源模型。

未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。通义千问还开源了 18 亿参数模型 Qwen-1.8B 和音频大模型 Qwen-Audio。

至此,通义千问共开源 18 亿、70 亿、140 亿、720 亿参数的 4 款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。

本文来自投稿,不代表科技讯立场,如若转载,请注明出处:https://www.kejixun.com/article/601146.html

(0)
秋秋的头像秋秋管理团队

相关推荐

发表回复

登录后才能评论