阿里巴巴开源Qwen1.5-110B模型，性能比肩Meta-Llama3-70B

AI • 2024年4月28日 12:07:00 • AI

近日，阿里巴巴宣布开源了其Qwen1.5系列中的首个千亿参数模型——Qwen1.5-110B。这一举措不仅彰显了阿里巴巴在人工智能领域的创新实力，也标志着中国企业在大型语言模型领域取得了显著进展。

据悉，Qwen1.5-110B模型采用了Transformer解码器架构，并引入了分组查询注意力（GQA）技术，使得模型在推理时更加高效。该模型支持长达32K tokens的上下文长度，具备多语言处理能力，支持包括英、中、法、西、德、俄、日、韩、越、阿等在内的多种语言。

在性能评估方面，Qwen1.5-110B模型展现出了与Meta的Llama3-70B模型相媲美的实力。这一成绩是在没有大幅改变预训练方法的情况下取得的，阿里巴巴方面认为，性能的提升主要归功于模型规模的增加。这一结果不仅证明了阿里巴巴在模型设计和优化方面的专业能力，也为中国在大型语言模型领域的发展注入了新的活力。

除了在基础能力评估中表现出色外，Qwen1.5-110B模型在Chat评估中也取得了优异的成绩。在MT-Bench和AlpacaEval 2.0这两个Chat模型基准评估中，该模型相较于之前发布的72B模型表现出了显著的优势。这一结果进一步证明了更大规模的基础语言模型可以带来更好的Chat模型性能。

阿里巴巴方面表示，Qwen1.5-110B是Qwen1.5系列中规模最大的模型，也是该系列中首个拥有超过1000亿参数的模型。这一成就不仅彰显了阿里巴巴在大型语言模型领域的领先地位，也为中国企业在全球人工智能竞争中赢得了更多的话语权。

随着人工智能技术的不断发展，大型语言模型已经成为了各大科技企业的重点研究方向。阿里巴巴此次开源Qwen1.5-110B模型，不仅为开发者提供了更加优秀的工具，也为推动人工智能技术的普及和应用做出了积极的贡献。

未来，我们期待看到更多中国企业在大型语言模型领域取得突破，为人工智能技术的发展和应用注入更多的活力和创新力量。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.com/article/651113.html

AI认证作者

0 0

新闻

Meta旗下WhatsApp频道新增分类功能，助力用户快速定位兴趣内容

在社交媒体领域持续创新的Meta公司，近日在其即时通讯应用WhatsApp中引入了频道分类功能。该功能允许用户根据兴趣快速定位和浏览来自不同领域的更新内容，进一步提升了用户体验。 …

柠萌
2024年5月11日
0
新闻

Meta测试新功能：Instagram照片可交叉发布至Threads，提升参与度

据报道，Meta公司正在测试一项新功能，允许用户将Instagram上的照片交叉发布到其社交聊天应用Threads上，以此提高线程的参与度。这一新举措旨在进一步融合Meta旗下的社…

net
2024年5月9日
0
新闻

Meta推出全新企业付费验证服务，增设多级计划以满足不同需求

全球科技巨头Meta近日宣布，其面向企业的付费验证服务Meta Verified将进行扩展，新增三个高级计划层级，以提供更多定制化和高级功能，满足不同规模企业用户的需求。这项服务自…

李小白
2024年5月8日
0
AI

Meta推出新大型语言模型Llama 3，赋能“Meta AI”聊天机器人

近日，社交媒体巨头Meta宣布推出其最新大型语言模型Llama 3，该模型为富有想象力的“Meta AI”聊天机器人提供了强大支持。这一新型聊天机器人现已被Meta广泛部署于包括M…

小科同学
2024年5月6日
0
新闻

Meta加强Threads安全功能：推出隐藏单词工具与全新控制选项

近日，Meta公司宣布正在将其一系列安全特性引入其社交平台线程（Threads），其中最为引人注目的新功能便是隐藏的单词工具。随着这一工具的上线，超过1.5亿的Threads用户现…

NEWS
2024年4月27日
0
新闻

扎克伯格：Meta旗下Threads平台月活用户突破1.5亿大关

在近日召开的2024年第一季度财报电话会议上，Meta公司CEO马克·扎克伯格宣布了一个令人振奋的消息：旗下社交软件Threads的月活跃用户数量已经突破1.5亿大关。这一数字相比…

校草
2024年4月26日
0
商业

Meta一季度财报超预期，股价却遭重创

在周三下午发布的第一季度财报中，社交媒体巨头Meta凭借其出色的业绩再次刷新了华尔街的期待。报告显示，Meta在此期间实现销售额364.6亿美元，同比增长27%，轻松超出预期的36…

商业头条
2024年4月26日
0
商业

Meta发布第一季度财报：营收飙升，AI与元宇宙投资引领未来增长

美国时间周三，Meta，即Facebook母公司，在美股收盘后公布了其截至2024年3月31日的第一季度财报。报告显示，Meta在第一季度实现了强劲的营收增长，同时净利润和每股收益…

商业头条
2024年4月25日
0
产品

Meta Quest 2美国Best Buy限时优惠50美元，仅需199.99美元

在科技热潮中，虚拟现实设备已逐渐走进寻常百姓家。近日，美国Best Buy带来了一款备受瞩目的虚拟现实耳机——Meta Quest 2，现在仅需199.99美元，相较于原价249.…

Best Buy
2024年4月24日
0
新闻

WhatsApp在选举安全方面被指缺失，Mozilla呼吁加强监管

随着全球范围内数十亿人即将参与2024年的选举，社交媒体平台在维护选举完整性和防止虚假信息传播方面的责任愈发凸显。然而，非营利组织Mozilla的研究人员指出，尽管元（Meta）公…

科技探索者
2024年4月24日
0
AI

微软 AI 超级计算团队迎来 Meta 前高管 Jason Taylor

Taylor 的加入将为微软的 AI 超级计算团队带来更多经验和专业知识，有望推动该团队在人工智能领域的进一步发展和创新

苹果派
2024年4月23日
0
新闻

Meta开放VR/AR操作系统，打造更开放的行业生态

在VR/AR技术不断革新的当下，Meta再次迈出了重要的一步。近日，Meta宣布将拓展旗下VR/AR操作系统Meta Horizon OS，使其未来开放给第三方硬件制造商，用于设计…

泡沫大盗
2024年4月23日
0
新闻

微软与 Meta 受 Xbox 启发合作推出限量版 Meta Quest VR

微软的 Xbox 平台仍未配备 VR 耳机，尽管公司曾与 Oculus Rift 合作提供 Xbox One 控制器，但未提供 VR 支持

潮玩君
2024年4月23日
0
新闻

俄罗斯军事法庭宣判：Meta前发言人安迪·斯通被判6年监禁，律师计划上诉

近日，俄罗斯军事法庭对Meta公司前发言人安迪·斯通作出了判决，因其“公开为恐怖主义辩护”的指控，被缺席判处6年监禁。此消息一出，立即引发了国际社会的广泛关注。据悉，斯通的律师团…

科学
2024年4月23日
0
AI

传闻苹果正自研设备端大型语言模型，强化生成式AI功能

在生成式人工智能领域，苹果公司正积极研发一项创新技术——设备端大型语言模型（LLM），旨在为用户提供更快速、更安全的智能服务体验。据彭博社知名记者马克・古尔曼 (Mark Gurm…

苹果派
2024年4月23日
0
AI

GPT-4展露黑客天赋：自主利用真实世界安全漏洞

近日，在人工智能领域掀起轩然大波的GPT-4大型语言模型再次刷新了人们的认知。伊利诺伊大学厄巴纳-香槟分校的四位计算机科学家最新研究发现，GPT-4不仅能够理解人类语言，还能通过阅…

AI
2024年4月22日
0
新闻

高通携手Meta优化Llama 3大语言模型，引领终端AI新篇章

近日，科技巨头Meta公司宣布推出其下一代大语言模型Llama 3，同时，全球领先的无线技术创新者高通也宣布支持该模型在骁龙终端上运行。这一合作将为大语言模型在智能手机、PC、VR…

科技探索者
2024年4月22日
0
产品

Meta大降价！Quest 2 VR耳机直降50美元，配件价格同步下调，性价比飙升

近日，Meta公司再次为市场带来惊喜，旗下热门产品Meta Quest 2 VR耳机迎来大幅降价，从原价的249美元直降至仅需199美元。这一优惠活动在Meta官方平台上进行，让广…

happy
2024年4月20日
0
AI

Meta公司发布Llama 3大型语言模型及实时图像生成器，整合至虚拟助手Meta AI

科技巨头Meta公司在4月18日宣布推出其最新大型语言模型Llama 3的早期版本，同时发布了一款可在用户输入提示时实时更新图片的图像生成器。这两款先进的人工智能产品将被整合到Me…

AI
2024年4月19日
1
新闻

Meta发布Llama 3，高管：最智能开源大模型，最强版还在路上

Meta此次推出了两个版本的Llama 3模型：一个版本拥有80亿参数，另一个则有700亿参数。参数数量是衡量人工智能系统模型大小和性能的关键指标，它直接反映了模型的复杂性和计算能力。

苹果派
2024年4月19日
0

发表回复

登录后才能评论

阿里巴巴开源Qwen1.5-110B模型，性能比肩Meta-Llama3-70B

相关推荐

发表回复