小米AI大模型MiLM-6B曝光 64亿参数同参数量级排名第1

科技巨头们的AI大模型早已拉开了序幕,互联网公司百度和阿里已经发布了各自的大模型,而近日腾讯也曝光了自己的大模型。科技讯今日发现,虽然小米公司没有公开宣布自己加入大模型之战,但我们却在Github上发现了小米大模型的踪影。

在Github小米这样介绍MiLM-6B:MiLM-6B是由小米开发的一个大规模预训练语言模型,参数规模为64亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。除了Github小米的AI大模型MiLM-6B还进入了C-Eval、CMMLU大模型评测榜单,截至当前,小米大模型在C-Eval 总榜单排名第10、同参数量级排名第 1。

小米AI大模型MiLM-6B曝光 64亿参数同参数量级排名第1

根据 GitHub 项目页给出的信息得知,MiLM-6B 是由小米公司开发的一个大规模预训练语言模型,参数规模达 64 亿。

而根据 C-Eval 给出的信息,MiLM-6B 模型在具体各科目成绩上,在 STEM(科学、技术、工程和数学教育)全部 20 个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。

小米AI大模型MiLM-6B曝光 64亿参数同参数量级排名第1

MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度,不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中,还有一定进步空间。

在 10 个“社会科学”测试科目中,除“教育学和地理”外,该模型在其他 8 个科目中都获得了较为理想的准确率。在人文科学的 11 个科目中,MiLM-6B 则在“历史与法律”基础上有着不错的准确率表现。

AI 大模型 MiLM-6B 当下才首次曝光,不过完成度已经较高,在未来该模型可能会被用于小米旗下“小爱同学”等虚拟助理服务中。

原创文章,作者:小科同学,如若转载,请注明出处:https://www.kejixun.com/article/575604.html

(2)
小科同学的头像小科同学

相关推荐

发表回复

登录后才能评论