近日,AMD公司宣布推出其首个完全开放的10亿参数语言模型系列——AMD OLMo。这一创新举措为开发者和研究人员提供了强大的AI研究工具,进一步推动了人工智能领域的发展。
据悉,AMD OLMo模型是基于从零开始训练的10亿参数语言模型系列,在AMD Instinct™ MI250 GPU集群上进行了大规模的预训练。训练过程中使用了超过1.3万亿个tokens,确保了模型在处理自然语言任务时具备出色的推理能力。
AMD OLMo采用了解码器(decoder-only)架构,并通过下一个标记预测(next-token prediction)进行训练。这种架构在生成文本和理解上下文方面表现出色,使得OLMo模型在推理能力和聊天能力上相较于其他同类开源模型具有显著优势。在多个基准测试中,OLMo的性能与最新的同类模型相当,但其计算预算仅为后者的一半。
除了数据中心使用外,AMD OLMo还支持配备NPU(Neural Processing Unit,神经处理单元)的AMD Ryzen AI PC进行模型部署。这意味着开发者可以在个人设备上轻松提供AI功能,进一步降低了AI技术的门槛。
值得注意的是,AMD OLMo是完全开源的。这一举措意味着其他开发者和公司可以自由使用和修改这些模型,从而推动AI技术的创新和发展。对于希望探索AI技术替代方案的企业而言,AMD OLMo无疑是一个可行的选择。
AMD此次发布的OLMo模型不仅展示了其在AI领域的强大研发实力,也为开发者和研究人员提供了更为便捷和高效的AI研究工具。随着AI技术的不断发展,AMD OLMo有望在各个领域发挥重要作用,推动人工智能技术的进一步普及和应用。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/691886.html