腾讯混元推出自研深度思考模型T1正式版

腾讯混元推出自研深度思考模型T1正式版

今日,腾讯混元在其官方微信公众号上宣布,自研深度思考模型T1正式版正式上线。这款模型以吐字迅速、秒级响应和超长文本处理能力为特色,是腾讯在强推理模型领域的又一力作。

据官方介绍,T1通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,进一步提升了推理能力。在多项基准测试中,如MMLU-PRO、CEval、AIME和Zebra Logic等,T1均取得了业界领先的成绩。

T1沿用了混元Turbo S的创新架构,首次在工业界将混合Mamba架构无损应用于超大型推理模型,有效降低了计算复杂度和内存占用,显著降低了训练和推理成本。同时,针对长序列处理进行了专项优化,确保长文本信息捕捉能力的同时大幅降低资源消耗,解码速度提升2倍。

此外,T1在多项对齐任务、指令跟随任务和工具利用任务中也展现出非常强的适应性。目前,T1已在腾讯云官网上线,提供API接口服务,输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。用户可通过访问腾讯混元T1官网进行体验和使用。

此次T1的推出,标志着腾讯在AI推理模型领域取得了新的突破,为行业提供了更加高效、智能的解决方案。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/711718.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论