阿里云通义千问多模态大模型Qwen-VL-Max重磅升级

若安丶 • 2024年1月27日 20:28:00 • AI

阿里云昨日公布了其多模态大模型研究的新进展，推出了升级版的通义千问视觉理解模型Qwen-VL-Max。这款模型在视觉推理能力和中文理解能力上都有了显著提升，性能表现堪比GPT-4V和谷歌的Gemini Ultra。

Qwen-VL-Max的升级主要表现在以下几个方面：

基础能力：Qwen-VL-Max能够准确描述和识别图片信息，并基于图片进行信息推理和扩展创作。它还具备了视觉定位能力，能够对画面指定区域进行问答。
视觉推理：新版模型能够理解流程图等复杂形式图片，并能够分析复杂图标。此外，它在看图做题、看图作文以及看图写代码等任务上也达到了世界最佳水平。
图像文本处理：Qwen-VL-Max的中英文文本识别能力显著提高，支持百万像素以上的高清分辨率图和极端宽高比的图像。它既能够完整复现密集文本，也能从表格和文档中提取信息。

与LLM（大语言模型）相比，多模态大模型拥有更大的应用想象力。例如，研究者正在探索将多模态大模型与自动驾驶场景结合，为“完全自动驾驶”找到新的技术路径。此外，将多模态模型部署到手机、机器人、智能音箱等端侧设备，可以让智能设备自动理解物理世界的信息，或者基于多模态模型开发应用，辅助视力障碍群体的日常生活等等。

Qwen-VL-Plus和Qwen-VL-Max目前限时免费，用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力，也可以通过阿里云灵积平台（DashScope）调用模型API。

总的来说，阿里云的通义千问多模态大模型Qwen-VL-Max在视觉推理和中文理解方面都展现出了强大的实力，其性能表现足以与GPT-4V和谷歌的Gemini Ultra相媲美。这将为用户提供更丰富、更准确的视觉信息理解和创作能力，推动AI技术在更多领域的应用和发展。

原创文章，作者：若安丶，如若转载，请注明出处：https://www.kejixun.com/article/624926.html

Qwen-VL-Max Qwen-VL-Max升级通义千问多模态大模型Qwen-VL-Max 通义千问多模态大模型Qwen-VL-Max升级阿里云

若安丶管理团队

0 0

AI

阿里云通义千问开源320亿参数大语言模型，全系列已达七款

4月7日，阿里云宣布通义千问成功开源其最新的320亿参数大语言模型——Qwen1.5-32B，至此通义千问已完成包括5亿、18亿、40亿、70亿、140亿和720亿参数在内的全系列…

科技新闻
2024年4月8日
0
AI

阿里云启用AI编程助手通义灵码，助力程序员提升效率

近日，阿里云在内部全面推行AI编程，借助通义灵码这一智能编程助手，帮助程序员编写代码、阅读代码、检查BUG以及优化代码等工作。这一创新举措标志着阿里云在智能化编程领域迈出了重要的一…

泡沫大盗
2024年4月3日
0
新闻

阿里云宣布通义千问720亿参数模型开源

今日，阿里云宣布开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio，目前已上线阿里魔搭社区。

秋秋
2023年12月1日
0
新闻

阿里巴巴：吴泳铭接替张勇，阿里云智能集团分拆计划继续进行

阿里巴巴宣布吴泳铭先生将接替张勇先生出任阿里云智能集团代理董事长兼首席执行官，委任于 2023 年 9 月 10 日生效

科技探索者
2023年9月11日
0
张勇发全员信：阿里云将分拆上市

阿里巴巴宣布启动「1+6+N」组织变革以来，首个正式宣布「单飞」的业务落子阿里云智能集团

苹果派
新闻 2023年5月19日
0
阿里云域名价格调整 2月1日起net英文域名续费上调至89元

据阿里云官网显示，阿里云日前发布域名价格调整通知。

若安丶
新闻 2023年1月16日
0
阿里巴巴组织架构大调整集团CEO张勇兼任阿里云智能总裁

昨日，阿里巴巴集团董事会主席兼CEO张勇发出全员邮件，宣布组织变化，并将新年关键字定为“进”。

若安丶
新闻 2022年12月30日
0
阿里云正式发布“汽车云”：已服务国内超70%汽车企业

阿里云“汽车云”在 2022云栖大会上正式亮相。目前，阿里云“汽车云”在国内已服务超过70%的汽车企业，小鹏、一汽、吉利、长城、长安、地平线等均已上云。

若安丶
智车 2022年11月7日
0
阿里云：2022云栖大会，11月3-5日杭州见

阿里云宣布，2022杭州·云栖大会将在11月3日至5日杭州·云栖小镇举行。

若安丶
新闻 2022年9月30日
0
阿里云获评MongoDB年度新兴市场最佳云合作伙伴

阿里云获评MongoDB年度新兴市场最佳云合作伙伴

苹果派
新闻 2022年6月15日
0
阿里云产业智能OpenTrek正式发布 “封装”五大产业智能核心技术

6月13日，在2022阿里云峰会上，阿里云智能副总裁、行业解决方案研发部负责人曾震宇发布“阿里云产业智能OpenTrek”

苹果派
新闻 2022年6月13日
0
云原生能力再升级阿里云推出分布式容器平台ACK One

6月13日，2022阿里云峰会上，阿里云基础产品事业部负责人蒋江伟宣布，容器服务再升级，正式推出分布式云容器平台ACK One及ACK云原生AI套件。

苹果派
新闻 2022年6月13日
0
阿里云无影重大升级：开发者造出手术机器人、智能底盘和3D教学机

2022阿里云峰会发布无影架构重大升级：通过全球计算网络节点接近接入，开发者可以研制8K超高清未来终端形态，并在用户端保持毫秒级数据应用访问体验。6月15日起，用户可在无影产品和自有终端开发中选用全新ASP云流协议。

苹果派
新闻 2022年6月13日
0
阿里云发布云数据中心处理器CIPU

6月13日，阿里云宣布推出云基础设施处理器CIPU（Cloud Infrastructure Processing Unit ），这是为新型云数据中心设计的专用处理器，将替代CPU成为云时代IDC的处理核心。

苹果派
新闻 2022年6月13日
0
阿里云“大算力”支持嬴彻自动驾驶仿真提速20倍

阿里云“大算力”支持嬴彻自动驾驶仿真提速20倍

苹果派
新闻 2022年5月24日
0
“1分钟发现、5分钟响应、10分钟处置”, 阿里云推出医保全平台智能运维方案

5月19日消息，记者获悉，阿里云正式推出医保全平台智能运维方案，通过打造“1分钟发现、5分钟响应、10分钟处置”的运维技术体系，保障医保信息平台高效平稳运行。

苹果派
新闻 2022年5月19日
0
达摩院加持阿里云数据库前沿技术研究获三大国际顶会认可

达摩院加持阿里云数据库前沿技术研究获三大国际顶会认可

苹果派
新闻 2022年5月17日
0
常熟农商银行新核心系统上线交易处理能力提升46倍

4月26日消息，常熟农商银行新核心系统已成功上线，稳定运行半月有余。新系统大幅增强了业务处理能力，每秒交易处理能力提升了46倍。

苹果派
新闻 2022年4月26日
0
消息称阿里云中国区总裁任庚（M6）将离职

有消息称，阿里云中国区总裁任庚（M6）将离职，该职位由阿里云中国区副总裁黄海清接任，统管中国16个战区。

若安丶
新闻 2022年4月14日
0
雪球引入阿里云云原生内存数据库Tair，实现成本降低50%

顺畅支持每天近千万级QPS峰值读写，并实现相关数据库成本降低50%以上

苹果派
新闻 2022年4月11日
0

发表回复

登录后才能评论

阿里云通义千问多模态大模型Qwen-VL-Max重磅升级

相关推荐

发表回复