阿里发布Qwen3.7 阿里不仅能看懂图片和视频

娱乐2026-06-04 00:05:295111

　　新浪科技讯 6月2日上午消息，阿里阿里巴巴发布千问3.7系列多模态大模型Qwen3.7-Plus，发布宣布实现多模态混合智能体新突破：文本和视觉能力均大幅提升，阿里不仅能看懂图片和视频，发布还能深度推理、阿里自我编程、发布调用工具、阿里验证测试并自主迭代，发布将“看、阿里想、发布写、阿里做、发布验”整合进统一的阿里智能体工作流，轻松完成一键复刻手机App应用、发布桌面端专业软件等复杂长程任务。阿里

　　目前，Qwen3.7-Plus已上线阿里云百炼，对外提供API服务。据悉，在全球视觉大模型榜单Vision Arena中，Qwen3.7-Plus据全球前五、国内第一。

　　据悉，此次发布的Qwen3.7-Plus是千问3.7系列的最新模型，性能较上代Qwen3.6-Plus进步显著，纯文本能力甚至可接近旗舰模型Qwen3.7-Max的水平，涌现出Plus级别模型最强的编程、Agent、推理及通用能力。在编程实测Terminal Bench 2.0-Terminus、科学问题编程SciCode等评测中，新模型较Qwen3.6-Plus大幅提升约9分，媲美Claude-Opus-4.6Max；在评估通用Agent能力的Skillbench评测中，大幅提升10.2分，展现出强大的智能体能力；在数学推理Apex评测中，Qwen3.7-Plus取得了近3倍于上代模型的性能评分表现。

　　变得更聪明的Qwen3.7-Plus，还“睁开了眼睛”，并基于智能体的实际需求系统性增强了视觉能力：在纯视觉推理BabyVision评测中，Qwen3.7-Plus得分从上代的37.4大幅提升至64.7，超过了Gemini3.1-Pro，实现了泛化能力的飞跃；在搜索增强知识问答的SimpleVQA、MMSearchPlus、MMBC等权威评测中，新模型较Qwen3.6-Plus性能得分提升最高2倍多，表现大多优于Claude-Opus-4.6 Max、Gemini3.1-Pro，解决开放问题会更可靠、更准确。

　　文本与视觉能力的双重提升，也激发出Qwen3.7-Plus崭新的多模态混合智能体能力，可自主闭环执行复杂任务。比如，Qwen3.7-Plus基于强大的GUI感知能力，模拟人与示例股票应用自主交互，并据此自动生成代码；同时，千问3.7还调用工具获取实时数据，自主执行和通过了10项核心测试，一比一复刻了这一桌面端的复杂应用。（文猛）

海量资讯、精准解读，尽在新浪财经APP

责任编辑：江钰涵

本文地址：http://tongliao.jlopera.com/html/38e499957.html

版权声明

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

全站热门

奇瑞集团：2026年5月汽车销量247,823辆同比增长20.5%

小米17T全系标配徕卡5X潜望长焦：支持30cm长焦微距

中电建协王思强：推动行业从低价中标恶性竞争转向高质量建设价值竞争

滴滴2026Q1财报：国内基本盘稳固国际业务成第二增长引擎

华擎推出N250M/D5主板：集成N250处理器无风扇被动散热

杜祥琬院士发表声明，从未参与将核技术应用于垃圾焚烧

时薪最高304元可远程兼职！马斯克旗下xAI全球招募中文AI训练师

中国电力建设企业协会会长王思强：电力建设的核心逻辑已经改变

阿里发布Qwen3.7 阿里不仅能看懂图片和视频

本文地址：http://tongliao.jlopera.com/html/38e499957.html

版权声明

热门文章

热门标签

全站热门

热门文章

阿里发布Qwen3.7 阿里不仅能看懂图片和视频

本文地址：http://tongliao.jlopera.com/html/38e499957.html

版权声明

相关文章

热门文章

热门标签

全站热门

热门文章