阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

火星科技1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。

其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越GPT-4o与Claude3.5。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

官方介绍称,新的Qwen2.5-VL能更准确地解析图像内容,突破性地支持超1小时的视频理解,可以在视频中搜索具体事件,并对视频的不同时间段进行要点总结,从而快速、高效地帮助用户提取视频中蕴藏的关键信息。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

而且无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

Qwen2.5-VL 不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。

此外,Qwen2.5-VL将OCR识别能力提升至一个新的水平,增强了多场景、多语言和多方向的文本识别和文本定位能力。同时,在信息抽取能力上进行大幅度增强,以满足日益增长的资质审核、金融商务等数字化、智能化需求。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

【本文结束】如需转载请务必注明出处:火星科技

责任编辑:随心

文章内容举报

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/14419.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月28日 下午3:51
下一篇 2025年1月28日 下午3:58

相关推荐

  • 比概念车还惊艳!宝马iX3正式版曝光,网友:这价格我心动了

    9月5日曝光的全新iX3电动跨界车宣传图,正以颠覆性的笔触重新定义豪华电动车的美学边界。作为宝马新世代(Neue Klasse)平台下的首款量产SUV,这款车型将概念车Vision Neue Klasse X的未来主义设计基因注入现实,在扁平化门把手的机械精密感与贯穿式尾灯的数字流光之间,构建起传统豪华与先锋科技的辩证统一。 从视觉冲击来看,新车的前脸设计堪…

    2025年9月5日
    8700
  • 和AI这道正餐相比,前几十年的科技总和只是前菜

    过去六十年,科技一次次给人类带来新的惊喜。每一代技术都像是一道前菜:精致、美味、甚至足以改变人的食欲,让人期待下一道菜的到来。但它们终究只是开胃,而非真正的正餐。 今天,当AI走到我们眼前时,我越来越坚信:AI不是前菜,而是真正的正餐。它不再只是某个新工具的出现,而是我们使用工具、理解世界、生产价值方式的根本性重写。 如果说半导体是第一把锋利的菜刀,个人电脑…

    2025年9月19日
    6500
  • 当AI开始闹情绪,打工人反向共情

    东亚小孩Gemini,碎嘴DeepSeek,牛马GPT。

    2025年9月20日
    14300
  • 邪修糖葫芦,看呆消费者

    立冬了,街边糖葫芦的叫卖生比以前多了“冰糖葫芦,五块钱两串,五块钱两串”…… 路边小商小贩们,推着三轮车,一排排糖壳晶莹剔透的糖葫芦整齐安静的躺在车上的玻璃柜里。小时候我们常吃的糖葫芦有山药豆、山药棍、山楂、山楂饼、山楂夹糯米、橘子瓣等等。 现在,越来越多你想都想不到水果也纷纷裹上糖壳,成为新式糖葫芦、“邪修”糖葫芦。脑子里全是“鬼点…

    2025年10月22日
    20100
  • 3.3秒破百+无格栅设计 法拉利Amalfi 259.85万起开启中国超跑新纪元

    10月16日,法拉利Amalfi在国内正式发布,259.85万元起的售价和2026年四季度的交付时间,立刻引发超跑圈震动。作为Roma的继任车型,这款搭载3.9T V8发动机的硬顶跑车,用640马力最大功率、3.3秒破百的性能数据,在电动化浪潮中为燃油超跑写下倔强注脚。 法拉利Amalfi的外观设计堪称激进革新。前脸彻底取消传统格栅,转而采用深色凹条上方的悬…

    2025年10月16日
    10500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信