阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

火星科技1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。

其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越GPT-4o与Claude3.5。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

官方介绍称,新的Qwen2.5-VL能更准确地解析图像内容,突破性地支持超1小时的视频理解,可以在视频中搜索具体事件,并对视频的不同时间段进行要点总结,从而快速、高效地帮助用户提取视频中蕴藏的关键信息。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

而且无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

Qwen2.5-VL 不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。

此外,Qwen2.5-VL将OCR识别能力提升至一个新的水平,增强了多场景、多语言和多方向的文本识别和文本定位能力。同时,在信息抽取能力上进行大幅度增强,以满足日益增长的资质审核、金融商务等数字化、智能化需求。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

【本文结束】如需转载请务必注明出处:火星科技

责任编辑:随心

文章内容举报

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/14419.html

(0)
火星财经的头像火星财经
上一篇 2025年1月28日 下午3:51
下一篇 2025年1月28日 下午3:58

相关推荐

  • 一份简单的外包项目产品方案模板

    和内部项目的方案不同,外部项目(外包或者合作)的受众群体是客户,所以应该更加侧重于对产品功能、技术的展示。今天整理外部项目产品方案模板,给可能需要做外包项目的产品经理们。

    2017年4月17日
    6601
  • 上汽大众1月销量98800辆:燃油市占率约10%创近年新高

    火星科技2月9日消息,上汽大众近日公布了2025年1月的销量数据,共销售新车98,800辆,燃油车市场占比达到约10%,创下近年来的新高。 在具体车型方面,帕萨特家族1月销量超过25,000辆,途观家族销量接近17,000辆。 豪华品牌上汽奥迪1月新车销售2,800辆,同比增长38.1%,其中奥迪A7L销量同比增长112.4%。 在新产品方面,上汽大众即将推…

    2025年2月9日
    2000
  • 又一国产机器狗“云深处山猫”秀肌肉:腾空飞跃、金鸡独立!

    火星科技1月23日消息,继宇树科技之后,又一家中国企业云深处科技秀出了最新的机器狗视频,这台名为“山猫”的机器狗首次展现了各种灵巧的技能。 从官方视频看,山猫采用了四轮足设计,可原地跳跃,能跨过深沟,还能在雪中前向翻滚360度并稳稳落地,展现了非常高的机动性和稳定性。 这还没完,除了四轮着地,山猫还能仅利用两条腿,甚至是单腿实现站立,并且不同调整姿态保持平衡…

    2025年1月23日
    5200
  • 为训练AI不择手段!Meta被曝下载数十TB盗版电子书

    火星科技2月9日消息,据媒体报道,一名图书作者对Meta提起诉讼,指控该公司未经授权下载了大量盗版电子书,用于训练其AI模型。 最新泄露的邮件显示,Meta承认下载了一个有争议的大型数据集LibGen,其中包括数千万本盗版书籍。 根据法庭文件,Meta通过名为“安娜的档案”(Anna’s Archive)的渠道下载了至少81.7TB的数据,其中包…

    2025年2月9日
    2300
  • 前游戏公司总裁操作无人机与救火飞机相撞

    Treyarch工作室联合创始人,空舞互动娱乐前总裁彼得·艾克曼(Peter Akemann)周五与控方达成认罪协议,协议规定可免于坐牢,但必须为山火救助工作提供150小时社区服务,外加飞机修理费65000美元。 艾克曼于1月9号驾车前往圣莫尼卡第三街附近,将车泊在停车场顶层,然后向帕利塞德地区发射无人机,以观察山火造成的损失。当时FAA已发布临时禁令,禁止…

    2025年2月1日
    2400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信