DeepSeek深夜发布多模态大模型 超越DALL-E 3

中国公司DeepSeek在华尔街周一评估“DeepSeek风暴”时,发布了其最新产品:名为Janus-Pro的多模态大模型。该模型在图像生成基准测试中超越了OpenAI的DALL-E 3,并且是开源的。

DeepSeek深夜发布多模态大模型

除夕凌晨钟声敲响前不久,DeepSeek工程师们在“抱抱脸”平台上传了Janus Pro 7B和1.5B两个模型,这是对去年10月发布的Janus模型的升级。这两个模型具有15亿和70亿参数量,可以在消费级电脑上本地运行。与之前的版本一样,Janus Pro采用MIT许可证,在商用方面没有限制。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

据DeepSeek介绍,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

从报告给出的数据来看,在部分文生图基准测试中,Janus-Pro 70亿参数模型的表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion 3-Medium等模型。尽管DALL-E 3是OpenAI在2023年发布的一款老模型,而Janus Pro目前只能分析和生成规格较小的图像(384 x 384),但其在如此紧凑的模型尺寸中依然展现了令人印象深刻的性能。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

技术报告显示,在视觉生成方面,Janus-Pro通过添加7200万张高质量合成图像,使得在统一预训练阶段真实数据与合成数据的比例达到1:1,实现了更具视觉吸引力和稳定性的图像输出。在多模态理解的训练数据方面,新模型参考了DeepSeek VL2并增加了大约9000万个样本。

DeepSeek深夜发布多模态大模型 超越DALL-E 3

作为一个多模态模型,Janus-Pro不仅可以“文生图”,还能对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的知识(例如“猫和老鼠”蛋糕)进行介绍。公司在报告中展示了更多图像生成的案例。

责任编辑:于浩淙 zx0176

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/14026.html

(0)
火星财经的头像火星财经
上一篇 2025年1月28日 上午10:25
下一篇 2025年1月28日 上午10:25

相关推荐

  • 春运期间车票累计发售超3.32亿张,这些线路客流较为集中 热门区间出行热度高

    截至1月26日9时,铁路12306已累计发售春运期间车票3.32亿张,系统运行平稳。从车票预售情况来看,今日热门出发城市主要有北京、上海、广州、深圳、成都、武汉、杭州、西安、重庆、郑州;热门到达城市主要有广州、成都、北京、武汉、重庆、郑州、西安、长沙、上海、南昌;广州至南宁、北京至沈阳、上海至武汉、北京至太原、北京至哈尔滨、香港至深圳、广州至武汉、北京至西安…

    2025年1月26日
    1100
  • 濒危尸体花盛开数千人排队参观 罕见绽放引轰动

    1月23日,悉尼皇家植物园内一种名为“尸体花”的濒危植物罕见绽放。这种植物学名“尸臭魔芋”,外形高大尖锐,气味难闻,高度可达3至4米,主要分布在印度尼西亚苏门答腊岛西部巴里赞山脉的热带雨林中。 据估计,野外仅存不到1000株尸体花。此次是悉尼皇家植物园15年来首次见到该植物开花。在野外,尸体花每隔七到十年才会开放一次,花朵和其特有的臭味通常只持续24至48小…

    2025年1月25日
    1200
  • 患癌妈妈吸氧给女儿包饺子 母爱无声却深沉

    患癌妈妈吸氧给女儿包饺子!在新疆乌鲁木齐,一位癌症晚期的母亲一边吸氧一边为女儿包饺子。当女儿问她是否感到累时,母亲虚弱地回答:“累啊,但是我想让你吃。”这一幕让人感动不已。 马女士的母亲于2024年3月被确诊为肺癌晚期。得知这个消息后,马女士几乎崩溃,但她尽力控制情绪,辞去了央企的工作,全职陪伴母亲度过最艰难的治疗阶段。马女士一直隐瞒着病情,但母亲可能通过身…

    2025年1月23日
    1100
  • 如何”松绑”进入股市的长钱?这场发布会将答疑解惑

    中央金融办、中国证监会、财政部、人力资源社会保障部、中国人民银行、金融监管总局,22日联合印发《关于推动中长期资金入市工作的实施方案》,重点引导商业保险资金、全国社会保障基金、基本养老保障资金、企业年金基金、公募基金等中长期资金进一步加大入市力度,建立三年以上长周期考核机制,着眼长远收益。 今天上午9点,国务院新闻办公室将举行新闻发布会,请相关部委负责人介绍…

    2025年1月23日
    1100
  • 员工挪用公司货款赌博被抓获 挽回经济损失18万

    员工挪用公司货款赌博被抓获。近日,文山市公安局经侦大队破获一起挪用资金案,抓获犯罪嫌疑人一名,为某企业挽回经济损失18万余元。 2024年底,文山某商贸有限公司财务人员杨某向文山市公安局经侦大队报案,称公司业务员刘某自2024年8月起私自收取客户货款后未交回公司,并谎称客户未付款。涉及30余家客户,共计182699元。直到最近,公司在催客户结清货款时才发现,…

    2025年1月22日
    1300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信