几乎是一夜之间,“来自东方的神秘力量”再次震撼了海外人士。1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
据界面新闻报道,1月27日,DeepSeek官网显示网页/API不可用。前一天(26日),DeepSeek曾出现短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内得到解决。此次事件可能是由于新模型发布后用户访问量激增,服务器一时无法满足大量用户的并发需求。
Deepseek来自量化巨头幻方量化旗下的大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,这款模型便凭借其“物美价廉”的特性在海外开发者社区中引发轰动。今年1月20日,国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。DeepSeek创始人梁文锋参加了此次座谈会。
在校期间,梁文锋对金融市场产生了浓厚兴趣。特别是在2008年全球金融危机期间,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,为日后职业生涯奠定了基础。毕业后,梁文锋将目光转向更广阔的金融市场。2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了显著成绩。
2016年,幻方推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方确立了以AI为核心的发展战略。然而,随着业务快速扩展,算力瓶颈逐渐显现。为解决计算资源不足的问题,2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的前列。2023年,梁文锋宣布进军通用人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型被硅谷同行誉为“来自东方的神秘力量”。
DeepSeek之所以受到关注,在于DeepSeek-V3极大地降低了大模型训练和应用的成本。DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方的成本差距至少是10倍。在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面超过了ChatGPT-4o,行业震惊于这一性价比,DeepSeek-V3开源给全世界的技术开发团队。
在团队配置上,DeepSeek团队只有139名研发人员,而ChatGPT的OpenAI团队有1200名研究人员,团队规模是DeepSeek的近乎9倍。近期热门话题“雷军千万年薪挖95后天才AI少女”,这位AI少女就是DeepSeek团队的研发人员,但小米和当事人并未就此回应。
通过招聘网站注意到,深度求索公司的北京子公司正在招人,共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深UI设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。
1月27日,DeepSeek概念股表现强势,每日互动、华金资本、浙江东方涨停,并行科技、卓创资讯、拓尔思等涨幅居前。消息面上,此前AMD宣布已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。华经产业研究院报告显示,2023年国内智能体市场规模达59.81亿元,预计2024年突破百亿元。中国工程院院士邬贺铨表示,2025年不仅是智能体的元年,也将是AI终端的元年。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/13995.html