DeepSeek服务再次出现“宕机”。1月27日11点左右,DeepSeek官网一度显示网页和API不可用,但功能随后恢复。此前一天,DeepSeek也经历了一次短暂的服务波动,官方称问题在数分钟内得到解决,可能与新模型发布后的访问量激增有关。1月27日早间,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区超越了ChatGPT。1月24日,DeepSeek-R1在大模型排名中升至全类别第三,其中风格控制类模型分类与OpenAI o1并列第一,竞技场得分为1357分,略高于OpenAI o1的1352分。该模型每百万个token的查询成本仅为0.14美元,远低于OpenAI的7.50美元,并且允许开源。
DeepSeek的崛起让华尔街算力板块投资者感到不安。寒武纪一度大跌近10%,天孚通信、中际旭创、工业富联、中兴通讯等科技权重股也有不同程度下跌。英伟达美股夜盘跌超5%,博通跌超4%。纳斯达克指数期货跌超1.7%。软银集团股价一度下跌近6%,藤仓大跌超8%,东京电子和Disco均跌超3%。
网络社群中,越来越多的人将DeepSeek的出现与英伟达近期的回调联系在一起。有美股大V表示,DeepSeek创造了一个AI巨头们的痛苦时刻,投资者应对此保持警惕。海外媒体和市场评论员也将其视为美国股市的一大威胁。
DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月。该公司由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋共同持股。梁文锋是金融圈知名人士,创立了国内量化私募巨头幻方量化。他来自湛江市吴川市覃巴镇米历岭村,父母均为小学语文老师。他在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学习大学数学。
目前,梁文锋持股宁波程恩50.1%,宁波程信柔兆企业管理咨询合伙企业(有限合伙)持股49.8%,宁波程普商务咨询有限公司持股0.1%。宁波程信由梁文锋、郑达韡、李欢、陈哲等自然人共同持股。
1月20日,深度求索正式发布DeepSeek-R1大模型,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,提升了模型推理能力,在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版。《黑神话:悟空》的主创冯骥高度评价DeepSeek,指出其强大、便宜、开源、免费、联网和支持本土开发六大优点。
在美国硅谷,多位人工智能行业意见领袖对DeepSeek-R1表达赞赏。微软CEO萨蒂亚·纳德拉表示,他们开发出了一款开源模型,在推理计算方面表现出色。曾投资过OpenAI的投资人马克·安德里森认为,DeepSeek-R1是一项令人惊叹的突破,并且是开源的,是对全世界的大礼。
DeepSeek-V3的研发费用为558万美元,训练成本不到GPT-4o的1/20,仅用了2048张H100的GPU集群,用时53天。相比之下,全球AI第一梯队的头部公司至少需要1.6万张以上的GPU进行训练。市场认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期。
DeepSeek是一家低调的创业公司,注册地位于杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室。记者实地探访发现,该公司拒绝进一步交流。加入的官方交流群公告显示,暂不对外进行项目合作,也不提供私有化部署及相关支持服务。
1月27日,DeepSeek概念股引爆A股,多只成分股高开或涨停。多家上市公司披露与DeepSeek的合作情况。昆仑万维携手新加坡南洋理工大学成功开发Q*算法,显著提升现有大模型推理能力。每日互动则接入多个国内外通用大模型,结合自身数据积累和挖掘能力,开发垂直场景类大模型应用。但也有一些公司表示未与DeepSeek合作。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/13920.html