刘哲清晰地记得去年5月参加DeepSeek线上面试的情景。面试官连续3小时的高强度提问让他倍感压力,尽管他在校期间已崭露头角,但面对那些深入且具有挑战性的问题仍感到不小的难度。他提到,DeepSeek是唯一一家会根据应聘者的专业背景量身定制编程题目的公司。
网络上也有人分享了类似的面试经历,其中一个问题让许多人感到困惑:“DPO为什么用KL散度,不用交叉熵?机器学习中什么时候必须用KL散度,什么时候必须用交叉熵,什么时候两者可互换?”这个问题让人感叹其复杂性。
近期,国产AI大模型DeepSeek在全球范围内引发轰动,登上各大热搜。一方面,国产AI芯片、云服务提供商以及软硬件厂商正加速与DeepSeek适配,其技术迅速渗透到汽车等多个领域,AI生态系统持续壮大;另一方面,这也迫使谷歌、OpenAI等科技巨头加快产品升级和开源的步伐。
人们好奇的是,在短短两年内,核心团队不到100人的DeepSeek如何实现了其他大型互联网公司和实验室未能达成的技术突破。刘哲认为,DeepSeek的崛起似乎是必然的。他透露,应聘者普遍来自清华、北大等顶尖学府,面试过程严谨且要求高,招聘并未设定人数上限,旨在网罗顶尖智慧人才。
面试过程包括一个编程环节,根据应聘者的专业出题,测试结果决定是否进入面试环节。面试持续3小时,由两位年轻面试官分别进行,一位考察机器学习基础知识,另一位讨论项目经验。尽管刘哲最终没能入职,但他看好DeepSeek未来的发展,认为其人才筛选模式很好,企业也很人性化。
孙商在一年前也曾参加过DeepSeek的面试,他的感受略有不同。当时的面试流程与现今众多互联网公司的招聘环节相似,涵盖简历问答和算法题测试,总体难度不算特别高,但由于裸考未能脱颖而出。
一位专注于算法的面试者分享了自己的经验,他主要从事TensorFlow/PyTorch相关工作,涉及各种模型结构、复杂度以及分布式训练。他提到,DeepSeek的面试流程包括三轮,核心研发岗位的要求非常高。
行业关注的焦点转向了如何利用DeepSeek所引发的流量红利。这家公司被国际媒体誉为“OpenAI最强劲对手”,内部运营模式、战略规划和员工特征引发广泛讨论。知情人士透露,公司充满愿景,研究氛围优于高校实验室,适合对AI充满热情的研究人员。公司采取扁平化管理模式,每位核心算法人员都能直接与创始人探讨问题。
作为中国炙手可热的科技初创企业之一,DeepSeek已成为全国年轻求职者梦寐以求的工作地。公司在杭州总部和北京分部开设了多个与通用人工智能研究和开发相关的职位。BOSS直聘网站显示,DeepSeek招聘的AGI大模型实习生每天薪酬500-1000元,深度学习研究员-AGI岗位面向在校生或应届生,提供14薪,月薪6-9万,应届生年薪最高可达126万,员工福利丰富。
孙胜曾在2022年参加过DeepSeek面试,那时就听说幻方正积极筹备投身于AGI的研发。虽然由于种种原因未能加入实习,但与HR的联系始终未断。如今DeepSeek声名鹊起,他不禁感慨自己错失良机。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/26261.html