大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

大模型创业太累,又一大牛决定重回大厂。

Yi Tay,曾是Reka AI联合创始人,也曾是谷歌大模型PaLM、UL2、Flan-2、Bard的重要参与者。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

本周是他回到谷歌的第一周,也是他离职创业一年半之后,选择回归老身份的开始。

他将继续担任谷歌DeepMind高级研究员,向谷歌大神、也是他之前的老板Quoc Le汇报。

回顾过去这段创业经历,他表示学到了很多,比如基础设施方面的知识、如何从头开始训练大模型等等。

但与此同时,他也经历了一些不那么好的时刻:

公司费劲筹集的一亿多美金,对于一个不到15个人的团队仍然紧张,还差点卖身自救。

个人层面,他的身心健康受到了很大影响。由于工作强度大和不健康的生活方式,他还长胖了15公斤。

为此他表示:

放弃舒适区并创业对我个人来说真的很可怕。

大牛重回谷歌大厂

去年三月末,他官宣离职谷歌参与创业RekaAI,并担任该公司的首席科学家。

在此之前,他在谷歌大脑工作了3.3年,参与诸多大模型的研究,撰写累计约45篇论文,其中16篇一作,包括UL2、U-PaLM、DSI、Synthesizer、Charformer和Long Range Arena等,约20次产品发布,妥妥大牛一位。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

从技术角度上讲,他坦言学到了很多关于在谷歌没法学到的知识。

比如学会使用Pytorch/GPU 和其他外部基础设施,以成本最优的方式从头构建非常好的模型。

为此他还在个人网站上分享了相关经验:训练模型的首要条件是获取计算能力,但这一过程就好像买彩票。

并非所有硬件都是一样的。不同算力提供商的集群质量差异非常大,以至于要想训练出好的模型需要付出多大的代价,这简直就是在抽签。简而言之,LLM 时代的硬件彩票。 这与在谷歌使用TPU相比,这些GPU的故障率让他大吃一惊。

此外他还吐槽外部代码库的质量远远落后谷歌的质量,这些代码库对大规模编码器-解码器训练的支持非常少。

但这种持续遇到问题持续解决的经验, 并非痛苦反而很有趣,并且最终凭借着自身技术实力也挺了过来。

在创业初期,他们的旗舰模型Reka Core在Lmsys首次亮相,就跻身第7位,公司排名前五,实现了对GPT-4早期版本的超越。

目前他们主要有四个模型,适用于不同的应用场景。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而真正打倒他驱使他离职的,是更为现实的原因。

就公司层面来说,作为初创企业,其资金、算力和人力跟其他实验室相比都要少得多。

就算他们分批筹集了一亿多美金,对于一个不到15人的团队仍然不够。

今年5月Reka AI还被曝出卖身自救,Snowflake正就以超过 10 亿美元收购Reka AI的事宜谈判。

不过现在来看,收购事宜还没有谈成。在Yi Tay宣布新动向后,他们紧急发声,现在公司还在积极招人ing。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而就他个人来说,这是段非常紧张的时期。尤其刚开始创业的时候妻子怀孕,他不得不同时兼顾两边,由此身心健康受到很大的损害。

并且由于高强度的工作和不健康的生活方式,他长胖了15公斤。

不过他自己也曾透露过自己有睡眠障碍。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

种种原因,他决定重回谷歌,回归到一个研究者的身份。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

在初创企业世界探索了一年半之后,我决定回归我的研究根基。

在分享经历的开始,他写下了这样一句话。

回到谷歌之后,他将探索与大模型相关的研究方向,以高级研究员的身份,向大神Quoc Le汇报。

在博客的最后,他感谢了创业这段时间始终联系的谷歌老朋友。

并且还特地感谢了在新加坡同他共进晚餐的Jeff Dean,并且提醒他Google 很棒。(Doge)

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

谷歌老同事:欢迎回来

一些谷歌老同事在底下纷纷表示:Welcome back!感觉像是过了十年。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

值得一提的是,像这种大牛重返大厂并非个例。

今年8月谷歌以25亿美元打包带走了明星AI独角兽Character.AI的核心技术团队,远高于Character.AI 10亿美元的估值。

其中包括两位创始人——Transformer贡献最大作者Noam Shazeer和Daniel De Freitas。其中Noam Shazeer出任Gemini联合技术主管。

这样看起来,对于这些大牛来说,大模型创业确实不易,重返大厂确实是个不错的选择,至少钱够算力够、安安心心做研究。

而随着新一轮的洗牌期到来,更多技术大牛朝着科技巨头聚拢,也已经初见端倪。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

主题测试文章,只做测试使用。发布者:sengcheng,转转请注明出处:https://www.sengcheng.com/13630.html

(0)
sengcheng的头像sengcheng
上一篇 2024年11月26日 下午3:20
下一篇 2024年11月26日 下午3:20

相关推荐

  • 20款定制版小米15齐亮相:阵容最豪华的小米数字旗舰

    11月8日消息,小米集团魏思琪集中展示了小米15的20款定制版,堪称是阵容最豪华的小米数字旗舰。 据了解,小米15定制版带来了超出想象的丰富配色,款式多达20种,并提供了亮银和亮黑两种高亮中框选项。 这些颜色中包含了充满活力与个性的高饱和色系、传递快乐能量的多巴胺色系以及低调优雅的莫兰迪色系,确保每位用户都能找到符合自己风格的颜色。 算下来小米15定制版有4…

    2024年11月8日
    3500
  • 丰田86总工程师多田哲哉体验比亚迪海豹:日本电动车跟它比全输了

    11月24日消息,近期,丰田86总工程师多田哲哉将比亚迪海豹评选为了年度车型,并发表了体验评价。 多田哲哉表示,许多日本人对中国制造持负面态度,但必须冷静看待中国车现在的水平。 在造车技术和设计方面,比亚迪从欧美厂商挖来了许多资深工程师,车辆的造型如今已非常好看。 而比亚迪原本就是电池厂商,电池技术很强,2020年时丰田和比亚迪建立合资公司,但更多的是丰田在…

    2024年11月24日
    1500
  • 小鹏发布混合碳化硅同轴电驱:CLTC效率93.5%行业第一

    11月6日消息,在今日下午举行的小鹏AI科技日上,小鹏汽车带来了全新混合碳化硅同轴电驱。 碳化硅电机能耗非常强,缺点在于价格昂贵,而按照何小鹏的说法,小鹏这款全新的电机是非常小的一个技术点,但效果很明显,CLTC效率93.5%,是行业第一,可有效降低能耗,让小电池拥有长续航。 据悉,新电机主要有三大亮点:一是巨大的技术创新,在减少使用60%的碳化硅芯片,同时…

    2024年11月6日
    3300
  • 史上最强Mate!华为Mate 70系列销量或破千万台

    11月25日消息,据供应链消息,Mate 60系列于2023年8月29日突袭上市,从开售到今年11月中旬,总销量已突破1400万台,超出供应链此前1200万台的预期。 供应链渠道称,Mate 60系列遇到了供货不足的问题,否则销量大概率能到2000万台,如今华为即将在明天发布Mate 70系列,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东称…

    2024年11月25日
    700
  • 上海颁发首批无人驾驶车牌:白底黑字 清晰标注“无人装备”

    11月15日消息,据报道,上海市公安局浦东分局交警支队近期正式颁发了首批专为无人驾驶装备设计的识别标牌,此举象征着无人驾驶技术正融入公众日常生活。 车牌的设计采用淡蓝色与白色结合,黑色字体,牌照开头为地区简称,后面是字母与数字组合,上方清晰标注无人装备。 未来,这些淡蓝色的标识牌将成为无人驾驶设备的标准配置,无论是即将遍地开花的无人出租车,还是高效便捷的无人…

    2024年11月15日
    2600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信