01
这个春节,缔造了很多热点,也创造了不少奇迹时刻。
比如说今年春晚收视率创下了39%的新高,要知道在过去几年,春晚收视率差点就要跌破20%。
但这也只是奇迹的沧海一粟而已。
因为今年春节的最大的热点和奇迹,来自于一家名不见经传的中国AI初创公司,它叫做DeepSeek。
火到什么程度呢?
坦率来说,在春节这个注重娱乐和轻松的氛围下,DeepSeek用前所未有的关注热度,横跨中美两国几乎从政府、官媒、企业届到自媒体的所有头版头条。
宣传力度之广、规格之高、热度之久、影响力之大可以说平生罕见。
甚至连美国新任总统特朗普都在公开讨论DeepSeek,我身边所有人,不管是企业家,还是从来不关注商业的人,都在问DeepSeek是什么,怎么用?
所以,过去这几天,我们并不急于对DeepSeek做搬运式的报道,泛泛而谈。我们做了更深入的研究,我们会用两篇文章来聊一聊DeepSeek。
今天的单仁行会回答这么几个问题:
DeepSeek到底是做什么的?它为什么会这么火?
为什么从官方到社会各界要这么高规格、大力宣传它?意义在哪里?
02
DeepSeek母公司是2015年成立,后来成长为国内头部的千亿量化私募基金,幻方量化。
简单来说,量化就是用机器学习和算法策略进行全自动交易,用AI来炒股。
所以,幻方量化本身就跟AI渊源非常深,DeepSeek就是幻方旗下的大模型。
DeepSeek的爆火有三个直接原因:
第一、它是从国外火到了国内。(并不是先在国内火)
在1月20日之前,DeepSeek在国内的声音还少的可怜,但随着DeepSeek发布R1大模型之后,在美国的下载量直逼OpenAI的GPT。
“沉默的大多数”用自己的选择权引来了硅谷的关注。
这个DeepSeek是何方神圣,为什么能跟全球AI大模型领导者OpenAI并驾齐驱?
美国人越是研究,就越对DeepSeek感到惊讶,这个大模型的能力已经不亚于OpenAI最新的o1大模型。
换句话来说,在美国人最自信的AI大模型技术创新领域,中国的DeepSeek后来者居上,成为了跟OpenAI不分伯仲的顶级大模型,从一个跟随者变成了领跑者。
随后,DeepSeek一发不可收拾,从美国火到了中国,
第二、DeepSeek的训练成本极其低廉,团队数量小而精。
与DeepSeek的成绩形成直观反差的在于,DeepSeek大模型的训练成本不到600万美元,而GPT O1的训练的成本,保守要上亿美金。
并且,DeepSeek的团队成员大约在130人,其中几乎都是中国本土清一色的应届毕业生和博士实习生。
跟动辄上千人、履历完美的大厂团队形成了鲜明的反差。
这样的团队做出了毫不逊色OpenAI的顶级大模型,让硅谷的科技公司开始怀疑人生。
这就像千万的跑车跟十万的小车,在同一条赛道跑出了同等的成绩。
第三、DeepSeek是开源大模型。
所谓开源,就是DeepSeek把自己所有的技术代码全部公开,给所有人共享研究成果。
像OpenAI原来也是开源模型,但从GPT 3.0之后,OpenAI就选择了闭源。
因为这玩意太烧钱了,OpenAI和背后的股东舍不得。
我花了这么多钱,凭什么还要公开我的技术成果?
所以,OpenAI不再跟外界公开分享,而是转向闭源,开始追求商业化的结果,确保自己的位置能够一直领先。
但是,DeepSeek不仅做出了不逊色OpenAI最新的顶级大模型,还全部开源。
这不仅是技术上的打击,更是一种文化、理念和自信心上的打击。
连美国人自己也在说,这是斯普特尼克时刻。
这是一个冷战热词,斯普特尼克是人类历史上第一颗人造卫星,它由苏联最先发射,让自信的美国人很难接受,从而创立了NASA航天局,实现了登月计划。
现在轮到DeepSeek再度刺痛硅谷精英的自信心,纳指一度下跌3%,美国科技公司市值蒸发了5000亿美元。
这些反差和不可能,造就了DeepSeek的爆火。
03
当然,如果从更深角度去理解,用一句话来解释DeepSeek爆火的底层原因。
那就是:在我们自己都默认落后的大模型技术创新领域,DeepSeek用我们和美国人都未曾设想的方式,划出了一道奇迹之弧。
从OpenAI的ChatGPT大模型横空出世之后,尽管国内企业迅速跟进,也推出了不少对标GPT的大模型。
但是,实事求是的说,因为我们自己和清华大学的团队也在开发AI在营销领域的垂直应用,我们对不同大模型做了深度使用,也仔细研究了行业专家的意见。
在大模型底层的技术创新领域,我们真的可能还稍微落后。
特别是英伟达在算力领域的统治地位,它的高端AI芯片对中国处于禁运状态。
所以,投资界、企业界一直有一个声音,也就是“市场信仰派”。
底层技术和前沿创新,落后就落后了,既然打不过,那我们也别死追不放了。
我们来做分工,你做技术创新,我做应用变现,把技术迅速商业化,铺开到各个领域,赚到钱才是王道。
其实,这种思想从互联网和移动互联网时代就有了,我们一个惯性认知就是,美国企业擅长搞技术创新,中国企业更擅长做深度应用。
所以,在各个领域,我们会有一种跟随式的模仿思维,只强调怎么去快速模仿,在应用上赚钱,对底层创新极度缺乏耐心。
整个商业的驱动力,不是好奇心和创造欲,而是被利益所驱动。
利润高的项目才叫做有前景,如果把钱拿去做基础科研和技术研究,那就必然要遇到这样的质疑:
你离巨头还有多远?需要多久时间?要花多少钱?这中间能够创造收益吗?
如果答案是不确定的,那么,整个项目就没有任何价值。
不会有投资者去给你一分钱,哪怕是不缺钱的大厂,也不会对这样的项目拥有多少信心。
而且,大厂可能会更加追求商业化,因为大厂有盈利和增长的压力,需要对自己的股价和股东负责。
所以,如果一定要找一个商业上的理由,它可能是找不到的,因为划不来。
从商业角度来讲,基础研究的投入回报比很低,不如把钱花在模仿上,把别人的技术拿来,放到更多的应用场景。
这也是为什么创新没有发生在更有钱、更有资源的大厂,而是发生在DeepSeek这样的初创公司身上。
当然,我不能说过去的逻辑是错误的,因为在过去的全球化环境下,很多中国企业就是从模仿和跟随一步步成功的,这是铁的事实。
但是,今天的时代会有一点不一样了,它对创业者的要求,对产业发展的方向有了新的变化。
04
DeepSeek给我们揭示了三点:
第一、在AI时代,企业必须要找回和重新拥有我们对技术驱动型创新的信心,特别是底层的硬核创新。
虽然这么做,可能暂时还不容易被理解,但是,整个社会需要被一个又一个事实教育。
这也是为什么官方会高规格去宣传DeepSeek,当这个社会能够让硬核创新的人功成名就,群体性想法就会被改变。
特别是中国目前和未来产业结构的调整,已经明显偏向于技术的创新。
过去赚快钱的时代和运气,今天会变得极其稀少,想要有所成就,就必须要参与到真正的技术创新当中,走到技术的前沿,去推动整个生态的发展,这也是专精特新的根本含义。
第二、中国本土的人才被严重低估了,我们可以尝试把更多资源拿来培养企业内部的人才以及新鲜血液,而不是迷信“外来的和尚会念经”,花大代价引进外部大公司的人才。
DeepSeek和幻方量化的创始人,梁文锋说:
“在颠覆性的技术面前,闭源形成的护城河是短暂的,即使OpenAI闭源,也无法阻止被别人赶超。
所以,我们把价值沉淀在团队上,让我们的同事在这个过程中得到成长和积累,形成可以创新的组织和文化,这就是我们的护城河。”
我曾经说过,包括在除夕的文章里也讲到“向心而聚”,做企业就是在做一个投资回报的游戏,我们把钱投入到哪里,能够获得更大、稳定、持续的回报?
我想除了营销之外,那必然就是投到我们的团队,我们的成员。
人,才是公司最大的资产。
重视文化和团队的学习、培养,是很多企业在未来发展中最需要落地的方向。
第三、AI时代的创业和发展逻辑,需要摆脱惯性思维。
过去所有企业的成功,所有的模型都是上一代的产物,未来不一定成立。
如果拿以前互联网时代的商业逻辑,去讨论视播时代和AI时代的盈利模式,可能就是一种刻舟求剑。
所以,回到本源,回到我们创业的发心去思考:
我们目前所做的,未来想要做的事,能不能让整个社会的运行效率变高,能不能给社会创造更多的价值?
我们能不能在产业分工的链条上,找到自己最擅长的位置,往下扎根?
我想,只有自我定位更加清晰、更加精细化运营、更能跟上时代的企业,才更有机会在未来活下来,获得更大的发展。
—
还没有评论,来说两句吧...