财新传媒 财新传媒

阅读:0
听报道

2025年开年,来自中国的DeepSeek直接改变了全球大模型行业的走向。DeepSeek最近发布的R1模型,成为全世界首个能与OpenAI o1比肩的开源模型,令本来领先全球的美国大模型行业惊讶不已。

DeepSeek作为绝对的后发者,能够追上OpenAI的原因,正是在于其采取了“不跟随”策略,坚持走自己认为正确的道路,也就是从零开始做原创创新。本文基于公开资料,简要呈现DeepSeek的原创创新机制。

DeepSeek创始人梁文锋认为中国的创新缺的不是资本,缺乏的是信心,以及大家不知道怎么组织高密度的人才。他认为创新的驱动要素是好奇心、创造欲,再加商业回报。梁文锋以DeepSeek作为一个样板,向全社会展现了在中国,如何能够成功地做出原创性、颠覆性创新。

以下内容摘录自36 氪「暗涌」在2023年5月、2024年7月对DeepSeek创始人梁文锋进行的两次采访。本文作者按照逻辑要点进行了组合,以便更结构化地全览DeepSeek对于原创性、颠覆性创新的观点和实践。为便于阅读,少数表述较原文做了细微调整。

创新的信心

创新首先是一个信念问题。首先是敢。这种信心通常在年轻人身上更明显。

关于颠覆性创新

如何保持领先:认为单个组织/闭源方式无法长期保持领先。需要把价值沉淀在团队上,积累大量know-how, 形成可以创新的组织和文化。技术确实没有秘密,但后来者重置/复现需要时间和成本。这些是从事颠覆性创新的组织的护城河。

如何激励研究人员:荣誉+经济回报,而不只是经济回报。开源模型,任何有想法有能力的开发者都可以做贡献,贡献都会被记录,被社区记住,这是荣誉激励。这样做的组织也会有文化吸引力。

关于创新型组织

选人标准

    - 看重:扎实的基础能力、热爱、好奇心。这种人对做研究的渴望,远超对钱的在意。驱动他们做人生选择的是 热爱和好奇心,所以很多人会有一些奇特的经历。会注意从细节上发现这种人。

    - 不看重:经验。做一件事,有经验的人会不假思索告诉你,应该这样做。没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。DeepSeek核心技术岗位,基本以应届和毕业一两年的人为主。

管理方式:交给研究员重要的事,并且不干预他。让他自己想办法,自己发挥。在这样的环境下,是通过价值观和企业文化,来确保大家步调一致。

组织架构:没有部门设置,没有层级划分。有项目组,但是需要项目发起人自己去组队。

选题方式:自下而上。一般不做前置分工,而是自然分工。每个研究员有他独特的成长经历,都会自带想法,不需要push他。但是对于有潜力的想法,也会自上而下地去调配资源。

资源分配:没有上限。每个人对于算力卡和需要配合的队友的调动是不设上限的。但是需要自己去吸引队友,而不是上级命令或指派。

试错空间:创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。

关于国内的人才

中国有最顶尖的人才:之前流行的观点是大模型领域前50名的顶尖人才可能都不在中国的公司。DeepSeek认为招聘国内的人才,也许能把他们打造成这样的人。其后的实践证明了这一观点。

但是这些人目前被低估了:顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。

做技术驱动型创新的积累

幻方某种程度上增强了自身对于技术驱动型创新的信心。怎么招没有经验的人,怎么判断他的潜力,招进来之后如何才能让他成长,DeepSeek的这些基因是在幻方阶段打下的。

幻方时代就很少自上而下地指派目标或任务。

 

DeepSeek的领先,是中国参与全球互联网进程以来,第一次在系统、算法层面的领先。这一领先,把全球大模型行业带入了新的阶段,同时也深深震撼了众多中国同行的内心。行业内多年来疑虑的一个问题,中国人到底能不能在底层算法上实现原创创新?第一人有人用实践给出了肯定的答案。可以!

相信DeepSeek在原创创新上的思考和实践,也会成为中国原创性、颠覆性创新进程中的一个转折点。一个深度求索起来了,千千万万个深度求索就要出现。DeepSeek基于其多年信仰、思考、实践形成的成体系的方法论,回答了在“伟大不能被计划”时,如何完全从零开始,去接近和实现“伟大”的一种可能性。这一方法论,将在科技行业得到扩散、学习,鼓舞更多的有梦想的人们,去实现一个又一个灿若星辰的目标。可以预见,我们的创新体系,将变得更加健壮有力。

在更长的历史维度上看,这是中华民族现代化进程中的一个节点缩影。林语堂先生在近百年前的著作《吾国与吾民》中非常直接地指出了国人缺乏科学精神:“希腊人之能奠定自然科学基础,因为他们的心灵本质上是一个分析的心灵”;“中国人的智巧好像只知道悦服道德的“自明之理”,而他们的抽象用语像“仁”“义”“忠”“礼”,已属十分普通,他们的精密意义自然而然已丧失在模糊的普遍性里。” 在他看来,中国人不喜分析,是自古以来的传统。

七十年之后,2005年,钱学森先生提出了著名的“钱学森之问”:为什么我们的学校总是培养不出杰出的科技创新人才?“大学……没有自己独特的创新的东西,老是‘冒’不出杰出人才”。DeepSeek的创作团队,包括最核心的MLA架构的关键创新者,都是国内高校培养的学生。在千禧年左右出生的一代中国青年,在钱学森先生提问二十年之后,用信心和结果回答了这个问题。一百多年来,通过好几代人的努力,国人站在了前沿科技原创创新的领跑身位。

话题:



0

推荐

王捷

王捷

2篇文章 13小时前更新

科技投资人,完整经历移动互联网各个发展和投资阶段;2017年以来主要从事AI行业投资,对于中国AI、机器人行业启动至今的发展情况有深入认知,投资了众多领先的中国科技公司;关注数字经济,对于数字经济底层发展规律进行了系统性研究。

文章
  • 个人分类
全部文章 2篇
  • 文章归档
2025年 2篇