Cointime

扫码下载App
iOS & Android

王小川投身大模型,思路是什么?他会怎么做?

作者:陈晨  极客公园

身着橙色帽衫,王小川走进一间近 30 平米的会议室,在这里,他宣布了自己即将投入创业的大模型产品名叫「百川智能」。「川」字一语双关,既象征了河流汇聚入海的过程,如同数据汇聚产生支持;又隐含了自己的名字,「我把自己也放进去了。同时也意味着需要更多人才加入进来。」

这场内部交流会可谓低调,现场没有 PPT,王小川对着一台 iPad 讲述完自己的创业背景与愿景,过程中楼上不时传来一阵阵装修的电钻声。这是在搜狐网络大厦的二层,戏剧性的是,不久前亦投入大模型创业的王慧文所创立的光年之外也在这栋大楼办公。

而本次创业的启动资金也同样低调——「百川智能」由 5000 万美金启动,据王小川本人介绍,资金部分来源为他个人出资,其余为几位友人的个人支持。相比光年之外的两亿美金融资(未宣布 close),在大模型领域,五千万美金并不是一笔引人瞩目的金额。但王小川表示,将产品从 0 到 1 跑通,这笔钱在初期够用了。

但据极客公园了解,王小川完全可以拿到更大金额的融资,他却选择了相对较小的初步启动资金。在大模型领域大消息不断的 3 月,外界环境的变化令他逐渐从冲动过渡到冷静,选择了以极低调的身姿入场,为的是「不让早期团队有太大压力」。

事实上,早在一个月前王慧文高调入局后,王小川就开始了与产学界和政府有关部门的密切交流。最近他在社交平台上发布了不少言论,称如果机器掌握了语言,则强人工智能的时代就要到来。在此次交流会上,王小川强调,创业搜狗的背景是他带领团队做大模型的最大优势。

「搜索就是做语言,在 AGI 方向,做语言是很大的优势。」而据极客公园观察,这一个月以来,王小川也是大模型创业者中,最被业内看好的一个。

在「百川智能」目前公布的图景中,目标是「要构建中国最好的大模型底座」——「最好」体现在参数、品测以及体验。与别家大模型有所区别的是,「百川智能」将率先在教育、医疗两个垂类领域做知识增强,目标是要帮助大众获得普惠知识,帮助企业做通用服务。底座产品目标在年底公布,垂类产品可能会提前公布。

人才是大模型领域竞争的关键词。王小川透露,「百川智能」到月底团队会接近 50 人,不到一半是搜狗班底。而半个月后他本人就要飞去美国继续招募技术人才。

有趣的是,这场交流会的灵感来自 ChatGPT,当王小川问及 ChatGPT:如何招到更多更好的大模型领域人才?ChatGPT 给出的回答是,你要先对外界讲清楚你的逻辑。于是才有了这场交流会。

有关此次创业的融资节奏,王小川的表现和外界的狂热期待并不相符,当被极客公园问及这是否仍是职业经理人作风,而非创业者身位——他笑着回答,「我习惯了一切 ready 才公布,我承认这有职业经理人的惯性思维,但我走出来了,所以先选择向大家公布。」

01从狂热,到冷静

王小川低调官宣的背后,是过去数月大模型创业从狂热到冷静的一个缩影。

说起王小川,第一个浮现出的标签往往是「理工天才」,他有着世人对「理工男」刻板印象里的那些特质:做事审慎,不想好不出手。但在大模型这件事情上,王小川最初也曾陷入狂热之中。

就在王慧文在朋友圈宣布做中国版 OpenAI 的前一天,创业者社区「前沿社」举行了一场关于通用大模型的线上交流会。「OpenAI 正在展现出一场革命的开篇,这将是是互联网和移动互联网之后,同等量级的产业变革。」会上,极客公园创始人张鹏提出这个观点,并在与会者中发起投票。

一共 13 票投向认同,这里面第一个投票的就是王小川。参与活动多次以来,那一晚是他一年多来表达最多,也最兴奋的一次。

在这场交流活动上,王小川是 ChatGPT 最坚定的支持者之一。当几位参加交流的 AI 领域创业者,尝试仅仅从功能上定义 ChatGPT 的进步的时候,王小川甚至明确表态,说大家「把这件事想小了」。

「我看到了 AGI(通用人工智能)的曙光!」王小川说这是他去年末开始体验 ChatGPT 的时候,内心最强烈的感觉。并且在这次讨论活动里,第一次含蓄透露了自己可能也会参与大模型这场变革的态度。

在 2023 年 2 月 12 日极客公园前沿社的一次「AGI 信徒聚会」上,王小川第一次明确表达了「早就下决心肯定要入局」的决心。或者说,王慧文的突然高调入场,实际上打乱了王小川原本四平八稳的节奏,某种程度上帮他走出了「经理人的思维」,开始激活了「肾上腺素」。

左起:李志飞、周源、王小川、翟光龙、张鹏

极客公园从接近王小川的人士处得知,在王慧文高调宣布入局后一周左右的时间内,王小川也曾准备对外宣布入局。但那段时间密集的舆论热潮,外界不上船就要被落下的 FOMO 心态,让他最终开始刹车反思自己急匆匆宣布,是否真的有必要。

王小川最熟悉的「老地方」

王小川沉默的这段时间,其他先放出消息的团队开始了紧锣密鼓的筹备工作。王慧文设立北京光年之外科技有限公司,吸引了顶级 VC 上亿美元的认购。

另一位宣布投身大模型领域的出门问问的创始人李志飞,曾向极客公园表达过他的观点,他认为,通用 AI 大模型就像是核武器,入局确实有时间窗口。「人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来,小的团队就没有戏了。」王小川和李志飞也是很熟悉的朋友,他也认同这个观点,但是他也提出了一个观点——「这事情不能上头,还是要走心多思考下。」

在过去一段时间中,确实有些东西是值得思考的。比如以最早宣布入局的王慧文为例,一个月过去了,即使手握大笔资金,招到足够人才,特别是一个业界被认可的首席科学家或者 CTO,依旧是充满挑战的任务。

而从收购 AI 架构公司一流科技 Oneflow,到意向收购两家清华 NLP 团队的初创公司——深言科技和面壁智能。也体现了王慧文希望尽快用最短路径集结人才,而这恰恰体现了大模型创业的复杂性,资本意义重大,但不是唯一决定性的因素。

而王小川在 AI 领域的积累和在技术产品领域的个人品牌和经验,确实让他在思考后,可以选择另一种入局的方式。

02 融资思路为何变化?

值得关注的第一个不同的思路,就是王小川为何把启动资金设在 5000 万美元。

在 ChatGPT 问世的时候,王小川曾经发过一条朋友圈说:OpenAI 的胜利,是技术理想主义的胜利。

从创立公司到推出 ChatGPT,OpenAI 整整走过了八年,在那之前,他们投入了大量的资金和资源。但也正是这种对技术的信仰,才能让他们取得震惊世界的成就,在 AGI 的前夜,为自己赚取今天难望其项背的领先优势。

最初国内创业者都是想做中国的 OpenAI,也就是做底层的通用大模型,这件事背后的逻辑很简单:

OpenAI 不能进入中国,国内一定需要自己的大模型。

互联网大厂会做大模型,但他们吃不下所有市场。有业务重合的公司不会把命脉交给大厂,所以创业团队就有生存的空间。

OpenAI 已经踏出了一条成功的路径,如果哥伦布已经发现了新大陆,你在这个方向上,就有可能用更短的时间和更少的资源在国内做出同样的事情。

几个月过去,今天来看前两者都没有问题。但复制OpenAI的路径,却看起来越来越有挑战。

3 年前发布的 GPT-3,还只是一个基础的底座;

半年前的 AI 机器人 ChatGPT(GPT-3.5),已经是一个完整的产品,并具备了泛用场景下对话这个更高阶的技术能力;

一个月前的 GPT-4,则具备了更强的推理能力和多模态转化能力;

几周前,OpenAI 宣布支持 ChatGPT 插件,后者已经不只是一个产品,而是一个生态,甚至是操作系统。

以大模型能力为基础,OpenAI 已经构建起产品能力、商业化能力和生态能力,这为他们积累了大量用户,而数据飞轮效应进一步加快 OpenAI 迭代基础大模型。

如果说做一个大模型的难度系数是 1,想要快速做出能对标 ChatGPT 水平的、「完全开放式对话产品」的难度是 100 了。

既便王小川决心要做中国的 OpenAI,甚至最终要超越他。那么他核心要面对的问题就是:

你要做哪一年的 OpenAI?2015 年的?2020 年的?2023 年的?还是 2025 年的?每一年 OpenAI 的能力体系都是不一样的,新的创业者如何建立自己的特点、差异化和优势呢?

从追赶到超越,一个创业公司的万里长征第一步要怎么走?第一个里程碑设立到哪里?第一个能闭环的商业循环是什么?

当面对 OpenAI 在过去数年烧掉数十亿美元构建起的完整生态,复制相同的路径需要的资源,不论是 5000 万美元还是几亿美元,如果不考虑造势问题,其实都是杯水车薪。

比较务实的思考是如何迅速启动,设定合理的里程碑,并且用最高的效率,以及超预期的结果到达里程碑,那么后续的资源才会源源不断。

据参与了王小川本轮融资的好友透露,王小川正是出于这个考虑,改变了之前设定的融资计划。在内部交流会上,王小川被问及五千万美金是否经过详细的计算,他透露,「从 0 到 1,5000 万的启动资金就够了。但要持续做到最好,我估计应该是从 3 亿-20 亿美元之间。」

03王小川想要怎么做?

交流会上,王小川给出了百川智能现阶段的几个目标:

构建中国最好的大模型底座。

在几个方向加强:搜索的增强,多模态的增强,教育、医疗等知识层面的增强。

相比 OpenAI 专注在一个通用模型,百川智能则会同时发展垂类模型和通用模型。

对于通用大模型,王小川称,百川智能目前已经开始训练 500 亿参数的模型,进展很顺利,年底前预计会发布对标 GPT-3.5 的大模型,有信心今年年底做到国内最好。

相比之下,垂类模型预计会出来的更快。尽管垂类模型的通用性没法与 OpenAI 抗衡,但可以通过针对具体场景优化,在细分场景里达到与 OpenAI 相近的效果,从而积累用户、构建起生态,跑通小闭环。

而王小川选择的几个场景,除了搜索这个老本行外,选择医疗、教育这两个垂类赛道,是因为这两个行业「对知识的要求最高」,而这个特征也会是大模型最先落地的方向。

甚至王小川曾经与参与本次投资的朋友表示,大模型的之外,最需要花精力的,是打造超级应用的思考和实践,「最大最成功的公司一定是在应用上想得最清楚的公司。」

显然,中国 OpenAI 这件事,今天已经不只是大模型本身的竞争,而是大模型、超级 App、行业应用三合一的「新铁人三项」赛了。

04附:王小川公开信全文

今天我正式宣布,创建「百川智能」,一家研发并提供通用人工智能服务的中国公司。

生活在二十一世纪初是如此幸运,波澜壮阔的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。多年前我曾断言,机器掌握语言,通用人工智能时代就来了;我也有畅想,搜索的未来是问答。ChatGPT 的腾空出世,地动山摇,这一切都开始成为现实。ChatGPT 发布到今天,仅仅 131 天,每天都有扑面而来的新进展、新突破。131 天恍如隔世!

大半个世纪以来,科学家们前赴后继,努力创造通用智能机器。这一天终于到来,我们找到了一条巧妙的路径,用 AI 成功将语言转化成了数学模型。语言是知识、思考、沟通和文化的载体。维特根斯坦说,语言的边界就是世界的边界。当 AI 掌握了语言后,就开始认知世界,成为有知识、能思考、善表达、会学习的智能体。我把这样的智能体称为「语言 AI」。

人类个体总有消亡的一天,但能够将毕生的知识通过语言记录下来供新生命学习、继承,文明因此延续。人类协作也需要个体之间通过语言沟通。掌握了沟通和世界知识的语言 AI 不再只是人类的「工具」,而将成为我们的伙伴和超级助理,成为人类文明的一部分。

智能时代会改写互联网时代的范式。『连接』会被『陪伴』取代,『信息服务』会被『知识服务』取代,『免费与广告』会被『付费与高品质』取代。

智能时代也会改写自工业时代以来的范式。曾经是专业化社会分工带来规模效应与效率提升,而未来会是逆专业化分工:之前需要很多公司协作完成的工作,会因为 AI 的赋能『端到端』的完成。

智能时代将再一次开启「文艺复兴」。每个人都会因为 AI 的助力而变得更加强大。用好 AI,一个人就可能做一个公司,解决之前难以解决的难题,也更容易成为自己想成为的人。社会也会更加扁平,以前少数人才能享有的智力服务,也能更普惠。

告别搜狗后,我已开启新的远征:立志往后二十年,为生命科学和医学的发展尽一份力,为大众健康做出一点贡献,核心路径是构建生命健康数学模型,并已经付诸行动。ChatGPT 的出现,也将成为新远征的重要助力。

不仅如此,ChatGPT 是我过往经历的延续和升华。2019 年我将搜狗的使命升级为「让表达和获取知识更简单」,愿景定义为「帮助每个人轻松地对话和书写。便捷地获得知识和服务,提升工作效率和生活品质」。

搜狗输入法和搜狗搜索的数据制备和产品形态,也与 ChatGPT 接近。它们都是把互联网上的全部语言数据收集、清洗,压缩成数据库并构建超级产品。随着深度学习的发展,这些产品都多次迭代升级,全面用上了 Transformer/Bert 等技术。输入法猜你想说什么,搜索猜你想要什么。而 ChatGPT 把这些能力推到了一个全新的高度,是输入法、搜索之外,第三个把全网数据转化成语言服务的超级产品。搜狗未尽的使命在机器掌握了语言后终于可以实现。

很多朋友认可我的技术理想主义和技术驱动的创业经验,鼓励和支持我做中国的 OpenAI。也有很多搜狗和非搜狗的技术大拿,得知我有做大模型的想法,主动申请参与组队,甚至「带资入组」。

我最动心的是,能和一群有理想的人,用极致的技术驱动创造出颠覆性的智能产品。这一次,百川智能将借助语言 AI 的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。

筹建百川智能不到两个月,已有多位技术合伙人和领军人物的加入。到这个月底将会有近 50 人规模的精英团队。大模型的训练也已经启动,进展顺利。按照现在的进度,争取年内发布国内最好的大模型和颠覆性的产品。

我们是中国公司,但我们并不希望只是「中国的 OpenAI」,而是能建立世界级的视野和技术品质,让中国享有世界级的产品,产生有世界影响力的技术的突破,进而服务海外。百川本意是众多的河流汇集奔赴海洋,象征着众多数据、行业知识汇聚成为一个强大的智能体系,生生不息。百川也象征着集百家智慧,更多人与我一道共赴山海。我们呼唤中国的领军人物、行业产品经理和远在美国的同仁的加入。

同志们,请通过如下邮箱联系我们:

[email protected]

[email protected]

[email protected]

[email protected]

[email protected]

通用人工智能时代刚刚开启,我们作为第一批跨入新时代的人类,带着焦虑和好奇去拥抱它,思考和探索「我是谁?」我们还可以把自己的智慧注入它,做新时代的开创者,让后代们有一个更美好的未来,繁荣和延续人类文明。

百川智能 CEO 王小川

2023 年 4 月 10 日

来源:https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2652989548&idx=1&sn=5e63bd806e2ad86e0978d56311124a1d&chksm=7e5415da49239ccc30990810af413c3cbb1431b3c9a7a2ab19eda40874d44c45421373014a69#rd

评论

所有评论

推荐阅读

  • Framework Ventures完成4亿美元第四期基金募资

    6月26日,据《Fortune》报道,Framework Ventures已完成4亿美元第四期基金募资,用于支持新一代技术项目投资,标志着该机构进一步扩大投资范围,不再局限于加密资产领域。

  • OpenAI内部ChatGPT基本被废弃,99.8%的AI输出已由Codex接管

    6月26日消息,OpenAI 发布的经济学论文《The Shift to Agentic AI: Evidence from Codex》通过追踪智能体平台 Codex 的数据,揭示了知识工作模式的转变。工作的基本单位正在从单次对话,转变为向 AI 异步委托更长、更复杂的任务。 在 OpenAI 内部,智能体已彻底接管日常工作,传统聊天接口 ChatGPT 接近被废弃。截至 2026 年 6 月,内部员工每周生成的 Token 中有 99.8% 来自 Codex。其中工程师人均 Codex Token 占比达 99%,法务和招聘等非技术员工占比也超 85%。深度使用使员工开始像协调团队一样运行 AI,近 28.6% 的员工曾同时管理 5 个以上智能体,最重度员工的日均累计运行时间超 71 小时。 与 OpenAI 的极限状态相比,外部用户也在加速转向智能体。针对外部个人用户的抽样显示,估算耗时超 8 小时的人类工作任务提交比例在半年内从 2.1% 升至 25.6%。自 2025 年 8 月以来,外部个人和组织的非开发周活跃用户数分别暴增 137 倍和 189 倍。此外,以复用工作流为核心的 Skills 技能在全部 Codex 活跃用户中的使用率,在三个月内从 5.4% 跃升至 26.6%。

  • 2025年至今我国已经研制发布40余项人工智能国家标准

    6月26日,据央视,从国家标准委了解到,2025年至今我国已经研制发布40余项人工智能国家标准。在基础支撑领域,发布《人工智能 服务器系统性能测试方法》,孵化人工智能计算产品的性能测试基准,引导我国AI服务器生态向规模化、协同化方向升级。在关键技术领域,发布《人工智能 大模型》系列标准,统一大模型研发、评估、部署全流程规范,筑牢人工智能核心技术创新底座。在产品应用领域,出台《人工智能 终端智能化分级》标准,明确智能终端分级判定依据,有效甄别“伪智能”产品、规范市场秩序,同时为相关产业扶持政策落地提供支撑,带动终端产业链整体智能化升级。一系列重点标准推动人工智能技术从单点突破走向体系化迭代,有效降低行业研发成本与规模化落地门槛,全方位支撑产业规范有序发展。

  • 全球半导体市场规模今年或超10万亿元 半导体市场规模狂飙

    6月26日,据央视财经,世界半导体贸易统计组织近期发布预测称,受AI热潮拉动,2026年全球半导体市场规模将超1.5万亿美元,创历史新高。半导体行业正围绕AI需求加速重构。在存储芯片市场,行业研究机构的报告显示,今年第一季度主要品类“动态随机存取存储器”,也就是DRAM的市场营收规模达970亿美元,同比增长260%,创历史新高。其中三星电子占据约38%市场份额,位居第一;SK海力士和美光科技位列其后。据了解,三星电子已连续两个季度位居DRAM市场首位。逻辑芯片是半导体市场的另一大品类,涵盖CPU、GPU、AI加速器等各类用于执行逻辑运算的芯片。在AI加速器与数据中心赛道,英伟达凭借GPU主导训练市场。博通与美满科技在专业集成电路ASIC定制推理芯片领域占据主导地位。而在通用计算领域,英特尔在服务器CPU市场仍具有传统优势,但面临AI算力需求向GPU和ASIC转移的挑战。 世界半导体贸易统计组织本月初发布的报告预测,今年全球半导体市场规模将较2025年增长近90%,达到1.51万亿美元,约合人民币10.2万亿元,2027年将进一步增长26.6%,市场规模升至1.914万亿美元,约合人民币13万亿元。

  • 中央结算公司:将做市商对手方通过真实做市成交的现券交易结算服务费降低至7.5折

    6月26日,中央结算公司:为进一步降低做市商交易结算成本,中央国债登记结算有限责任公司(以下简称中央结算公司)决定将做市商对手方通过真实做市成交的现券交易结算服务费由8折进一步降低至7.5折。对真实做市交易的识别和认定,以中国外汇交易中心(全国银行间同业拆借中心)传送并经中央结算公司核对确认的数据为准。以上优惠措施自2026年7月1日起至2028年12月31日止有效。

  • 世界油阀通航量回升 油轮租金大幅跳涨

    6月26日,据央视财经,标普全球能源公司25日发布报告说,24日共有78艘船舶通过霍尔木兹海峡,创下美以伊战事爆发以来单日最高通航纪录。本月霍尔木兹海峡的船舶日均通航量已恢复至冲突前水平的约57%。据了解,霍尔木兹海峡通航量回升,叠加多国秋冬能源补库,国际油轮租金大幅跳涨,传导到国内上下游呈现冷暖分化。一方面航道局势缓和后,航运企业避险保费回落,叠加运价上涨,盈利空间上升。而炼化企业承压明显,海运成本抬升直接推高原油到岸价,压缩炼油加工利润。由于我国原油高度依赖进口,不少炼化企业仍抢抓当前窗口期加快原油补库。

  • STRC盘前交易价格触及73美元 创历史新低

    行情显示,STRC 盘前触及 73 美元,创历史新低;SATA 报 83.5 美元,为 2 月以来最低水平。Strive 在该熊市中继续支付每日股息。

  • 马光远:美联储的制度性变革,是未来数年全球资产最大的黑天鹅

    6月26日,经济学家马光远表示,黄金今年从高点回撤接近30%,白银更是腰斩。金银疲软的核心根源,不是地缘局势,而是美联储主席沃什强硬的信用重塑政策、高利率常态化、强美元虹吸效应的持续压制。 长期来看,若沃什顺利推进资产负债表收缩、通胀目标刚性落地、美联储体系改革,将彻底修复多年宽松透支的美元信用,从底层巩固美元全球霸权地位,利好美国长期货币体系、金融格局。但对全球资本市场而言,这意味着全品类资产定价逻辑彻底重构。当前美股看似仍在震荡走高,实则是市场严重低估了沃什结构性改革的深远影响。 沃什开启的美联储新时代,没有常态化宽松、没有市场兜底、没有模糊博弈,底层定价逻辑彻底改写。这场超越加息降息的制度性变革,才是未来数年全球资产最大的黑天鹅,也是最核心的定价主线。

  • 德邦科技:国家大基金6月3日至6月26日减持149.35万股 持股比例降至10.85%

    6月26日,德邦科技(688035.SH)公告称,公司持股5%以上股东国家集成电路产业投资基金股份有限公司于2026年6月3日至6月26日通过大宗交易减持公司股份149.35万股,持股比例由11.90%降至10.85%。本次减持属于此前披露的减持计划,不触及强制要约收购义务,不会导致公司控股股东及实际控制人变化

  • BTC跌破60000美元

    行情显示,BTC跌破60000美元,现报59992.34美元,24小时跌幅达到2.88%,行情波动较大,请做好风险控制。