哈希力量归集文库路径访问：首页 > 通用人工智能 > 学界观察 • 分析短评/AI哲学

王小川谈大模型：中英文结合训练就像混血儿学语言更自然

甲小姐刘杨楠 ☉ 文来源：甲子光年 2023-04-20 @ 哈希力量

【小哈划重点：王小川：我们常说“上帝”有两种，一种“上帝”无所不能、什么都管；一种“上帝”在创造一个世界后，这个世界就自行运转了。人也是这种状态——一方面创造一个生命，像“上帝”般的位置，但创造出来后就放手让它自己运行了。】

“AGI跟人的生命是连结在一起的，要把整个人类文明当作一个生命来看待。探索生命的意义是我永恒的主题，我们希望寻找终极答案。”

2023年4月10日，原搜狗CEO王小川官宣创办百川智能——一家研发并提供通用人工智能服务的中国公司，旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。

百川智能将借助语言AI的突破，构建“中国最好的大模型底座”，并在搜索、多模态、教育、医疗等方面增强，帮助大众轻松、普惠地获取世界知识和专业服务。

很多人对王小川不陌生。

王小川曾任搜狗CEO，先后主导开发了搜狗搜索、搜狗输入法、搜狗浏览器等产品，首创破局搜索的“三级火箭模式”，先后推动了阿里巴巴和腾讯战略入股搜狗，并于2017年带领搜狗在美国纽交所上市，此后搜狗被腾讯私有化收购，王小川告别搜狗。王小川先后担任第十三届全国政协委员及提案委员会委员、九三学社第十四届中央委员会委员及促进技术创新工作委员会主任、清华大学计算机学科顾问委员会委员等职务，曾获1996年第8届国际信息学奥林匹克竞赛（IOI）金牌、2014年北京市劳动模范称号、2015年北京市科学技术奖一等奖、2018年中国青年五四奖章、2019年第十五届中国青年科技奖、2019年中国电子学会科学技术奖科技进步奖一等奖、2020年钱伟长中文信息处理科学技术一等奖等奖项和荣誉。

站在多年积累之上，再创业的王小川无疑是中国AI大模型创业阵容中最受关注的人之一。王小川一直被外界称为“五道口守门员”，他来到北京二十余年，始终没有离开过清华大学和搜狐大厦所在的五道口区域。离开搜狗542天后，这一次再创业，虽然换了一个身份，但“守门之路”依然继续。

本文，甲小姐于官宣当日在五道口独家对话百川智能CEO王小川，抵达官宣背后更深一层的思考。

1. 谈认知：“AGI（通用人工智能）不是OpenAI，不是ChatGPT，也不是某个产品，而是一个大时代”

甲小姐：你曾评价自己很钝感，有选择困难症，一个月前你和我说这波大模型让你感觉“被架在火上烤”，今天来看，这次创业你有多少是被时代推着走的，多少是自己主动的？

王小川：最初看到ChatGPT时，我没把它理解成一个严肃科学问题，比如你问个问题它答错了，但当你要求它“think step by step”，它就答对了，我最初觉得很好笑，直到今年1月底我开始认真看，才发现通用人工智能时代到了。

对于“该不该下场”，我可能是最后一个下判断的，但对于“这是不是AGI（通用人工智能）”，我在用完ChatGPT之后就知道了，我可能是第一个这么斩钉截铁认为它是AGI的人。

甲小姐：你斩钉截铁判断“ChatGPT就是AGI”，业界更谨慎的说法是“看到了AGI的曙光”，连微软也比你的说法保守，微软的说法是“GPT-4可被视为AGI的早期版本”。为什么你这么笃定？

王小川：就像AlphaGo出现时我很早就确信它会赢，我是看论文的人。

甲小姐：你和别人对AGI的定义不同在哪？

王小川：现在对AGI还没定义，但我是做自然语言的，我深知语言多难。我们上学时学人和动物的核心区别是语言，维特根斯坦说“语言的边界就是世界的边界”。我的判断是，当机器掌握语言，通用人工智能时代就到来了。

你也看过侯世达写的《表象与本质》，看完之后就很清楚什么叫AGI了。掌握语言， AGI就来了——这件事的逻辑清晰，不是我作为一个企业家的鸡汤说法。

只是我原来认为光从语言做大模型行不通，必须加图，但现在发现，大模型还没加图就学会了。

甲小姐：你曾在一次访谈中说“写程序是创造生命的过程”，你对健康感兴趣，对AGI感兴趣，都是对生命的兴趣？

王小川：广义上生命分几种，AGI主要指向创造智力。人最根本的需求是“生存”，我反复讲繁荣和延续人类文明，“繁荣”指向“生”，“延续”指向“存”。我说的“生命”，既不是个体的生命，也不是AGI，而是整个人类文明——让人类文明能够更繁荣和延续是我的终极理想，我希望向文明、向生命致敬。

甲小姐：你官宣要“做中国最好的大模型”，这是个具有很强竞争意味的定位。

王小川：第一，我是不怕竞争的。你也知道奥赛是怎么卷过来的，搞搜索是怎么卷过来的，我倒不怕竞争，我只是不希望过多突出竞争，但大家非得问。我觉得更好的逻辑不是竞争，是告诉大家AGI时代已经开启了。

甲小姐：现在对AGI国外也没有形成共识，比如Yann LeCun就不认同OpenAI的一些说法，他提出“世界模型”；而OpenAI CEO提出“万物摩尔定律”，大家似乎到了一个定义新世界基本定律的阶段。你认知AGI的底层逻辑是什么？

王小川：目前我的思考跟OpenAI高度一致，也许是被他们感染。接下来文字模型搞完之后，视觉还有更复杂的事情，有些不是现在能弄清楚的，现在可能是“不知道自己不知道”的状态。但我想强调的是，本质上AGI不是OpenAI，不是ChatGPT，也不是某个产品，而是一个大时代。在我个人公开信的结尾有对这件事的刻画，我还是挺满意的。

甲小姐：从年初下判断这是AGI，到今天官宣创业，仅仅过去了两个月，这两个月你见了多少人？

王小川：不到100人。

甲小姐：这两个月你的认知有变化吗？

王小川：没什么变化，主要还是靠自己思考。我自己的大脑不是一个靠各种数据驱动的深度学习系统，我的大脑就是一个pre-training model（预训练模型），我脑子里存了很多东西，pre-train之后靠大家激活。

甲小姐：未来你会推翻现有结论吗？

王小川：至少我讲的都是我比较确认的东西，肯定还有更多我不知道的细节，但我的核心观点就是“通用人工智能时代已经来临”，这比其他都重要，我很笃定。

甲小姐：你现在进入AI native的生活状态了吗？

王小川：我还得继续强化，还不够。我现在涉及工作的内容问人，语言知识信息类的都问AI。比如我想知道“从10月30号到今天总共过了多少天”，直接问ChatGPT是最简单的，做大模型创业要开媒体见面会的建议也是ChatGPT告诉我的。

2. 谈创业：“把自己的名字压进去了，把朋友都带进去了，自己最后就是兜底的这个人”

甲小姐：大模型创业，你比王慧文、李开复等人的官宣晚了不少，为什么？

王小川：因为我不想什么都没有就官宣。

甲小姐：你官宣时，个人公开信落款是“百川智能CEO王小川”，之前的组合都是“搜狗CEO王小川”，我看到那个落款时有点陌生感，这是你第一次把自己的名字放进公司名称里？

王小川：当然。我也觉得很陌生，之前和别人聊，经常一不小心就说成“我们搜狗”怎么样。

甲小姐：对你而言，把名字放进去，比自己投钱更意味深重？

王小川：是的，核心就是把自己放进去。把自己的名字压进去了，把朋友都带进去了，自己最后就是兜底的这个人。

甲小姐：你很习惯价值升维，讲过很多高境界的话，比如“做输入法是帮助人类更好地表达”“做搜索是帮助人类更好地获取信息”“语言是人工智能皇冠上的明珠”，AGI会带来人类文明的“文艺复兴”等等，但创业可能有99%的时间是在面对和世界先进水平的差距，是脏活累活和权衡取舍。你已经成功了一次，再次all in，犹豫过吗？

王小川：没犹豫过。有人想做投资，而我就是要创业的。

甲小姐：这次创业目标关系到个人追求吗？比如钱、名、权力。

王小川：当你有势能去推动一件事情发生改变的时候，钱和名都不在意，只在意这件事本身。

甲小姐：官宣后你会收到很多信息轰炸，最关心什么？

王小川：我最关心的是有没有人愿意来一块儿干。

甲小姐：你的公开信留的招聘邮箱按年龄段分了组，目前团队年龄组成如何？

王小川：几个领军人物都是90年的。

甲小姐：百川团队有部分搜狗旧部，这是否会造成路径依赖？

王小川：不会。很多人可能对搜狗有误解，觉得搜索公司不够AI，其实搜狗现在有12000片GPU在跑着，70%是做推理的，搜狗是非常AI化的公司。搜狗的核心是语言相关工作，NLP是基本功，在大量文本数据中筛选高质量数据的方法和大模型是完全一样的；其次，在评价方法上，从平台输入一个问题，评价它的反馈答案好不好的标准和搜狗也相对一致，所以我们在一头一尾的原始数据治理上相对有更多经验，也更擅长对生成内容的好坏做评价。当然，大模型会涉及独有的经验和算法，但我们学起来也会很快。

甲小姐：你和业界大部分人的观点是相似更多还是不同更多？

王小川：不同的更多。很多人还是从“几板斧”的视角来考虑这件事，比如怎么搞算力，怎么搞算法，怎么找人，找人的时候大家也缺乏对生命的思考，还是在用物理方式堆明星团队。

关于招人，我的观点是不能靠“拼”团队。也许资本喜欢听把明星团队凑一块儿的故事，但公司是个生命，生命不是这么长的——它得深度融合，它的基因得交融，公司是进化出来的，拼出来的团队反而生长速度会很慢。

搭团队既要有一个融合好的团队基础，一个好胚子，也要注入更高级的基因。我最近的核心工作就是把团队理顺了，到月底我们差不多就接近50人了，下旬我就到美国去，也得去抢人。

甲小姐：你的大模型时间表如何？

王小川：第一版今年年中就训出来了，500亿参数，年底可以做到中国最好，达到GPT-3.5以上的水平。当然，这不代表我们中间没有产品发出来。

甲小姐：哪些维度可以定义“中国最好的大模型”？

王小川：基础参数量、在各个评测集上的测试效果、发布产品后的用户体验。

甲小姐：DeepMind和OpenAI虽然初始基因类似，技术都很强，但让他们拉开梯队的是DeepMind更像“AI特种兵”，把单个任务做得很好，但OpenAI最先找到了产品驱动的、scalable的玩法。所以决胜之战可能是你大模型上的“超级产品”是什么。你想清楚产品形态了吗？

王小川：我还在不断迭代，但我知道哪些东西是该有的。

甲小姐：你的超级产品会是to C还是to B？

王小川：To C，今年之内你会看到。

甲小姐：你提到会在医疗和教育两个方向做知识增强，为什么优先选择这两个方向？

王小川：语言是知识的载体。什么行业知识密集，什么行业就适合大模型。教育服务高知群体，医学生要学8年才能走进工作岗位，这明显是知识密集的两个领域。

甲小姐：和李志飞对话时，他说大模型公司的首席科学家第一年会非常难受，看到别人的“孩子”已经满地跑，自己的“孩子”还没有出生，周围很多人会不断问你孩子什么时候出生？你要权衡应该快速发布抢占时间窗口，还是更有定力先把产品做到足够好，你对节奏怎么把握？

王小川：可能看到别的“孩子”跑出来了我会有压力，但我不会难受，因为我和团队在一起，跟他们一块同进同出、同吃同住，知道他们的状态，他们的决定和我的决定是一体的。

甲小姐：重要决定不该是一把手工程吗？

王小川：是一把手工程，但要同欲同心。

3. 谈路径：“今天的钱你可以买楼，你可以买卡，你可以买人，但它都不直接变成市场份额，也不一定有那么多网络效应”

甲小姐：你现在设计技术、战略、商业模式时，是完全独立思考，还是对标OpenAI？

王小川：首先我很尊重OpenAI，他们都是很聪明的人，但我更愿意自己想好后根据OpenAI的做法来自我验证，这是一个校对、校准的过程，而不是抄袭或参考。

甲小姐：你的路径和OpenAI有什么区别？

王小川：他们可以用几万张卡跑模型去通向AGI，但有些深水区他们就不碰了，比如搜索、医学，他们可能躲着走，但我要去碰这些东西，我需要更考虑落地应用。

甲小姐：早早关注落地应用可能会让你很难纯粹实现AGI。

王小川：国内都难。

甲小姐：以你的禀赋，也许你有能力像OpenAI一样一往无前地做纯通用人工智能？

王小川：资源、能力到了才行。我之前提出过若干今天看起来自己都觉得非常惊叹的技术创想，比如我之前想过怎么预测下一个词，怎么预测视频的下一帧，但团队做不到，就放下来了。

甲小姐：“团队做不到”指什么？

王小川：首先，网络结构的设计需要科学家，不是工程师就能做的。国内能搞网络结构的人屈指可数，杨植麟搞一篇东西在国内简直就已经（牛得）不行不行了。第二是确实烧钱，这是信仰层面的事，你需要能得到无限资金供给，我觉得现在还不具备。

甲小姐：搜狗时期你很擅长斡旋于大厂之间创造合作，接下来有没有想过找一个中国版“微软”，和大厂共舞？

王小川：我觉得不能照抄openAI，文化不一样，角色不一样。OpenAI有几万张卡跑模型。我们为什么经常有悲观主义？因为你想要和OpenAI一样。

甲小姐：大家只是期待想看到一个团队像他们一样能非常纯粹、没有太多现实约束地一路直奔AGI。

王小川：那团队要打过仗，练起来才行——你要相信团队能干这事，团队要相信你指的方向是正确的。这两个条件成熟才能做，这些东西是需要被验证的。否则你给我钱，团队hold不住，我在搜狗的时候这些是不成熟的。

甲小姐：国内很难再出现微软和OpenAI这样的组合吗？

王小川：有点难，也许以后会有。微软和OpenAI的组合里不是缺微软，是缺OpenAI。OpenAI用了7年时间孤独地做AGI，直到微软看见它，并且相中它。

甲小姐：对你这次创业来讲，钱的问题是不是问题？

王小川：我大概估算过，只是从0到1起步，5000万美元就够了，但要持续做到最好，大概需要3-20亿美元。

但人比钱重要。这个领域不会像之前打车、外卖一样，钱能直接转化成市场份额——今天的钱你可以买楼，你可以买卡，你可以买人，但它都不直接变成市场份额，也不一定有那么多网络效应。

甲小姐：中文语料质量是挑战吗？

王小川：不会，训练肯定是中英文结合，中英文之间也不是翻译的关系，就像一个小孩，妈妈是中国人，爸爸是美国人，小孩不需要翻译，很自然就会了。

甲小姐：算力是问题吗？

王小川：现在谈到算力，人们总有好多假设在里面，比如你需要弄1万张A100显卡。可你为什么要1万张？你要先想清楚。算力这件事其实打开看都是有办法的，而且几年后中国芯片企业也会有突破，这一点我特别有信心。

甲小姐：如果超级产品出来，算力不够怎么办？

王小川：那就是幸福的烦恼。

4. 谈生态：“人究竟该怎么跟机器相处，这是我关心的问题”

甲小姐：安卓生态和苹果生态，你更希望百川智能接近谁？

王小川：如果非要选的话是苹果，我会往C端做。

甲小姐：你对封闭创新更感兴趣？

王小川：我觉得这才是象征综合能力的做法，而不是单点能力。安卓开源是工程师就可以搞的事，但C端是一个更复杂的系统，苹果比安卓更综合。

甲小姐：在AGI时代，“做安卓还是做苹果”这个问题过时了吗？

王小川：这个问题可能还会有，但不是我最喜欢视角。我是从“人本”来看的——人究竟该怎么跟机器相处，这是我关心的问题。从这个角度出发，我更知道C端要什么。

甲小姐：有人说“做出中国的ChatGPT不难，但是做成中国的OpenAI很难”。硅谷有很多厉害的人可能宁愿选择加入OpenAI也不愿自己单挑，他们追求AGI的梦想似乎大过了对入场姿势的选择。

王小川：硅谷对于改变世界、创造不同的心态会好很多，千团大战这种事他们是不会干的，我们还是受儒家文化影响，总希望出人头地、赚钱。

甲小姐：你觉得中国AI大模型团队最终会形成“一小龙”“四小龙”还是“四十小龙”？

王小川：不知道。在短期内，创业公司真能做大模型的可能就5个以内，大厂的标配是一人做一个。

甲小姐：你对全球AI产业接下来的趋势有哪些判断？

王小川：现在盯着OpenAI往下干就是趋势（笑），他们是人类的希望，大家都围着他们转。

甲小姐：对于AGI，你是完全乐观，还是带有悲观主义成分？

王小川：美国在研究上确实遥遥领先，但在商业应用里面，我认为追上的机会就大了。

5. 谈心态：“现在跟世界的连接更轻松了”

甲小姐：听说你今天（2023年4月10日）下午2点之前都非常忙，在忙什么？

王小川：我昨天晚上写官宣公开信写到凌晨四点多还没写完，睡到早上八点又接着写。

甲小姐：你的公开信ChatGPT参与了吗？

王小川：没有。

甲小姐：你现在的状态和当年在搜狗时不太一样，humble了很多，感觉“紧箍咒”扔掉了。我回看了一下你卸任搜狗CEO的告别信，你说“感谢曾经极致努力的自己，把全部的爱奉献给了搜狗，自己即将去爱亲人、追寻爱情，为大众健康作出贡献”。再创业做百川智能，这些还能实现吗？

王小川：还好，离开搜狗这两年我更接纳自己了，我现在和过去两年比又放松了一层，和世界的连接更轻松了。在搜狗时你作为CEO总会说我们人才很充分了，我们想得很清楚了，我们事也干得很漂亮，你不断传递你是完美的这种状态，但创业不是这样——你会发现自己还有很多不足的地方，需要大家帮忙，这样一种心态对我而言是进步的，可能几位大佬不会这么搞。

甲小姐：现在你对这次创业的感觉已经从“被架在火上烤”变成“围着篝火跳舞”了？

王小川：我现在的感受很真实。越来越多人进场，我既不是非要秒掉他们，但自己也不是一无是处，这是一个很好的状态，反而让我感觉很松弛。

甲小姐：创业九死一生，你会害怕自己的光环消失吗？

王小川：暂时没有，这个问题不到那个时候没法回答。就像我们都说不害怕死亡，但死亡真正来临时就是另外一件事了。

甲小姐：你一直是个“做题家”，人们给你出一道题，你会做到世界第一，但你不一定是“出题高手”。AGI这条道路，你很快就会进入无人区，当没有人给你命题时，你怎么办？

王小川：“怎么去延续人类文明”不就是一个问题吗？

甲小姐：这个问题太广大，很难收敛到具体的做法。

王小川：也许我的答卷和别人不一样，但至少到今天为止我已经自问自答好多问题了。就像我写AGI和工业文明的关系，和互联网文明的关系，和文艺复兴的关系，我都已经回答这些东西了，但别人还没问过。

6. 谈追求：“要把整个人类文明当作一个生命来看待，我们希望寻找终极答案”

甲小姐：你今天反复提到“人文”和“人本”，让这次创业有了某种感性色彩，这背后有更深的思考吗？

王小川：现在大家老问机器把人取代了怎么办。有些人一直喊怕被取代，但当你问他用ChatGPT了吗，他还没用。

“找到自我”这件事，对很多人而言是很困难的，包括我们做这件事的意义到底在哪？好多人创业是因为这个事很牛，或者这个事大家都愿意做，但我们是希望寻找终极答案。

与此同时，我们还是在脚踏实地做事的。我对这件事的思考深度超过了很多人，有些人还没意识到这是时代变化，而且相当于把以前所有时代加起来的变化。我们正在创造一种新的生命，它和石头、蒸汽机、电脑的出现都不一样，以前都是工具，但AGI不是工具了——它是你的伙伴，新的朋友，是人类进化的下一个阶段。

甲小姐：《生命3.0》这本书把生命分成了3个阶段——生命1.0是40亿年前开始漫长进化而来的所有生命物种，生命2.0是十万年前出现的智人，可以通过语言和学习来改写自身的“软件”，但不能改“硬件”；生命3.0是人类可以改写自己的“软件”，也可以改写自己的“硬件”。

王小川：AI只是改写了软件。

甲小姐：改写硬件是另外一拨人做的，比如基因编辑，但各个技术在高处汇合。现在看起来，人类文明要进入下一个寒武纪大爆发的时代了。

王小川：我们常说“上帝”有两种，一种“上帝”无所不能、什么都管；一种“上帝”在创造一个世界后，这个世界就自行运转了。人也是这种状态——一方面创造一个生命，像“上帝”般的位置，但创造出来后就放手让它自己运行了。

甲小姐：“上帝”可以指代我们所追求的终极真理，它preload（预加载）人类世界，我们再去preload下一个世界，层层嵌套。

王小川：也许“上帝”就是我们的preloader（预加载程序）。

甲小姐：你和孙宇晨有一段旧事：2019年，孙宇晨在朋友圈回忆2014年与你的一场会谈节目，他说“永远忘不了他看我这打量骗子的眼神，他说我肯定会失败，和我录制节目是耻辱，最后甚至没法录下去。”孙宇晨嘲讽说，距离那天不到三年，自己公司的市值已经超过了搜狗。你后来回应孙宇晨，“什么叫成功？什么叫骗子？每个人有自己的定义。有的人以为是身价，有的人以为是市值。放到历史长河里，云淡风轻。用极致理性追求真理的科学家，用极致感性追求美的艺术家，以及用大爱对世界或民族做出的贡献的英雄，才能永垂不朽。 ” 我观察人们的人生目标最大的区别在于评价自己的时间尺度不同，有人追求cash（现金），为了这辈子，有人追求asset（资产），为了自己的孙子，有人追求legacy（遗产），为了世世代代。你追求什么？

王小川：核心要回答三个问题：这个世界是什么样的？我是谁？我跟世界有什么关系？

甲小姐：不是所有人都好奇。

王小川：反正我是好奇的。我对娱乐化没什么感觉，比如我能做头条，但我做不了抖音。如果这次创业我们做成了，我们就有机会在中国做一家能真正有技术理想主义的公司。之前没有这种条件和能力，但我有意愿，现在有了这个机会，是让我愿意去大干一场的最大动力。

甲小姐：你理想的AGI，是信马由缰地做一个未知生命，还是去复刻一个人类生命？

王小川：AGI跟人的生命是连结在一起的，要把整个人类文明当作一个生命来看待。

甲小姐：很多人用对立视角比较机器文明与人类文明，但你所说的人类文明已经包含了AGI——相当于一个海洋生物爬上陆地，虽然进化了，但依然是同样的文明，而不是上了陆地就抛弃了海洋。

王小川：是的。

甲小姐：横向对比所有世界级前沿科技议题，AGI是你眼中“皇冠上的明珠”吗？

王小川：这取决于AGI能不能解释人的生命，是否能让所有生命获得一种更大的文明，从繁荣和延续人类文明这个角度来看，AGI是很有意义的。

甲小姐：你一直提“技术理想主义”，你怎么定义“技术理想主义”？

王小川：首先，把技术做好就是目的，而不是用技术去服务商业化；第二，先相信再看见，而不是先看见再相信。

甲小姐：在当下创业环境看，技术理想主义者是一个有利的词吗？