李彦宏的方向感

李彦宏的方向感

文章图片

李彦宏的方向感

文章图片

李彦宏的方向感

当杰夫·辛顿在2024年获得诺贝尔奖的时候 , 他或许会想起12年前的冬天 , 来找到他的那家叫百度的中国公司 。 因为是百度最早发现了他关于神经网络研究的价值 , 并极力邀请他加盟 。
2012年12月初的一天 , 美国滑雪胜地太浩湖的一家赌场酒店里 , 杰夫·辛顿和他两名学生迎来了四方的竞拍者 , 他们分别来自百度、谷歌、微软和DeepMind 。
辛顿名下的这间叫DNN research公司 , 其实没有任何实体业务 , 它唯一的资产 , 其实就是这三位学者脑中的学识 。
可能是觉得中国太过于遥远 , 当时已经年近七旬的辛顿 , 最后接受了谷歌的出价 。
但在彼时的大洋彼岸 , 中国的信息产业的诸多企业中 , 几乎没有人知道发生过一件这样的事情 , 更不知道有一家中国企业已经开始对人工智能的探索 。
客观讲 , 拍板参加这次竞拍的百度创始人李彦宏 , 是一个有方向感的科技企业家 。 在过去十几年里 , 他的很多关于AI发展方向的判断 , 都对产业产生了价值 。
但也有人不认同他的一些判断 , 于是 , 边争论边发展 , 直至逐渐被验证 , 成为共识 , 成为这个行业的有趣现象 。
那么 , 我们不禁要问 , 李彦宏的方向感 , 从何而来?
——导语
01应用来了?!2024年的百度世界大会 , 李彦宏的主旨演讲 , 从一个技术问题开始 。
这个问题 , 叫“AI幻觉” , 它特指在生成式人工智能时代 , 模型生成的内容与现实世界事实或用户需求不一致的现象 。
你也可以简单的理解为 , 大模型在一本正经的胡说八道 。
李彦宏用一个四层的天坛图片举例 , 告诉台下的听众——真正的天坛只有三层 , 但模型往往会自动生成一幅四层的图片而不自知 。 并且 , 这是所有的生成式模型都会遇到的问题 。 但在真实世界里 , 这类问题往往出现的更加隐蔽且诡异 , 从而给用户更多的困扰和误导 。

李彦宏告诉观众 , 百度用RAG(检索增强)和Image based RAG(/基于检索增强的文生图)的技术 , 改善了文字和图像生成中的幻觉问题 。
而之所以把这个技术细节放在这次重要的演讲的开头 , 和李彦宏接下来要作的一个判断有关——他认为 , “AI幻觉”直接导致了“(生成式)多模态大模型其实还没有什么成规模的应用出来” 。
故而 , 在他看来 , 消除幻觉既是大模型领域在过去24个月实现的最大进展 , 也应该是AI应用出现爆发的起点 。 基础模型的能力已经就绪 , 行业将迎来一个物种大爆炸的应用爆发期 。 ”
如果仔细的研究李彦宏过去18-24个月的讲话 , 会发现“应用”是一个出现频率极高的词汇 。
22个月前 , 也就是早在2023年3月 , 李彦宏就提醒行业“不要重复造轮子” , 并表示应用才是大模型真正的机遇 。
11个月前 , 也就是2023年12月16日 , 李彦宏更直接的表示了自己的焦虑:““我多多少少有点着急” , 他在与极客公园的对话中谈到:“整个国内的AI大模型行业 , 现在其实卷偏了 。 实际上 , 眼下更应该抓住的机遇 , 是大模型原生应用” 。
而到了今天 , 他把2024年的百度世界大会的主题词定为“应用来了” , 简单、直接、强硬 。

在实际行动方面 , 他在百度内部推动了“百度所有业务 , 都要根据?成式 AI理念重构 , 重做?遍原来的产品”;而在外部 , 为了给自己心目中的“应用潮”再加一把力 , 他还在会上展示了遴选出来的Top100智能体和Top100产业应用 。
在当下 , 谈大模型原生应用的当然远非仅李彦宏一个人 , 但如此执着且狂热的业者 , 也着实不多见 。
在笔者看来 , 李彦宏急于推动大模型的应用落地 , 并非因为大模型已经完美 , 而是他的底层认知决定的 。
早在21世纪的第一个十年 , 他就反复的释放一个观点:中国由于是(网民人数)的互联网第一大国 , 就有机会先遇到问题 , 进而有机会先去解决这些问题 , 从而在应用创新上实现跨越 。
而这已经变成了现实 。
在近年 , 他把这个观点浓缩成一个词汇:“反馈式创新” , 在很多场合提及——只有真实世界的实际反馈才能持续驱动创新 。
这也解释了 , 为什么他始终认为 , 在大模型通往完美的路上 , 急需百万级的“应用”作为导航仪 , 去探索大模型的能力、产品与市场的契合度(PMF) 。
但是 , 真实世界这次会按照他的判断而做出改变吗?
02方向感当ChatGPT横空出世后 , 在中国出现了百模大战 , 数百家公司纷纷投入大模型这个赛道 , 资本的眼神都是火热的 。
在很多人为这种图景叫好、上头的时候 , 李彦宏唱了反调 , 他认为——百模大战造成了社会资源的巨大浪费 , 尤其是算力的浪费 , 这种局面不可持续 。
但极多人当时并不认同他的观点 , 他们的理由是:只有150个员工时的oepnAI就做出了ChatGPT , 那我们为啥不能 搏一搏?
事实是 , 虽然openAI起了个大早 , 但现在各大巨头的大模型都赶上来了 。
这反映了一种现象——巨头公司往往在行业出现突破式创新时会因为体量过大、反应较慢而落后半步 , 如IBM、微软、甲骨文都犯过这样的错误 , 但一旦庞大的资源和组织被真正动员起来 , 很容易赶上并碾压初创公司 。
这也几乎注定了 , 大模型不是一条对初创公司友好的赛道 。
国内的事实似乎也说明了这一点 , 有统计显示 , 截至2024年4月底 , 国内共计推出了305个大模型 。 而截至5月16日 , 只有约140个大模型完成了生成式人工智能服务备案 , 不足总量的一半……其中一小部分或许是因为用于学术研究 , 但大部分则死于弹尽粮绝 。
事实也是 , 由于大模型赛道的天花板很高 , 现在的大模型技术距离理想情况还相差非常远 , 所以模型要不断快速迭代、更新和升级 , 不断满足用户需求 , 以及降本增效……这意味着巨大的、无穷无尽的投入 , 更直接导致了AI还没有形成生产力 , 但卖算力卡的英伟达却成为全球市值老大 。
对于此 , 巨头们尚且身不由己 , 初创企业怎么独善其身?
再举一个例子 , 李彦宏和很多行业观点对撞的一个判断 , 是他认为:商业化模型比开源模型更有潜力和价值 。
在“开源模型”十分盛行、部分开源模型宣布取得了比闭源模型取得更好的打榜成绩的当下 , “开源派”声势浩大 。 甚至 , 扎克伯格这种大佬还亲自撰文——《开源AI是前进之路》 , 亲自下场为开源站台 。

怎么看待这个问题 , 这里 , 笔者要讲两层意思 。
第一层:“开源”在一开始可能是更快、更便宜的 , 但更有商业潜力的还是商业化大模型 , 因为最后拼的是产品力 。
例如 , 在差不多10年前 , 分布式计算和分布式存储开始大行其道 , 国内大部分存储企业都去用免费的分布式系统 , 只有两家企业——华为和曙光 , 决心自研全栈、闭源的分布式存储体系 。
10年过去了 , 这两家有自研体系的企业牢牢占据了国内分布式存储市场的头两名 , 而那些用开源分布式的企业 , 受限于对底层技术的控制能力有限、bug多、没有技术支持等方方面面的原因 , 始终没法打入头部市场 。
第二层 , 开源是有标准的 , 在AI语境下 , “伪开源”可能更多 。
在软件时代 , 开源相对比较简单 , 能够拿到源代码、二进制代码就算开源 。
开源的经典精神是——如果开发人员无法学习、使用、修改和共享特定程序 , 则该程序就不能被称为开源项目 。
根据这个逻辑 , 一些专家认为 , Meta 和谷歌的免费大模型(任何人都可以检查和调整)并不是真正的开源 , 因为“许可证限制了用户可以对模型做什么 , 而且训练数据集不公开” 。
李彦宏的看法则是:“开源模型基本上是?堆参数 , ?们不知道这些参数是如何推导出来的 , 也?法更改这些参数 , 因此不会对世界各地的?产?影响 , 也不会让世界变得越来越好 。 ”

事实上 , 有些模型的开源只是为了营销 , 一位专家讽刺的说:”将模型描述为开源可能会使它们被认为更值得信赖 , 即使研究人员无法独立调查它们是否真的是开源的 。
但是 , 在这些争论成为公众话题前至少半年 , 李彦宏就有明确的观点:在商用层面 , 闭源是终局模式 , 因为闭源远比商业效率高 。
简单说 , 免费的就是最贵的 。
这就好像你去A店 , 免费送你一个车的底盘 , 但你得自己配车壳子、发动机和轮胎 , 还要让它们组装起来可以正常运转;而B店提供二手的整车 , 且因为经营规模大 , 单车价格能打下来 , 还提供服务和救援 。
对于不是汽车机械师的99%的人来说 , 选择B店无疑才是符合需求的 。 对于AI应用创新企业来说 , 同样的道理是——企业不用也不该花钱去打磨大模型 , 应该把这部分资源投入到研发大模型的创新应用上来 。
一个有趣的现象是 , 有时候李彦宏明知自己的观点还不是行业共识 , 但他还是愿意抛砖 。
例如 , 在智能体方面 。
百度也在智能体方面发力 , 李彦宏对于智能体的看好也由来已久 , 他认为——目前 , 搜索和大模型的结合 , 更多应该是在智能体上 。
不过 , 李彦宏说对智能体的判断时 , 还说了一句“冷话”:“智能体现在还并不是一个行业的共识 , 只是百度下的一个赌注 。 ”
这句话看似突兀 , 仔细深思 , 又觉得李彦宏有李彦宏的道理 。
千行百业竞逐智能体 , 但真正有几家公司真懂智能体?是真的为了成就智能化而做智能体?
如果问的再尖锐一点 , 大部分企业对智能体的研发能投入能占到总研发经费的20%吗?10%?
恐怕一百家里没有一家 。
这就跟我最近追的《小巷人家》这部剧的情节一样——庄家坚持要让一双儿女上高中、考大学的时候 , 大家嘴里都说“蛮好蛮好 , 大学生有前途” , 但是一回头 , 还是安排自己的子女上技校、上中专 , 因为好就业 。
等到一夜间情势变了 , 中专、技校不再包分配的时候 , 这时候大家才是真的意识到 , 庄家的决策做的太对了 , 自己在信息茧房里呆的太久 , 耽误了儿女的前程 。
可以说 , 直到这一刻“共识”才形成 , 但绝大多数人都无法受益于这个共识 , 因为他们在“等”共识的时候 , 时机已经悄悄错过了 。
历史从来不是由共识推动的 , 而是由先于共识形成时就做出独立判断的人推动的 , 共识只是尘埃落定后的结果 。

03创始人模式的底层逻辑如果说以上关于卷应用、闭源、智能体的观点是显性的 , 那么 , 也必然也有解释这种方向感的隐性因素 。
恰好 , 硅谷最近热议的“创始人模式” , 似乎为我们寻找隐性的底层逻辑提供了线索 。
这个定义 , 出自YC创始人Paul Graham的一篇文章 。
它的核心观点很简单——相较于只通过下属掌控公司的职业经理人 , 亲力亲为的创始人更有利于一家大公司的发展 。 因为创始人具有三个职业经理人无法具有的特质——

  1. 创始人相当于公司的亲生父母;
  2. 可以完全决策如何作出改变;
  3. 知道如何重建公司;
说“亲力亲为” , 是不过分的 。 仔细想想 , 和李彦宏同年龄段但还在一号位上的企业家 , 着实已经不多 。
对于创始人模式的第一条 , 在十几年前 , 我曾经和李彦宏本人在一次出差期间 , 有一个短暂的交流 。 我问他为何在有些事上坚持亲力亲为 , 他的回答是:“因为你们中的任何人都有可能离开 , 但我必须留在这里与百度同生共死 , 无法离开 。 ”
“创始人模式”中的第二条也适合于百度 , 那就是“可以完全(自主)决策做出改变” 。
我们都知道 , 百度在自己的第二个10年 , 也就是移动互联网时代 , 发展的路径可谓是跌宕起伏 , 也错过了不少机会 。
但是 , 在国内产业界没有任何企业看出AI的潜力(大部分人是在2016年也就是阿尔法狗战胜人类棋手时 , 才意识到AI的潜力)的2010年 , 百度就已经将NLP研发部门从各个业务线中独立出来 , 一面攻坚前沿技术 , 一面追求业务落地 。
【李彦宏的方向感】事实上是 , 早在2006年 , 百度就已经有员工自发的把人工智能技术用在产品的提升上 。
换言之 , 百度提前十几年就开始走自己的AI之路 , 而且投入了非常高的研发经费 , 除了“创始人模式”之外 , 没有任何一种可能性能让一个企业开始这种高昂的、看似无边无际的远期投入 。
第三 , 我们前面已经说过 , 李彦宏推动了百度所有产品“用AI重做一遍” , 这与文中的观点三即——知道如何重建公司 , 可谓严丝合缝 。
从微观角度 , 我不怀疑个人兴趣或性格影响了李彦宏对AI的执着;但从宏观角度 , 如此执着的追求 , 倒不如说AI是他的欲望、信仰和对未来的寄托 。
《创始人模式》里有一句话说的很好——他们(创始人)所做的事情 , 使他们被许多人视为古怪 , 甚至更糟 。 但(你要)看看创始人已经取得的成就——他们是在逆风而行的情况下取得的这些成就 。

    推荐阅读