作者|桑明强 今年中文科技圈的焦点当属百度。 继今年3月文心一言开启邀测半年后,百度再次掏出一张王牌——文心一言现已正式向全社会开放。这意味着,和以前“排队”申请内测资格不同,现在用户可以直接在应用商店下载“文心一言APP”或者登陆“文心一言官网”上手体验,这瞬间点燃了公众热情,开放后不久“文心一言APP”就在各大应用商店冲上热榜,并荣登苹果App Store免费榜榜首,更是在短短1天内就回答网友超过3342万个问题。 很多网友都直呼“泰酷辣”。很多用户更是脑洞大开,有的用文心一言写短视频脚本,有的把它当作写论文开题报告的神奇,更有一些职场人表示已经离不开它了——不仅能快速生成PPT大纲,还能帮你生成工作汇报,简历优化求职信都不在话下,更夸张的是,它还能根据照片给用户做MBTI性格测试。 《新眸》也在第一时间下载了“文心一言APP”,深度体验了半天后,总结有以下几个亮点: 1、对话式AI在短短6个月又得到了一次全新升级,理解问题更全面的同时,答案也更加精准。比如当我问它“明天我要给学生上导数课,你能不能帮我写个备课教案”、“我朋友明天要来南京旅游,你能不能给我写个攻略”等,它都能很快给出方案,拿旅游攻略来说,文心一言的方案简直比本地人还要懂。 2、除了常见的对话式AI,文心一言还增加了社区与发现页面,尤其是社区功能很有意思,它允许用户自主发布一些帖子,因为主基调是AI,所以这个社区看起来就像是科技版“小红书”,其中有不少用户因为发布有质量的帖子获得了高赞; 3、APP主界面较当下很多主流应用要清爽很多,没有多余、花哨的功能,最重要的,没有广告。尤其是发现功能,简直就是小白创作者的福音,它甚至帮你分好类目,涉及秋招、职场、亲子、生活、论文等,目的就是引导创作者们更好、更快地上手,感受AI带来的方便和乐趣。 当然,对于一款刚刚面向公众的AI软件来说,我们有理由相信,这才是刚刚开始,随着后续涌入的创作者和用户越来越多,它在功能和用户体验上也会得到相应的完善。但有一点毋庸置疑,相比同行都把焦点放在对标ChatGPT,快速做一个类似的产品,开放后的百度文心一言已经探索出属于自己的道路。 据百度官方介绍,除了文心一言APP,百度后续还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心功能。换句话说,包括百度搜索、百家号、百度文库、百度输入法等在内的,这些以前我们熟知的应用都将在AI的加持下焕然一新。 那么问题来了,回到我们一开始讨论的话题,为什么在这轮AI竞赛中,百度始终能拔得头筹,以及开放后的文心一言对于百度来说,究竟意味着什么? 今天这篇文章我们就来好好聊一聊。 01 百度文心一言,为何总能拔得头筹? 先说结论,大模型这件事,百度想得越来越明白了。至于文心一言对公众开放,很有可能成为百度押注人工智能后的一步妙棋。 为什么这么说,相比文心一言APP开放后带来的惊喜体验,相信有不少人跟我有相类似的想法——这么酷的AI应用,居然是百度出品。的确,在用惯了大而臃肿的各类应用后,百度能放下历史包袱和大厂身段,打造一款真正面向C端用户和创作者的AI应用,这本身就是一件值得表扬的事。 所以和文心一言率先在国内全面开放这件事相比,百度对大模型与AI的最新思考和实践,才是更值得大家关注的点。 众所周知,自2010年开始,百度就已经全面布局人工智能,是全球为数不多、进行全栈布局的人工智能公司。单拿投入方面来说,百度一直以来坚持压强式、马拉松式的研发投入,近十年累计研发投入超过1000亿元,其中,2022年百度核心研发费用214.16亿元,占百度核心收入比例达到22.4%。 按照这个逻辑分析,百度文心一言这些年取得的成绩,从2019年发布最早文心大模型,到今年3月发布文心一言,成为全球最早做出类chatGPT产品的大厂,再到文心一言首批对公众开放,这一切都是厚积薄发的结果。 事实也的确如此,根据IDC最新发布《AI大模型技术能力评估报告2023》报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一,三个绝对第一体现了百度文心大模型的基础技术深度和产业应用覆盖广度。 值得一提的是,这是IDC首次提出AI大模型技术能力评估框架,国内主流大模型包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商均参与了本次评估。换句话说,百度是这场大模型角逐战名副其实的技术突破者和应用引领者。 另外一点,得益于百度在AI上有着很强的先发优势,从算力层的AI芯片昆仑芯,到框架层的PaddlePaddle(飞桨),到模型层的文心大模型,再到应用层面的搜索、文库、协同办公软件等,百度几乎在AI链条上的每一个环节都有布局,“全栈”优势明显意味着它能在AI剧变的时代游刃有余——向下有关键自研技术支撑,向上有大量应用场景可以实践。 所以文心一言总能跑在最前面,并不意外,甚至可以说是水到渠成。 02 文心一言开放,对百度意味着什么? 其实在写这篇文章前,我曾和一些业内朋友讨论过,他们的看法基本可以概括以下几个点: 第一,文心一言率先全面开放是一个关键信号,除了老生常谈的合规问题,最明显的,在经历了百模大战后,也的确到了该拼落地、拼商业化的时刻了,毕竟前有Meta发布开源大模型Llama 2,大模型效果也越来越好,企业大规模应用的最好时机已经提前到来; 第二,文心一言的开放,对百度来说,能继续扩大它在AI和大模型上的先发优势,就像滚雪球一样,谁能更懂用户需求,然后把这些需求通过技术方式解决掉,让AI真正服务于人,谁就能继续保持领先。按照这个逻辑来看,很显然,把文心一言放在社会公众层面进行练兵,就是最好、也是最有效的方式。 事实也的确如此。拿文心一言来说,作为新一代知识增强大语言模型,它是百度继文心一格之后的又一个生成式AI产品。自今年3月发布至今,它熟练掌握的创作体裁已经超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。效率方面,通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到原来的3倍,推理速度更是达到了原来的30多倍。 根据百度创始人、董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。 值得一提的是,文心一言还只是百度AI布局的一小块。它背后的文心大模型既包含基础通用的大模型,也包含面向重点任务领域和行业的大模型,以及丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发,也就是说,无论是To C还是To B,百度都有很大的机会。 拿“搜索+大模型”这个组合来说,“AI伙伴”已经百度搜索开始内测,这款全能的“Al伙伴”,不仅能够听懂用户的任何问题,用语音进行互动,还能帮助用户标记答案中的重点,提供权威的来源,同时支持调用各种工具和服务,以及根据用户意图制作图片或进行文案创作,它就像一位贴心伙伴时刻陪伴用户,让用户随时随地与未来对话。 除此之外,据百度方面介绍,现在的文心大模型已经大规模应用于搜索、信息流、智能音箱等互联网产品,并通过飞桨开源开放平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。以上种种,恰恰是百度最容易被外界低估的地方。 03 大模型科技竞赛又到了一个新高度 其实早在今年3月百度正式发布文心一言的时候,《新眸》内部就已经作出过判断:和几年前被资本催熟的“假风口”有着本质上的不同,LLM、包括AGI是已经得到微软验证的真风口。 当时囿于国内大模型格局尚未形成,也仅有百度一个中国玩家跑在了最前面,导致可供参考的标的有限,所以关于LLM和AGI,彼时大家的想法还是比较局限的,就比如针对“大模型究竟会颠覆什么”这个问题,我们在给出答案时,可能更倾向于回答“大模型不能颠覆什么”。造成这种局面的原因,既有大众认知水平的因素,也有行业发展现状的因素。 但回头来看,在长达10年的移动互联网浪潮中,生活中有很多场景已经被颠覆,衣食住行,无一例外。如果你深究的话,这种变化的根本原因其实是由供需端在成本因素上推动的,总有性价比更高的方案出现,然后替代掉老旧的方案,这是数字经济时代的新法则。 AI和大模型浪潮也是同样的道理,如今文心一言的全面开放以及百度对于大模型的思考与实践,的确出乎了很多人的意料——它不仅仅在技术上跑在了最前面,也在AI商业化这个世界难题上做出了中国玩家独特的探索。但与此同时,也预示着大模型科技竞赛即将走向另一个新高度,难度也会更高。 不过可以肯定的是,百度的故事还会继续,大模型本身的技术竞赛也会继续。