拆解Perplexity:搜索领域的超级黑马,「谷歌杀手」是如何炼成的?
发布时间:2024-06-18 19:13 作者:罗锦雯



作者|罗锦雯

编辑|桑明强


若干年前,中文互联网发展到顶峰的标志,是以BAT为首的超级明星公司的崛起,但谁能想到,到了AI大爆发的时代,最先受到猛烈冲击的反而是搜索,尽管早前马云曾放话AI电商将成为主流,但现实情况是,AI对搜索领域的冲击要远比对电商来的早得多。


最明显的,由前OpenAI研究科学家Aravind Srinivas联合几位合伙人共同创办的Perplexity,在没有任何用户基础的情况下MAU(月度活跃用户)超过千万,而这仅用了短短不到两年时间,与之相对的,它的身价也一路水涨船高,据The information 5月底的报道,眼下BVP正在牵头对Perplexity 2.5亿美元的投资,最新估值达30亿美元,相当于1/10左右个百度。


作为传统搜索引擎的升级品,Perplexity实质上是AI时代的产物,你可以把它理解成一个答案引擎,但它绝非只是大模型的“套壳”公司,它的核心技术是一个名叫RAG的检索增强生成技术,通过RAG技术,Perplexity AI能够实时搜索互联网并提供准确的最新信息,并附有来自可靠来源的引用。


值得一提的是,这家公司规模还不足百人,但包括黄仁勋、贝索斯在内的业界大牛皆是Perplexity的忠实拥趸。按照黄仁勋的说法,Perplexity是他每天工作使用最高频的应用之一,尤其是面向对专业度要求更高的搜索需求,比如“了解关于计算机辅助药物研发”。


事实上,Perplexity并非个例,包括天工、秘塔等在内的都是近两年刚崛起的新秀,反观Google、百度在内的传统搜索巨头,尽管他们都嗅到了这场即将到来的危机,但吊诡的是,以百度搜索为例,尽管文心一言的推出曾在市场上引发过一波小高潮,但后续百度APP「用AI重做一遍」并没有带来二级市场的持续看好,股价从去年3月的最高点跌幅近1/5,以至于很多人开始思考,AI搜索的正确打开方式究竟是什么?



01

「AI搜索」剧变始末



和大多数初创公司一样,Perplexity源于一个产品创意,创始人Aravind Srinivas发现使用谷歌搜索常常给不了他想要的结果,而且搜索过程过于繁琐,于是他决定自己打造一款能够直接生成答案的搜索引擎,他想打造最世界上最好的研究助理。


Aravind Srinivas的想法与Denis Yarats(现任Perplexity联合创始人兼CTO)不谋而合,两位因相似的研究兴趣与观点结缘,分别独立发表了在主题,论点,甚至在引文上都高度相似地论文,他们都认为未来的搜索应更高效。


但有意思的是,他们的想法并没有得到投资人的支持,所以他们只好「曲线救国」,先把理念落地成一个to B的产品,一个从自然语言——SQL-2的转换工具,据此设计的初代答案引擎也仅仅是在内部使用,用来搜索员工保险之类比较琐碎的事情。


在当时来看,投资人不看好他们是有道理的,囿于谷歌的强大垄断,如果一个人跟你提出要颠覆谷歌无异于痴人说梦。事实也的确如此,在Perplexity之前,包括Marc Andreessen、Ask Jeeves先后尝试过做直接生成答案的搜索引擎,但最后都无疾而终,前者是大名鼎鼎美国网络浏览器之父,Netscape Navigator浏览器就是他的杰作。


事实证明,Perplexity成立的时间是一个很妙的时间点。据Perplexity创始人Aravind Srinivas披露,早在2018年刚进入加州伯克利大学攻读AI和深度学习方向的博士时,他就瞄准了LLM出色的语言“理解”能力,但他也同时坦言,2021年以前,他都没法加入游戏,因为大语言的模型开发还未成熟,直到出现了Jasper这样的初创公司,也有了像GitHub Copilot这样从模型变成产品的例子。


这也意味着最烧钱的大语言模型基础已经被Open AI、Anthropic这样的头部公司攻克的差不多了。而Perplexity需要做的,就是如何借助大模型打造一个新产品。


值得一提的是,Perplexity团队的反应速度相当惊人,GPT3.5发布一周后,Perplexity AI就正式上线。更厉害的是,Perplexity不仅借助LLM实现了答案引擎的想法,还在这个基础上用RAG技术优化了LLM幻觉问题,就如Aravind Srinivas所述,Perplexity并不是二者的替代,而是两者的平衡点。



02

「颠覆谷歌」的背后逻辑



外界容易忽略的是,谷歌布局AI 搜索并不算晚,甚至要比Perplexity早得多,甚至GPT系列模型的基础训练都是基于谷歌研发的Transformer架构,但谷歌却未能在这场搜索剧变中占得先机,为什么?


这还得从传统搜索引擎的赖以生存的商业模式「竞价排名」开始谈起,但到了AI时代,Perplexity所定义的搜索逻辑里,信息排序的流程被省略,直接给出答案,但谷歌的收入恰恰来自让人们点击和浏览链接,赚取广告费,同时打造数据飞轮,优化搜索排名。


采用AI 搜索意味着推翻自己的搜索模式,颠覆搜索模式给用户更好的体验不是难点,但一下子推翻长期以来镶嵌其中的商业模式才是最难以抉择的,起码就目前来讲,在搜索引擎上的广告业务依旧是谷歌的核心收入来源,根据它的2023年财报,其广告业务营收2378.6亿美元,在总营收中占比77.4%。


另一个被外界饱受诟病的,是关于传统搜索引擎的复杂性。搜索引擎说到底就是信息处理工具,过去的使用路径大致如此:输入信息需求——信息筛选与排列——信息选择与整合——需求满足,只有当用户搜索需求被满足了,人们的决策与行动才能进一步展开,由此而衍生的类似知乎问答、小红书种草大多是这样的逻辑,但现实情况是,信息过载,这个现象从上世纪80年代就成常态了,互联网带来信息指数级增长,生成式AI又升一个量级。


反观Perplexity AI,它本质上就是一款信息处理工具,关键能力在于,最大程度上缩短了满足信息需求的路径,可以说,Perplexity的颠覆性也源于改变人们信息搜索习惯的潜力,而一旦当人们习惯了一步得到答案,就没有耐心去翻阅无数条夹杂广告的蓝色链接了。


某种程度上,Perpelxity的用户活跃数量与使用量的急剧增长,恰恰证明了用户习惯改变的迅速。根据新眸调查,今年1月,Perplexity的月活跃用户已经增长至1,000万,访问量达到4500万次,总搜索量超5亿次,较2023年增长了20,512%,这种爆发式增长让Perplexity成为一级市场的当红炸子鸡。



03

谁将主导下一次搜索革命?



去年以来,相继有类似的AI 搜索软件推出,甚至有自己的大模型支持,比如必应和国内的百度,还有专门做搜索引擎的天工、秘塔等等。


如果说Bing、百度等老牌搜索巨头迎战AI 搜索的态度还算积极,那谷歌看上去就非常敷衍,仅仅是将王牌大型AI模型Gemini集成到搜索引擎中,直接在搜索页面开头添加了摘要,也就是AI Overviews,以直接回答问题。


但打破用户习惯的产品往往是重写逻辑,而不是利用AI对原产品缝缝补补,处理不当反而会消耗原有用户的信任。谷歌的AI overviews推出不到一周,便因为没认出毒蘑菇、建议用户吃石头、把胶水加到披萨上,招到用户吐槽。


这些缺乏常识的答案看似是大模型幻觉问题,背后其实是搜索的召回精度问题。谷歌的召回技术依旧依靠网页索引,这一套在信息排序上管用,但与内容相关度和准确度无法保证;在自己的强势领域搜索上,谷歌的逻辑开始吃力起来。就如美国证券分析师丹·艾布斯·韦德布什所述,“这是在谷歌搜索服务的压倒性优势上出现的裂痕。”


无独有偶,高度依赖中国本土市场的百度,也面临着与谷歌相似的境遇。国内的AI 搜索产品使用前三名只有360是从传统搜索引擎升级而来,天工 AI与秘塔AI均是全新的产品;尽管百度借助文心一言重构了搜索引擎,但AI 搜索的答案只占11%,依旧高度依赖着传统搜索的使用惯性。


这将不可避免的涉及到一些大厂之间的竞争。比如在社交媒体微博上的搜索,用户大概率想是了解热点事件,并加入讨论;在小红书上搜索更多是为了查找攻略、测评等经验性信息;高德等地图软件上的搜索是为了导航等等;也就是说,用户需求划分更加细致的平台时代,早就瓜分走了一部分通用类搜索引擎的市场。


换句话说,有关搜索的革命并不是因为AI 搜索才开始的,它只是加速传统搜索式微的一支关键力量。AI 搜索的本质还是AI Agent,通过搜索解决去用户各种各样的问题,因此,无论是平台内嵌还是专门的搜索引擎,AI 搜索的形态一定是和他匹配的服务相辅相成的,按照这个逻辑,搜索的真正的代际变革才刚刚开始。