阿里大模型也来了!聊聊我的几点看法
发布时间:2023-04-09 18:00 作者:桑明强


作者|桑明强


距离阿里大模型推出时间越来越近,市场上的声音也比较杂,由于近期张勇刚刚宣布了阿里巴巴成立24年来最重要的组织变革决定,大模型隶属的云智能集团由逍遥子直接负责,这件事就变得更加微妙起来。


《新眸》也第一时间拿到了阿里大模型的测试邀请码,体验下来最直观的感觉是,可圈可点,反应速度还不错,但无论是百度还是阿里,大模型还停留在transformer水平,并没有涌现出对于文本出色的理解能力。


总体上说,通义千问和文心一言在能力上还是旗鼓相当,但这才刚刚开始,相比文本问答能力,其实我们更好奇“通义千问”接下来的动作。


因为就行业层面来看,由于字节跳动节奏感未知(原阿里M6大模型带头人现加入字节AI Lab),第一梯队的关注点更多落在了腾讯、百度、阿里和华为身上,一是这几家公司都有这方面的底蕴和人才技术储备,二是因为从业务上看,这几家大厂都需要大模型的支持。


现在百度已经勇敢地迈出了第一步,发布了初阶版本的文心一言,但囿于当时百度比较激进的品牌打法,导致外界对于阿里大模型的期望更大了,但据《合纵投研》披露出的信息,现在阿里大模型仍处于追赶GPT 3.5的阶段,距离GPT 4还有一段路要走。


造成这种“卡脖子”的关键因素主要有3块:一是数据量,这个权重占比30%左右;二是大模型结构的创新性,目前国内还做不成高层级的架构,这个权重占比在40%-50%左右;最后的30%权重是工程化落地,现在这块国内也没有比较好的参照。


再联想到Open AI以及它背后的GPT的进化逻辑,大家已经开始意识到,这次的AGI较量已经不单单是财力和人力上的比拼,而是从理论、到工程、到产品,再到商业、人文上的全面的颠覆,回到阿里大模型这件事上,或许我们更应该把关注点放在大模型和阿里现有业务模块的应用上。


清华大学智能产业研究院院长、中国工程院院士张亚勤曾在近期聊到过这个话题,他认为可以把GPT这个系列的生成式AI模型看作一个由大模型组成的AI操作系统,和当年PC上的windows,以及移动的安卓、IOS基本具有相似的意义。


而一个新的操作系统的诞生,往往意味着下面的硬件、上面的应用都会被重构,形成一个全新的生态。甚至他还断言,如果说PC互联网的生态价值是1X,移动互联网的生态价值是10X,那么AI生态至少是100X。


张亚勤的判断很大程度上来源于微软和Open AI的结合,有了GPT 4的加持,微软曾经一度式微的业务板块都变得富有想象力,其中就包括此前被打得节节败退的搜索业务Bing。


这也解释了为什么包括百度、阿里、华为在内的大厂们都纷纷押注大模型,说白了,chatGPT就是一个钩子,如果你还把目光放在大模型会如何颠覆搜索场景,那我只能说你不仅不懂大模型,而且不懂商业玩法,这也是很多大厂选择下场的真正原因,即便它现在看起来还比较模糊。


确切地说,这和几年前被资本催熟的“假风口”有着本质上的不同,LLM、包括AGI是已经得到微软验证的真风口,甚至还一度被埃隆·马斯克警告——人工智能正在朝着人类不可控的方向演进。


很显然,马斯克的担忧更多的是伦理和道德层面上的,这也是人工智能这门科学最让人敬畏的地方,一旦被别有用心的人和公司操纵,它极有可能带来比较大的灾难。但如果我们在规范和法律标准下看LLM和AGI,它明显是个很好的工具,就像是一个人类智慧收纳盒,通过大模型的方式进行能力输出。


结合目前微软的动作来看,大模型在云计算、文本办公、搜索领域都有着很好的契合点。不难推测,国内的大模型方向也会依葫芦画瓢,先从这几个方面开始试点,巧合的是,这几块业务阿里都有,云有阿里云、文本办公有钉钉、搜索有夸克。


更重要的是,阿里还有微软手上没有的底牌——电商。电商是阿里巴巴的根基,但就像亚马逊之于贝索斯,面对直播电商、兴趣电商等各种势力的崛起,地盘被冲击,这块一直是阿里巴巴这些年难以言说的“心病”。


所以对于阿里来说,大模型得做、而且必须要做,即便增收路径模糊,但它也有可能是一个很好的智能工具,而且,要远比前些年搭建的数据中台想象力更高一些,前端的灵活性,其实可以让阿里找到新的增长可能性。


关于LLM和AGI,现在大家的想法还是比较局限的,就比如针对“大模型究竟会颠覆什么”这个问题,我们在给出答案时,可能更倾向于回答“大模型不能颠覆什么”。造成这种局面的原因,既有大众认知水平的因素,也有行业发展现状的因素。


这就跟看科幻片同一个道理,早在10几年前,我们就能在美国大片里看到各种智能的场景,但事实上,即便发展至今,我们距离所谓的AGI还有很长一段路要走,但可以确定的是,以百度、阿里为首的大厂纷纷下场后,真正的人工智能浪潮已经开启。


在长达10年的移动互联网浪潮中,生活中很多场景被颠覆,衣食住行,无一例外。但如果你深究的话,这种变化的根本原因其实是由供需端在成本因素上推动的,总有性价比更高的方案出现,然后替代掉老旧的方案,这是数字经济时代的新法则。


所以如果我们把视角放在大模型的供需视角来看,会发现,这个市场还远未被很好地开发。就像在特斯拉出来前,没有人会想到当年的全球霸主丰田汽车会受到如此大的挑战,按照这个逻辑推演的话,现在市面上所有的判断,都不可信,或者说不可全信。


也许再过一年后,随着这些大厂陆续把大模型应用起来,做到既好用,又实惠,可能我们对大模型的理解或许会更客观些。


最后聊聊大家最关心的失业话题,这个问题很显然过于杞人忧天了。


很多时候,我们往往过度高估了人工智能,而低估了我们自己的创造力。