作者|周尧 ChatGPT引发的大模型热潮依然汹涌,各大企业AI大模型落地的消息接踵而至,但随着各家大模型的发布,行业竞争的焦点正在从产品本身过渡到产品“落地”层面。 事实上,一个新技术、新产品的诞生,背后往往酝酿着一场市场争夺战。无论是先发者,还是后继者,通过研发出排他性强的优势产品,只有推动在应用层面真实落地,才能占领市场、塑造竞争壁垒。 早在今年2月,ChatGPT于国内引爆热度时,科大讯飞就曾透露将在5月6日发布产品级落地应用,在不久之前的业绩说明会上,科大讯飞同时对外公布了星火认知大模型的发布信息。 5月6日,科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪准时发布了讯飞星火认知大模型。 值得一提的这是首个面向全体公众大规模开放的大模型,也就是说在正式开放后,所有民众仅需注册即可体验。 而且不同于此前行业对于大模型产品本身能力的阐释,此次科大讯飞除了对于模型本身的能力展示外,还展示了星火认知大模型在教育、办公、汽车、数字员工等多个方向的商业应用成果。 可以说,伴随着讯飞星火认知大模型的发布,科大讯飞后来者居上,已经打出了落地的第一枪。 与此同时,刘庆峰在发布会上的承诺,同样让市场感到震撼。他表示:6月9日前,讯飞星火大模型将突破开放式问答,实现对话能力和数学能力的再升级;8月15日前代码能力会上大台阶,多模态交互能力再升级,在10月24日前,星火大模型将对标ChatGPT,在中文能力上超过ChatGPT,在英文能力上与ChatGPT相当。 作为A股第一家以人工智能为主业上市的“国家队”企业,科大讯飞在大模型上走出了区别于其他厂商的路线,接下来的关键在于能否得到市场的认证。 01 通用能力时代 大模型让人类感受到的智能,是就像人类自身的学习那样,通过通用知识和逻辑能力的训练,人类具备了解决各种问题的能力。 大模型也有这种能力,基于文本语料采用无监督学习训练的模型可以用少量的监督样本,用于各类机器学习任务,比如图片分类、翻译、对话、写代码等。 这样的能力就是所谓的通用能力,因此,当人们在说通用人工智能(AGI)时,一般指的是具有普通人类智慧,而且还可以执行人类能够执行的任何智力任务的机器智能。 而塑造这样的能力,是极具挑战性的,但是这又是打造一个大模型中最为关键的一步。 在ChatGPT火热一时期间,刘聪也曾公开表示,ChatGPT通过至少以下五个维度能力的显著提升,实现了初步的“智慧涌现”。 包括海量高价值信息的全量在线记忆能力;自然语言输入的任意任务和多轮对话理解能力;复杂逻辑的思维链推理能力;多角色多风格的长文本生成表达能力;即时新知识学习应用与进化能力。 与此同时,因为引入了代码作为训练语料,ChatGPT还额外产生了自动写代码和理解代码的能力。 于是,在讯飞星火认知大模型中,其所打造的能力更为全面,在发布会上,刘聪表示星火认知大模型具备七大核心能力,包括多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。 其中,在长文本生成、数学能力,以及知识问答三方面,据刘庆峰称“已经超过了ChatGPT”。 发布会现场,刘聪就七大能力进行了实时演示。 在文本生成上,刘聪为星火起了一个故事的开篇,他说“孙悟空和奥特曼也偷偷潜入了现场,他们都抢着想做星火大模型的发言人,还为此吵了一架。”而星火紧跟着就娓娓道来。 此外在长文本的生成中,根据不同的故事要求和讲述声音、甚至虚拟人物的选择,星火均能够一一满足。 我们同样尝试性地问了一个同样稀奇古怪的问题:五一劳动节假期,唐代诗人杜甫来到合肥旅游,他在排队买奶茶时,正巧遇到李白在旁边吃烧烤,以此为开头写一个故事。 出乎意料的是,星火认知大模型给出了一个颇为有趣的答案。 新眸了解到,目前讯飞星火认知大模型能够较好地完成中英文论文、品宣文案、以及故事内容等内容形式的撰写。 但是,不止步于文本能力,星火认知大模型的数学能力同样高效且准确。在面对新眸提出的的数学问题中,“已知空间三个点的坐标,怎么计算三角形的面积”,星火认知大模型在极短的时间内就给出了问题的推理过程、公式,以及如下的正确答案: 就如刘庆峰所言,“认知大模型成为通用人工智能的‘曙光’,通用人工智能的星星之火正在涌现。” 02 如何实现产业化落地? 在大模型浪潮之下,国产大模型厂商在产品能力、算力能力以外,大都会在落地上率先选择与自身业务息息相关、甚至更为熟悉的场景,星火认知大模型也不例外。 作为老牌人工智能企业,科大讯飞从诞生起就在围绕各行各业做赋能,在教育、医疗、汽车、智慧城市、智慧金融等领域均有布局。 以智慧教育为例,科大讯飞已经形成了完整的落地方案。 在2022年的业绩说明会上,科大讯飞提到智慧教育的“G-B-C发展模式”,即讯飞智慧教育产品主要分为面向地市县等区域(G端)的因材施教解决方案,面向学校(B端)的校内大数据精准教学、英语听说考试等,面向家长孩子(C端)的AI学习机。 星火认知大模型延续了讯飞脚踏实地的路线,从诞生之初就选择了落地领域。在此次发布会上,科大讯飞展示了星火认知大模型在教育、办公、汽车、数字员工等多个方向的商业应用成果。 比如“大模型+AI学习机”,搭载认知大模型的科大讯飞AI学习机T20系列产品实现了中英文作文类人批改。 据了解,在英文作文批改方面,学习机不仅会批改单词拼写、词汇用法、句型结构,最后同样会给出内容评价。此外,学习机在作文有错误的地方会给出相对应的学习资料,完成基础批改、高级批改、提示建议、优化参考的闭环过程。 刘庆峰表示:“这在业界是0到1的突破。”搭载大模型的讯飞AI学习机在批改、修订等的准确率上已经超过了一般老师的平均水平。 此外,在大模型+智能办公、智能座舱、数字员工层面,讯飞均推出了切实可落地的产品。 在办公领域,讯飞智能办公本、录音笔、讯飞听见、智能麦克风,通过星火大模型进行了升级。 会议现场,刘庆峰讲述此前会议场景下,往往会出现记不全、找不到、对数据安全性产生担忧的痛点。而搭载了大模型的智能办公本,可以通过语音转文字、字音同步、离线模式录音转写的方式解决,能够快速生成会议纪要。 而在演讲场景下,智能办公本则能够快速将重复的语气词去掉并保留演讲中的关键信息,同时调整口语语序,使其读起来更加通顺。 据刘庆峰介绍,语篇规整能力可以实现原文忠实度保留96%以上,原文篇幅缩小40%-60%,阅读效率提升50%以上。 如此高效的落地速度,其实与星火认知大模型自项目开发之初采用了“1+N”的架构有关。其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,而“N”则是应用于教育、医疗、人机交互、办公等多个领域的专用大模型。 从一定程度上看去,“1+N”模式不仅能够让“星火”在行业中实现普适,还能显著提高了认知大模型在细分领域的实用性。 因此,相比其他厂商的大模型,星火认知大模型能够率先打开应用场景的大门。 03 大模型尽头是“去中心化” 大模型的研发往往是长周期、高投入、高资源消耗的。从大模型的持续训练到使用,这个过程中还需要更多因素的支撑,仅凭一家之力,往往难以推动大模型的商业化进程。 不同于传统互联网赛马的逻辑,以往是一个产品的诞生仅靠企业自身就可以实现研发、推广、应用,但在人工智能行业中,作为新基建的重要一环,其在产业融合进程中,需要持续推动中国产业结构升级,而这应该是整个行业的目标和方向。 因此,大模型本身就意味着“去中心化”。“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”刘庆峰对此也公开表示。 尽管当下国内各家厂商都在发布自己的大模型,但是从产业链的角度看去,从上游算力到中游的技术研发,再到下游的应用,已经有越来越多的企业选择了开放的心态。 这一次科大讯飞依旧走在了前列。 据新眸了解,此次讯飞开放平台新增星火认知大模型,将赋能开发者打造更具价值的AI应用。目前,讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。 据刘庆峰表示,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。 此外,在备受关注的算力方面,科大讯飞则与华为、寒武纪、曙光等公司有合作。采访中,刘庆峰透露,星火大模型算力硬件主要由华为提供,华为已经给讯飞派驻了“特战队”,基于此,希望能够在大模型上实现算法在国产硬件上应用的良好效果。 刘庆峰表示,在算力方面科大讯飞联手华为,会使未来认知大模型持续进化,在自主可控的平台上,不断地提升。 在大模型进入视野之前,科大讯飞股价在2022年开始不断走低,一度从52.77元每股跌至32.83元每股,跌幅高达38%。不过,随着ChatGPT推出,科大讯飞受相关产业链带动,股价在今年一路回升,市值重回千亿。 此次发布星火认知大模型,不仅让科大讯飞在二级市场实现进一步增长具备了可能,也极有可能成为国产大模型中的主角,加速商业化的进程。