刚刚过去的4月,国内的AI大模型如雨后春笋般涌现了数十款,5月份迎来新一波大模型及其应用产品的发布。5月5日,学而思宣布自研数学大模型名为MathGPT,同一天,网易有道展示了基于“子曰”大模型研发的AI口语老师视频,5月6日科大讯飞将发布讯飞星火大模型,并落地在教育类智能硬件AI学习机等产品中。南都记者统计发现,截至目前已有30多款大模型涌现,但有业内人士向南都记者指出,实际上参与研发大模型的企业数量已经超过60家,一场“百模大战”正在进行中。与此同时今年以来也出现了大量AIGC概念公司,其主营业务与人工智能并无密切关联,却因为声称计划入局大模型继而拉动股价暴涨。这场“百模大战”中,有几成泡沫?谁在蹭热点,谁又能笑到最后?
布局
产品扎堆发布,“百模大战”开打
自ChatGPT发布以来,AI大模型领域热度持续,国内各大互联网和人工智能公司接连宣布进军大模型领域。目前,百度、阿里巴巴、商汤科技等公司都官宣发布了自己的大模型以及应用场景。
3月16日,百度领跑,发布中国版ChatGPT“文心一言”,创始人李彦宏在内部活动中表示,文心一言内测一个多月,就完成了4次大的技术升级。4月9日,基于360 GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,面向企业用户开放内测。
4月10日,商汤科技发布了大模型体系“日日新SenseNova”以及一系列自研生成式AI应用,包括AI文生图创作平台“秒画”、AI数字人视频生成平台“如影”、3D内容生成平台“琼宇”等。
4月11日,阿里发布通义大模型,阿里巴巴集团董事会主席兼首席执行官张勇表示,未来阿里巴巴所有的产品都将接入通义千问大模型。4月13日,知乎首个大语言模型“知海图AI”开启内测。4月17日,昆仑万维与奇点智源联合研发的大语言模型“天工”正式邀请测试,声称对标ChatGPT。4月20日,出门问问宣布内测自研大模型“序列猴子”。
此外,创业团队“纷至沓来”,大模型都在加紧研发当中。4月10日,搜狗创始人王小川正式宣布自主创业,与前搜狗COO茹立云创立人工智能公司“百川智能”,进入AI大模型赛道,致力于打造中国版的OpenAI。4月14日,继腾讯、阿里之后,小米集团创始人雷军也在微博透露小米正在研发相关产品。4月20日,科大讯飞宣布AI大模型产品名为“讯飞星火”,并且预告将于5月6日正式发布讯飞星火大模型。此外据媒体报道,字节跳动也在语言和图像大模型上有所布局,预期将于今年年中推出字节自研大模型。
南都记者统计,截至目前已有30多款大模型涌现,但有业内人士向南都记者指出,实际上参与研发大模型的企业数量已经超过60家,一场“百模大战”正在紧锣密鼓进行中。与此同时,在ChatGPT热度的带动之下,出现了大量AIGC概念股公司,其主营业务与大模型并无密切关联,却因为声称计划接入大模型而出现股价暴涨。
太多蹭热点,泡沫有几成
“任何一个新概念刚出来的时候,一定会有很多人去蹭概念、蹭热点。主要是体现在上市公司,为了短期提振股价,像区块链、5G出现的时候也会有相关的概念股,这其中必然存在泡沫,但大部分的企业还是真刀真枪地投入到大模型的研发里的。”知名数字经济学者刘兴亮向南都记者指出。
“ChatGPT的出圈让OpenAI站到了聚光灯下,然后快速传递到中国,尤其二级市场。现在跟炒股的人聊,没有人不知道AI,没有人不炒AI。这件事情肯定阶段性是有泡泡的,但如果拉长周期去看的话,一个好的技术浪潮里面,优秀的人、好的资本大量进入,这是合乎常理的”,君联资本投资总监杜迪康向南都记者表示,当前的AI热谈不上泡沫,只能说短期大家对于AI大模型的价值实现以及价格层面上的期待显得过高。
“泡沫这个词针对商业多一点,从技术角度来讲,我认为现在是大模型发展的必然阶段。”华为云云原生首席架构师刘赫伟向南都记者表示,“国内企业对于大模型的研发也有很多年了,只不过因为一些突发性的事件,把它带到了普通人的面前,然后驱动了大量的商业行为出现,包括投资、股市等,但我个人从技术角度非常看好大模型的应用未来。”
“每一波技术浪潮里总有一些是真正的英雄,也有一些是陪跑,今天的市场暂时还无法下结论,所有的大模型都还在路上,没有一家能真正面向市场并且经得起公众规模化的试点。”杜迪康称,AI大模型的成熟需要时间周期,绝不是仅仅今天喊个口号或者花钱就能解决的,但当前大家积极参与大模型的热情对产业链、对行业长期的价值而言都是有利的。
技术
算力、算法有待突破
业内普遍认为,算力、算法和数据是一款大模型研发的三大核心要素,缺一不可。对于中小型创业团队来说,想要兼顾三者并不容易。
“我们可以把AIGC拆分成三层来看,第一层就是算力,芯片厂商英伟达是最大赢家,同时华为以及国内的其他友商也在做一些芯片,都是在算力层面布局。第二层是基础设施,包括的不仅仅是芯片,还有存储数据、传输网络、操作系统等,需要提供给AI算法工程师使用的软硬件基础设施。第三层是应用,里面最重要的是数据,面对不同的应用场景,数据集肯定是不一样的,AI离开数据是没有办法运转的。”刘赫伟称,ChatGPT背后的OpenAI在这三个层面都具有很强的能力,放眼国内的众多大模型企业中,能够从头到尾把三层全部做好的寥寥无几。
“大模型行业跟芯片截然不同,算力、算法、数据作为大模型今天的三要素,如果逐一去解构它的话,你会发现中国企业现阶段在训练大模型这件事情上是绝对够用的”,杜迪康称,这也是大量企业涌入大模型赛道的原因,“只要有足够多的钱,理论上大模型的三要素是可以逐一攻克的。”
在算力层面,目前从头部互联网企业到人工智能公司都在积极筹备,大模型的算力需求也让国内云计算市场重新活跃了起来。
4月14日,腾讯云正式发布新一代高性能计算集群,算力性能和上一代相比提升3倍,服务器接入带宽从1.6T提升到3.2T,是目前国内性能最强的大模型计算集群。
4月18日,字节跳动发布大模型训练云平台,包括自研DPU等系列云产品,推出新版机器学习平台,支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本,主要为大模型公司提供算力支撑等服务。火山引擎总裁谭待在接受采访中说,中国国内大模型领域的数十家企业,超过七成已经在火山引擎云上,与其他云厂商力推自家大模型不同的是,火山引擎将为多家大模型公司提供算力等技术服务,“就像微软和OpenAI、亚马逊和Bedrock的关系一样,火山引擎自己不做大模型,而是服务大模型客户”。据介绍,火山引擎的大模型合作伙伴包括AI技术公司MiniMax、智谱AI、昆仑万维等。其中智谱AI的GLM预训练模型参数达到1300亿,昆仑万维的大语言模型“天工”也在千亿级别。
4月19日,云知声智能科技股份有限公司与优刻得科技股份有限公司达成了战略合作,联合打造融合AIGC、算力、存储等软硬件功能的私有化智能算力平台。
谁能笑到最后
“算法层面是底层架构和训练方式,大家的路径都比较统一,核心的难点就在于工程侧。相当于把一个技术底层的模型变成了一个能在C端用的产品,这个过程中有大量的工程化的东西要去优化,这是难点和考验,需要时间去打磨。”杜迪康指出。如针对一个问题聊天机器人可能会给出三个答案,其中哪一个更符合人类的逻辑,需要有人去做标记和优化,要经过大量的标记和优化,才能让它更加适配人类的语言习惯。
的确,“一本正经地胡说八道”仍是各家聊天机器人的通病。如南都记者就上海市近五年的GDP数据询问百度文心一言、阿里通义千问、ChatGLM以及科大讯飞的“讯飞星火”,各家给出的信息均有错漏。
出门问问创始人李志飞在发布会上也指出,当前的大模型需要降低胡说八道的概率,目前这种情况是不可能杜绝的,只能在训练中降低。李志飞认为,当前的大模型有待解决的问题还有,“大模型需要结合个性化的数据回答问题。当前中国市场现有的大模型都是偏通用的大模型,在对话中回答的问题并不能完全准确到个人情况,这是有待优化的地方。最后,需要增强大模型的上下文记忆能力,只有上下文推理和关联能力增强了,用户才能真正产生一种对话感。”
在刘赫伟看来,在这波AI混战中,有实力布局三个层面的一定是巨头型企业,同时也会出现聚焦于其中一个层面的龙头企业,未来绝大部分的公司应该都会选择聚焦在应用层面。
刘兴亮同样认为大模型会迎来井喷式爆发,但最终能留存下来的通用大模型只会有2-3家,“通用大模型能留存下来的最多只有三家。但会有很多专业的模型应用于医药、办公等不同的行业场景,未来我们会有不同的AI助理、AI医生、AI家教等角色。”
杜迪康则认为,“通用大模型可能不止三五家,比如云竞争到现在为止也还有10家左右,AI可能也是这样的,目前还不好做评价,但可以明确的是行业应用的模型一定会百花齐放,AI最终会各有所长,不会是万能的。”
应用
办公成C端落地“第一站”
通用大模型能留存几家目前尚无定论,但大模型终将走向行业应用已成为共识。大模型如何落地应用也是各行各业都在关注度的话题。
在C端应用,百度“文心一言”、阿里的“通义千问”、商汤“商量”以及复旦大学研发的大模型MOSS都是对话式语言类的大模型产品,但截至目前都未开放使用。
除了聊天机器人之外,办公场景成为国内大模型落地应用的“第一站”。4月18日,自阿里巴巴宣布所有产品接入通义千问大模型之后,钉钉总裁叶军在春季钉峰会上宣布钉钉正式接入通义千问大模型,展示了钉钉输入斜杠“/”能够整理群聊要点、生成海报、会议助理等多项功能。同一天,办公软件金山WPS也发布了“WPS AI”,主要在AIGC、阅读理解和问答、基于自然语言的人机交互三个方向持续发展。此外,飞书也预告了新产品My AI,可以总结会议纪要、创建待办事项、创建报告、自动续写、创建日程等,官方暂无透露具体推出日期。
在电商场景之下,梦饷科技(爱库存)近期宣布将加大AI应用,通过GPT大模型重构业务场景。梦饷科技CTO曹均涛介绍,其内部成立了X实验室,专门研究创新技术和业务结合,目前可以通过人工智能技术实现模特图片生成、素材差异化、服装秀、AI创作助手、聊天室导购等。“生成式人工智能来了之后,我们觉得首先会带来流量入口的变化,我们需要提前去适应和拥抱这些变化”,曹均涛向南都记者表示,这是梦饷科技加速研发“聊天式购物”场景的原因,预计未来聊天框成为一站式入口,让AI精准识别用户意图,通过多轮对话交互实现售前商品推荐、售中订单查询、售后处理等。
在走向落地的过程中,监管是各家必须面对的问题。“客观讲AI是一个黑盒,或者说炼丹炉,生成的结果比UGC难控制,对生成内容进行合规审查是必要的。”钉钉总裁叶军称,目前,钉钉与大模型融合场景正在测试中,具体功能将在相关安全评估完成后上线。
B端应用前景更广泛
大模型在B端的应用场景则更为广泛。4月26日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在阿里云合作伙伴大会上透露,已有超过20万企业用户申请接入千问测试,企业专属大模型的合作需求十分火爆,几乎覆盖所有新兴和传统行业。之前,华为任正非在近期座谈会中提到,“未来在AI大模型上会风起云涌,不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进,AI服务普及需要5G的连接。”任正非表示,大家要关注应用,尤其是工业、农业社会的应用,模型的应用有时比模型本身还有前途。
此外,4月21日智谱AI大模型宣布落地SaaS行业,与电子签约SaaS提供商上上签合作打造电子签约首款生成式AI产品“Hubble哈勃”。据介绍,这是电子签约行业首款应用了大模型技术的生成式AI产品,可在用户授权下,通过连续对话实现对电子签约合同的检索,执行概况解读、重点识别、筛选标识、分类归纳等相关功能。智谱AI CEO张鹏介绍,智谱AI由清华大学的技术成果转化而来,拥有超过25年的人工智能技术积累。在AI大模型方面,智谱AI提出了Model as a Service(MaaS,模型即服务)的市场理念,也建立了拥有完全自主知识产权的大模型。
在教育行业同样迎来AI新品的密集发布。5月5日网易有道官方发布了基于“子曰”大模型开发的AI口语老师剧透视频。根据视频内容,网易有道AI口语老师能提供多种练习场景,同时会根据用户需求扮演多种角色,进而引导用户进行多轮对话。对话过程中,AI口语老师也展示出了一定推理能力、语言能力和情感能力。同一天,学而思宣布正在进行自研数学大模型的研发,命名为“MathGPT”,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。学而思表示,希望通过MathGPT弥补和攻克大语言模型的三个问题:第一,题目要解对,现在GPT结果经常出现错误;第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲得有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。
何种场景最难?
对比AI大模型在C端落地和B端落地的两条路径,业内人士普遍认为C端产品难度更大。“首先,因为C端产品的成本更高,用户使用规模大。”刘兴亮解释道,“其次,一旦涉及到C端,它的场景太复杂,而且问题会很多元。不像to B的就是一个解决的场景。”
“AI大模型在C端和B端的落地应用各有各的难点,如果一定做对比的话我倾向于面向C端的难度会更大一点,因为在没有流量红利的情况下,要想把产品做起来,只有一种可能性,就是用(优于同行)10倍的效率和10倍的产品,只有拿出跨世纪的产品,才有可能在获客成本上算得过来账。而今天你去做to B的话,不需要10倍的产品,企业都会来找你,因为他们都看到了技术变革,都在焦虑。”杜迪康指出,B端可以搭建一个繁荣的生态伙伴,赋能所有行业,也可以选择切入垂类行业,包袱和成本相对巨头会更小一些。
出品:南都政商数据新闻部、上海新闻部
采写:南都记者 马宁宁 实习生 叶羽洁