‌·

以“智”向“新”趣丸科技探路AI交互技术产业化落地

来源:南方都市报     2024年06月28日        版次:EA16    作者:徐劲聪 彭乐怡 马青

  数智人终端一体机展示。

  2D数智人风格化拍照展示。

  3D手办产品展示。

  AI大模型、智能驾驶、低空经济,创新催生出的新产业、新模式、新动能,也正助力大湾区“新”潮澎湃。拥抱新质生产力,大湾区正铆足干劲、向“新”而行。

  在大湾区拥抱新质生产力背后,离不开科技企业对前沿创新领域的持续研发和投入。当前,随着《广东省关于人工智能赋能千行百业的若干措施》等政策印发,广东加快推进人工智能产业化应用落地。以“数智人”为代表的人工智能技术应用逐渐从线上走到线下,带来更多领域生产力提升。

  “数智人”正加快走进生活 

  近期正值各大电商平台购物节期间,一些常爱看直播购物的“资深网购爱好者”们发现,深夜时分,仍有一些直播间始终保持开播状态,“带货主播”更是妆容精致、声音饱满、活力满满。

  原来,在这些“业务娴熟”“精力充沛”的主播背后,可能并不是真人主播,而是基于人工智能技术的“数智人”在提供服务。

  当前,随着AIGC技术热潮推动,“数智人”已不仅在直播领域,而是加快步伐走入城市生活的方方面面,快速走向产业化落地。艾媒咨询数据显示,2023年中国“数智人”带动的产业市场规模和核心市场规模分别为3334.7亿元和205.2亿元,预计2025年分别达到6402.7亿元和480.6亿元。

  今年以来,持续推动高水平对外开放取得显著进展。在5月举办的第135届广交会期间,共有来自215个国家和地区的24.6万名境外采购商线下参会,比上届增长24.5%,境外采购商到会人数创历史新高。而在广交会展馆之中,来自趣丸科技等公司研发的“数智人”,“精通多国语言”以对话为来往客商提供快速直观的指引、问答等服务,给参会采购商们留下了深刻印象。

  不仅在广交会这个各国客商集中来华场合,据了解,当前国内多地出入境大厅都有“数智人”上岗,并随着外籍人员来华持续火热,需求不断增加。据趣丸科技副总裁兼人工智能研究中心主任张顺四介绍,相比很难培训出一位熟练掌握多国语言的对外服务人员,基于人工智能底层技术的“数智人”可以轻松“掌握”各种语言并与外籍游客进行对话交流,其背后丰富的“知识库”也能让刚进入中国的外籍游客能够通过直观的对话,快速了解方方面面所需。  

  抢抓AIGC机遇,广东推动人工智能赋能千行百业  

  今年的政府工作报告中提出,大力推进现代化产业体系建设,加快发展新质生产力。科技创新能够催生新产业、新模式、新动能,是发展新质生产力的核心要素。加快科技创新成果转化为现实生产力,是形成新质生产力的必由之路。

  抢抓AIGC机遇,广东走在前列。今年6月6日,《广东省关于人工智能赋能千行百业的若干措施》发布,提出到2025年,全省人工智能核心产业规模超过3000亿元的目标蓝图。“AI+”与实体经济的融合,是先进生产力和行业的结合,既能提高各行业效率,也为人工智能产业发展创造巨大市场空间。

  “数智人”是当前人工智能技术赋能千行百业的主流应用之一,随着对“数智人”技术研发的不断进步,目前已逐步应用于直播电商、展厅导览、教育科普、智能客服等业务场景,直接辐射万亿级市场规模。

  例如,趣丸科技为中国电信营业厅打造的数智人“小信”,其形象、语音、动作真实度高达97%,融合了实时智能识别、智能对话、智能感知、智能生成等多项人工智能核心技术,让“数智人”富有拟人化、情感化。在中国电信营业厅,数智人“小信”可通过实时语音对话,智能引导用户完成买手机、办宽带、交话费等“一站式”的业务咨询及服务办理,且可以实现多终端互联操作。数智人“小信”可持续进行知识学习和进化迭代,提升智慧化服务能力。

  “数智人”还可深入赋能政务、教育、文旅等场景。帮助政务机关打造数智员工,实现政务办事流程的自动化,数智员工可在移动端、一体机等设备商为市民提供24小时的政务咨询、政务自助办理等服务,大大提升办事效率,便民利民。帮助教师实现教学视频内容智能化制作、智能互动答疑或带来一对一交互式教学,大幅降低了教师人力成本,在创新教学模式的同时加速推进行业智慧化升级。帮助历史人物数智化复原或为景点、博物馆等打造数智代言人,为游客提供讲解、导览、咨询等服务。

  携手湾区高校共研“智”动力

  人工智能也要练出“好口才”“创造力”  

  从电商直播间的带货主播“数智人”,到广交会、电信营业厅等线下场景与人面对面“沟通”,基于人工智能技术的“数智人”如何能在不同应用场景条件下发挥出相比真人的优势,背后离不开持续的研发投入和技术创新。

  “目前人工智能技术已是公司投入最大的板块,我们希望基于公司过去在C端领域常年耕耘的积累,赋能新质生产力。”张顺四介绍,趣丸科技研发人员占比超60%,2020年至2023年上半年,公司累计研发投入超12亿元,连续多年保持两位数增长。当前,趣丸科技已构建全栈式AI交互技术产业生态,聚焦生成式3D大模型、生成式音频大模型、生成式动作大模型与对话大模型开展技术自研和规模化落地。

  其中,“数智人”应用解决方案集成人工智能六大技术能力,可一键生成与真人面部相似度达到90%以上的高自然度虚拟数智人,拥有表情、声音、肢体驱动等多模态交互能力,并能提供直播场景搭建、“数智人”直播等环节一站式生成制作。极大程度解决了传统“数智人”制作周期长、成本高、交互性差等问题。

  在公司内部持续投入研发的同时,趣丸科技也与粤港澳大湾区的一流智力资源携手合作。其与香港科技大学(广州)共建人工智能联合实验室,联合培养高端技术人才,围绕多模态AIGC与智能三维生成等前沿技术进行多层级研究和成果落地。与香港中文大学(深圳)共建人工智能联合实验室,聚焦语音大模型相关前沿课题研究与商业转化。

  深入赋能千行百业应用,都需要“数智人”拥有一副“好口才”,这离不开背后的AI音频生成技术。据了解,当前的AI音频生成技术虽能模仿与人声相似度极高的音色,但在情绪、情感、语调等方面表现不足,仍有不少技术难点亟待突破。

  趣丸科技与港中大(深圳)强强联手,发挥各自优势成立联合实验室,围绕支持跨语种、多方言的语音克隆和翻译等技术,以低成本、高效率形式,生成具备高自然度音色、韵律、情绪的可编辑音频,打造业界领先的生成式音频大模型,推动具有国际影响力的创新成果转化。

  趣丸科技与香港科技大学(广州)共建人工智能实验室,围绕多模态AIGC与智能三维生成等前沿技术进行多层级研究,赋予人工智能更强“创造力”。双方共同研发通用三维生成平台,支持文字、图片、视频等多模态输入,可根据不同需求生成可编辑三维人体、物体、场景模型,具有低成本、生成质量高等优势。

  据张顺四介绍,双方的合作成果已有3D手办等制造场景落地,仅需单张照片,即可完成多种风格手办打印,精美的同时具备高相似度。未来,将高效赋能3D打印、数智孪生、工业制造及智能家居等领域,让人工智能技术进一步深入真实世界,撬动广东新质生产力持续迸发。  

手机看报
分享到:
返回奥一网 意见反馈