‌·

全国政协委员赵晓光:具身智能数据采集工厂遍地开花

具身智能数据交易可避免重复投入

来源:南方都市报     2026年03月09日        版次:GA07    作者:杨柳

  全国政协委员赵晓光。

  人形机器人干活能力不够,瓶颈出在能用于具身智能模型训练的数据紧缺。针对这一痛点,地方层面纷纷搭建起具身智能数据采集中心,作为拥抱产业新热潮的切入点。一些企业自建数据采集场。但有全国政协委员提醒,不可忽视数采工厂的重复建设隐患。

  全国政协委员、中国科学院自动化所研究员赵晓光深耕机器人领域。2026年全国两会前夕,她告诉南都记者,对于相同的应用场景,不同企业各自为训练模型而独立开展数据采集项目,便不可避免地造成重复投入。“这导致了数据利用率不高。”应当规避数采工厂的重复建设问题。

  数采中心遍地开花  

  据南都记者不完全梳理,包括北京石景山、四川自贡、广西柳州、广西防城港、江西九江、江苏无锡、湖北武汉、浙江绍兴、河南郑州等地,均已成立具身智能数据采集中心。

  数据采集的主流方式通常分为真机数据和仿真合成数据。尽管部分企业重押仿真数据,但多数企业仍将真机数据列为首选。赵晓光表示,应当规避数采工厂的重复建设问题。以面向居家养老场景的服务机器人为例,这类机器人通常需要完成给老人喂饭、搀扶老人下床等特定任务。尽管这些任务在不同养老机构中高度相似,但由于参与研发的企业不同,各自就会为训练模型而各自独立开展数据采集项目,便不可避免地造成重复投入。

  “这导致了数据利用率不高。”赵晓光介绍,真实场景下的数据采集成本高。

  即使复用性问题得到缓解,对外共享采集的数据依然会面临其他商业层面的障碍。

  推进工业场景的落地实践中,机器人公司往往寻求和汽车工厂等场景方合作,在真实产线训练机器人,积累相应的数据。

  赵晓光表示,这些特定产线上的数据可能涉及场景方的商业秘密,如果对外共享,“无疑是把自己的生命线拿出来了”。而且,数据也是具身智能公司的“护城河”,开源出来可能让竞争对手“吃到免费午餐”。

  这引发了数据采集与利用的一大矛盾:数据是企业核心壁垒,难以共享;如果不共享,又可能带来重复投入。

  鉴于企业无法无偿共享数据,赵晓光设想,这需要通过顶层设计,用交易的方式推动具身智能数据在市场上流通。同时,对数据集产品中涉及企业商业秘密的部分进行脱敏或加密处理。

  单个企业无法独占市场“蛋糕”  

  在具身智能数据和模型能力受限的当下,人形机器人的受众市场仍集中在文娱表演领域。据市场调研机构IDC于1月下旬发布的一份报告,2025年全球人形机器人的应用场景中,文娱商演占比最高,达到36.8%,工业制造仅有9.2%。

  2026年央视春晚成为又一个人形机器人的秀场,并引发机器人浓度太高的调侃。在赵晓光看来,这类表演实则代表着机器人性能的不断提升。机器人在春晚上的演出看似为了娱乐,但厂商展示出的机器人稳定性、运动控制能力等,其实是机器人未来步入实际作业场景和家庭场景所需的基础能力。

  在商业化落地推进的关口,大批具身智能公司已完成集结。根据工信部的数据,2025年国内人形机器人整机企业数量超140家,发布人形机器人产品超330款。

  针对这一背景,市场上出现了关于具身智能赛道产品同质化的声音。不过,赵晓光认为,产品同质化不可避免,但具身智能未来的市场规模相当可观,一家企业吞不下这么大的“蛋糕”,即使是类似的产品依然能找到需求空间。  

  具身智能人才缺口约百万  

  人才是企业进行市场竞争的基石。招聘平台脉脉于2025年12月发布《2025年度人才迁徙报告》显示,2025年1-10月,机器算法列新发岗位量增幅的第三位。融资充沛的企业用高额薪资争抢人才。

  作为科研院校的研究者,赵晓光发现,具身智能机器人行业的人才缺口目前很大,这是一个全球范围内的共性问题。由于行业爆发时间较短,许多高校也是近两年才新设具身智能专业。

  教育部官网2025年11月发布的公告显示,北京航空航天大学等7所高校申请增设“具身智能”新专业。北京理工大学在提交的专业设置申报表中提到,具身智能行业正面临着严峻的复合型技术人才短缺问题,形成“高薪觅才”与“人才难匹配”并存的局面。根据调研,当前各行业和单位具身智能人才缺口约100万。

  赵晓光预计,未来三至五年左右,具身智能人才紧缺的问题有望得到一定程度缓解。但人才的培养过程是一个漫长的过程,从能上手到成为高手,可能得磨炼十年以上的时间。

  采写:南都记者 杨柳 发自北京

  受访者供图


手机看报
分享到:
返回奥一网 意见反馈