‌·

全国政协委员赵晓光:具身智能数据采集工厂遍地开花

具身智能数据交易可避免重复投入

来源：南方都市报 2026年03月09日版次：GA07 作者：杨柳

　　全国政协委员赵晓光。

　　人形机器人干活能力不够，瓶颈出在能用于具身智能模型训练的数据紧缺。针对这一痛点，地方层面纷纷搭建起具身智能数据采集中心，作为拥抱产业新热潮的切入点。一些企业自建数据采集场。但有全国政协委员提醒，不可忽视数采工厂的重复建设隐患。

　　全国政协委员、中国科学院自动化所研究员赵晓光深耕机器人领域。2026年全国两会前夕，她告诉南都记者，对于相同的应用场景，不同企业各自为训练模型而独立开展数据采集项目，便不可避免地造成重复投入。“这导致了数据利用率不高。”应当规避数采工厂的重复建设问题。

　　数采中心遍地开花　　

　　据南都记者不完全梳理，包括北京石景山、四川自贡、广西柳州、广西防城港、江西九江、江苏无锡、湖北武汉、浙江绍兴、河南郑州等地，均已成立具身智能数据采集中心。

　　数据采集的主流方式通常分为真机数据和仿真合成数据。尽管部分企业重押仿真数据，但多数企业仍将真机数据列为首选。赵晓光表示，应当规避数采工厂的重复建设问题。以面向居家养老场景的服务机器人为例，这类机器人通常需要完成给老人喂饭、搀扶老人下床等特定任务。尽管这些任务在不同养老机构中高度相似，但由于参与研发的企业不同，各自就会为训练模型而各自独立开展数据采集项目，便不可避免地造成重复投入。

　　“这导致了数据利用率不高。”赵晓光介绍，真实场景下的数据采集成本高。

　　即使复用性问题得到缓解，对外共享采集的数据依然会面临其他商业层面的障碍。

　　推进工业场景的落地实践中，机器人公司往往寻求和汽车工厂等场景方合作，在真实产线训练机器人，积累相应的数据。

　　赵晓光表示，这些特定产线上的数据可能涉及场景方的商业秘密，如果对外共享，“无疑是把自己的生命线拿出来了”。而且，数据也是具身智能公司的“护城河”，开源出来可能让竞争对手“吃到免费午餐”。

　　这引发了数据采集与利用的一大矛盾:数据是企业核心壁垒，难以共享；如果不共享，又可能带来重复投入。

　　鉴于企业无法无偿共享数据，赵晓光设想，这需要通过顶层设计，用交易的方式推动具身智能数据在市场上流通。同时，对数据集产品中涉及企业商业秘密的部分进行脱敏或加密处理。

　　单个企业无法独占市场“蛋糕”　　

　　在具身智能数据和模型能力受限的当下，人形机器人的受众市场仍集中在文娱表演领域。据市场调研机构IDC于1月下旬发布的一份报告，2025年全球人形机器人的应用场景中，文娱商演占比最高，达到36.8%，工业制造仅有9.2%。

　　2026年央视春晚成为又一个人形机器人的秀场，并引发机器人浓度太高的调侃。在赵晓光看来，这类表演实则代表着机器人性能的不断提升。机器人在春晚上的演出看似为了娱乐，但厂商展示出的机器人稳定性、运动控制能力等，其实是机器人未来步入实际作业场景和家庭场景所需的基础能力。

　　在商业化落地推进的关口，大批具身智能公司已完成集结。根据工信部的数据，2025年国内人形机器人整机企业数量超140家，发布人形机器人产品超330款。

　　针对这一背景，市场上出现了关于具身智能赛道产品同质化的声音。不过，赵晓光认为，产品同质化不可避免，但具身智能未来的市场规模相当可观，一家企业吞不下这么大的“蛋糕”，即使是类似的产品依然能找到需求空间。　　

　　具身智能人才缺口约百万　　

　　人才是企业进行市场竞争的基石。招聘平台脉脉于2025年12月发布《2025年度人才迁徙报告》显示，2025年1-10月，机器算法列新发岗位量增幅的第三位。融资充沛的企业用高额薪资争抢人才。

　　作为科研院校的研究者，赵晓光发现，具身智能机器人行业的人才缺口目前很大，这是一个全球范围内的共性问题。由于行业爆发时间较短，许多高校也是近两年才新设具身智能专业。

　　教育部官网2025年11月发布的公告显示，北京航空航天大学等7所高校申请增设“具身智能”新专业。北京理工大学在提交的专业设置申报表中提到，具身智能行业正面临着严峻的复合型技术人才短缺问题，形成“高薪觅才”与“人才难匹配”并存的局面。根据调研，当前各行业和单位具身智能人才缺口约100万。

　　赵晓光预计，未来三至五年左右，具身智能人才紧缺的问题有望得到一定程度缓解。但人才的培养过程是一个漫长的过程，从能上手到成为高手，可能得磨炼十年以上的时间。

　　采写:南都记者杨柳发自北京

　　受访者供图

scroll

分享到：

返回奥一网意见反馈