人物简介 王琼 武汉大学新闻与传播学院副教授、武大镝次元数据新闻研究中心主任、武大媒体发展研究中心研究员、武汉镝次元数据科技有限公司创始人。珞珈青年学者,武汉大学青年学术研究团队“中国数据新闻发展研究”带头人,Temple University 访问学者。主要研究领域包括数据新闻、融媒体、视觉传播等。曾获谷歌全球数字媒体创新大赛亚洲区特别提名奖,“湖北省高校科技人员创新创业大赛”一等奖等。
专访为节选内容 更多详情请扫码阅读
数据交易是数据要素市场建构的关键一环,而通过构建数据交易平台的模式推动数据交易与数据流通,已经成为各地数据要素市场建设的重要政策。只是观察现有各地的实践探索,通过数据交易所进行的交易仍然面临重重困难。数据交易能否超越基于数据的服务,成为基于数据产品本身的商品交易?如何培育多样化数据供需市场以及交易场景?为此,南都大数据研究院数字政府研究中心专访了武汉大学新闻与传播学院副教授、武汉镝次元数据科技有限公司创始人王琼。
A
已进入更精细化的数据产品交易阶段
南都:目前数据交易迎来热潮,据你了解,国内数据交易市场发展现状如何?主要有哪些类型?
王琼:数据交易今天是一个热词,但并非新词。2012年是中国“大数据元年”。2015年,以贵阳大数据交易所为代表的国家首批大数据交易中心开始出现,随后出现了一些商业化的数据交易平台,如京东万象、聚合数据等。关于数据交易市场的分类,根据不同维度,按主体属性分,可以分为政府类、商业类;按照交易内容和方式可以分为原始数据类、统计数据类、数据服务类、API类等。
纵观这10年来的数据交易情况,大体交易方式分为三个阶段:其一,原始数据交易阶段。当时数据交易的方式非常原始和粗放,例如,可以有邮寄硬盘、光盘的方式交易数据。主要问题在于数据可能存在质量低、安全风险、隐私风险、伦理风险等问题,且数据应用的技术成本很高,一般机构不一定有能力应用。
其二,数据接口交易阶段。数据以API方式按需调取、付费。其优点是数据经过处理,质量与安全性都更高,但依然需要具备一定的技术能力才能应用。
其三,数据产品交易阶段。我们认为当前中国的数据交易市场已经进入更为精细化的数据产品交易阶段。数据可以被加工成能够被普通个人应用的商品和服务形式,我们镝数聚的产品理念也正是如此。既然数据是“石油”,数据时代的每一位公民都应该有机会参与、享有其红利,应该让获取数据好像打开自来水龙头一样简单轻松。
南都:政府类数据交易场所、数据服务商等数据交易平台各有什么优势?随着数据应用更精细化,您认为哪些数据更符合市场需求?
王琼:政府类数据交易场所的主要优势包括:权威性、合规性的背书;大量独家数据资源;市场化数据服务商主要优势包括:更敏捷的基于用户需求的产品化能力;更灵活的商业化做法。
我认为未来两者将会形成配合。政府数据交易场所将会为数据流通市场带来更多“原材料”,数据服务商可以基于这些原材料生产加工离用户更近、更易用的数据商品,并形成更为丰富灵活的交易模式。
B
需要制定规则明确数据可交易内容边界
南都:目前数据交易市场是需求大于供给,高质量数据主要集中在政府部门、头部互联网平台以及金融机构等主体手里,如何培育多样化的数据供需市场以及交易场景?
王琼:数据质量的高低,应由“用户”来定义,而不是供给方。因此,看起来连续性高、体量大、纬度丰富的数据,并不天然具备对于用户的“高质量”。众所周知,大数据都是高噪音的。未经脱敏、除噪、清洗等处理的数据,对于用户来说不仅不是高质量数据,反而是危险的数据、麻烦的数据、无用的数据。
要培养多元化的数据供需市场、交易市场,首先需要制定规则,明确数据可交易的内容边界,系统性防控因市场经济行为引发的社会风险。其次,应充分激发市场主体的积极性,通过系列产业扶持政策与市场激励的做法,鼓励市场主体的丰富性、多元化,大力促进政企合作。最后,应通过一系列做法,由用户需求驱动,深化数据应用的场景化、精细化发展。
南都:数据交易面临哪些新难题?需要怎样突破数据交易涉及的确权难、定价难、监管难等核心瓶颈?
王琼:数据交易一直面临安全性、伦理、知识产权等问题。如果交易的是原始数据(即便经过脱敏处理后的数据),其确权、定价、监管可能是短期内无法彻底解决的瓶颈问题,只能有待法律法规的逐步完善、技术手段的加强和市场供需的驱动。如果交易的不是原始数据,而是知识化、成果化的数据,也就是在合规的原始数据基础上明确附加智力投入的,有著作权、知识产权的数据内容产品,则其定价、监管、确权的问题就相对明确。
C
提升数据供给质量 需以用户视角驱动
南都:数据交易关键是对数据质量的要求,国内数据交易平台发展多年,但缺乏高质量的数据供给是重要拖累因素。你认为要如何提升数据供给的质量,有什么好建议?
王琼:提升数据供给质量依然需要以用户视角来驱动。不同交易平台应有相对明确,最好是精准的用户画像。越贴近用户需求的数据,对用户来说质量越高。从数据底层来说,数据一手来源方应提高数据的数字化搜集、存储、标签化等处理过程以及处理结果的质量。
近年来,我国不断完善数据治理标准规范,出台了《政务信息资源共享管理暂行办法》等政策提升政务数据质量,发布了国家标准《数据管理能力成熟度评估模型》,帮助企业评价、提升自身数据管理能力。这些都是在持续建设数据的底层能力。面向数据行业,应加强“可开放数据”的共享、合作、创新,鼓励多方、多元深化合作;面向用户侧,应通过用户调研充分了解用户需求,分阶段、分领域、分重点地进行数据产品化。
南都:作为数据服务商,如何利用多年沉淀的数据治理及数据服务能力,更深入赋能数字政府建设,助力城市数字化转型?
王琼:数据浩如烟海,每一家数据服务商都只能在有限领域发挥价值。近年来,在各垂类领域,国内外出现很多优秀垂类数据服务机构。以镝数聚来说,它是一个全行业数据内容平台,虽然涉及16大类121个行业,但主要是经过脱敏加工处理后的数据,包括统计小数据、数据报告、数据图表、数据集等,并不提供原始数据、API数据、舆情大数据、动态数据的服务。镝数聚有数据来源8000多个,而跟我们类似的海外数据平台statista,数据来源超过2.5万。这些数据源中除部分为各类开放数据平台外,多数均为各领域专业数据服务机构。
因此,作为数据服务商能做的,也应做的是专注做好自己的产品,为用户提供优质服务。同时,政府主导部门应充分链接、调用这些社会资源,为用户提供“分布式”联合服务。其背后逻辑是,用户大量需求是复杂的、多层次的、并发的,不是任何单一平台或机构有能力充分服务的;这些资源、服务需要协同和配置到用户的生产生活中,这也不是任何单一主体能够做到的。
出品:南都大数据研究院 数字政府研究中心 统筹:邹莹 研究员:袁炯贤