‌·

三大维度分析北上广等8个重点城市政府数据开放平台“数据质效”

成都平台逾五成数据集零下载 贵阳实时更新数据集部门最少

来源:南方都市报     2020年06月30日        版次:GA16    作者:袁炯贤

扫码阅读更多报道

数据被纳入生产要素,表明社会对政府数据开放已成普遍共识。很多省市政策明确建设政府数据统一开放平台,强化数据资源的汇聚、应用,是连接数据供给侧、利用端的通道,开放和获取数据的载体,传播资讯动态的渠道,展示利用成果的平台。南都大数据研究院继分析36个重点城市“数据开放”文件的完备度、精细度之后,此次从数据覆盖广度、数据更新速度、数据利用效度三大维度,比照分析北京、上海、广州等8个城市政府数据开放平台的“数据质效”。结果发现,北京、广州、济南平台数据集覆盖部门较多;青岛、上海实时更新数据集较多;成都市公共数据开放平台数据集下载转化率(下载量/访问量)超八成,但零下载数据集占比也达52.9%;深圳平台数据集下载转化率仅3%;贵阳所有数据集均有被下载记录,广州只有0.1%数据集未曾被下载。

北京平台近七成数据集属定向开放

梳理发现,目前北京市政务数据资源网显示开放的数据集4539项,但普通公众实际能下载利用的仅1424项,其余68.7%属于定向开放。与之相比,上海市公共数据开放平台有3643项数据集,其中71.2%无条件开放,28.8%有条件开放。广州市政府数据统一开放平台、贵阳市政府数据开放平台、青岛市公共数据开放网数据集全部无条件开放,成都市公共数据开放平台、济南市公共数据开放网无条件开放数据集也超过99%。

开放多个主题领域的数据集不仅有利于提高数据开放广度与覆盖面,还有利于数据利用者获取来自多个领域的数据集进行融合利用。2018年中央网信办、国家发改委、工信部联合印发的《公共信息资源开放试点工作方案》提到,“重点开放信用服务、医疗卫生、社保就业、公共安全、城建住房、交通运输、教育文化、科技创新、资源能源、生态环境、工业农业、商贸流通、财税金融、安全生产、市场监管、社会救助、法律服务、生活服务、气象服务、地理空间、机构团体等领域的公共信息资源”。

南都大数据研究院梳理发现,北京、上海、广州等8市数据开放平台数据集主题、领域划分略有差异,有的平台主题按上述标准,有的是领域分布以此为框架。开放数据集涵盖主题领域最多的是青岛市公共数据开放网,共22个,深圳、贵阳开放数据集涵盖行业较多。具体而言,北京、上海开放的数据集主题领域最多的是“经济建设”,而济南、青岛开放数据集主题领域占比最大的是“社会保障”。此前,由复旦大学、国家信息中心数字中国研究院编制的《中国地方政府数据开放报告(2019年下半年)》提到,全国各地开放数据集主题分布中“社保就业”领先,在该主题下开放数据集总数是排在第二位的教育科技主题两倍多。

济南平台79个部门有开放数据集

而开放数据部门覆盖面反映了各政府部门开放数据的参与程度,体现了数据集来源的丰富程度。《中国地方政府数据开放报告(2019年上半年)》提到“全国只有不到20%的地方实现了数据提供部门全覆盖”。南都大数据研究院梳理发现,目前济南市公共数据开放网覆盖的部门最多,达79个,其次是北京市政务数据资源网。

具体而言,统计仍然是开放数据集最多的部门,占比7.92%,其次是包括工商、质监、食药监等在内的市场监管,开放数据集占比排名第二。卫生健康、住房和城乡建设、生态环境、教育、交通等部门也开放较多数据集。专家建议,与统计部门提供的经过加工归总后的宏观统计数据相比,业务部门提供的数据更具原始性,容量更大,再利用价值更高,应成为数据开放的主力部门。

贵阳近九成数据集年度更新,青岛两成多实时更新

数据汇聚到平台,及时更新是“必备”,很多省市提及数据开放的政策文件也要求“数据及时更新”。南都大数据研究院梳理发现,目前政府数据开放平台对数据集的更新,主要包括每年、每半年、每季度、每月、每周、每天、实时、不定期等8种类型。贵阳、济南、深圳政府数据开放平台的数据集,主要是按年更新,其中贵阳市政府数据开放平台按年更新数据集占比最高,为87.1%。与按年更新相比,上海市公共数据开放平台的数据集更多选择每半年更新,占比为35.8%。

此前,有专家归纳当前政府数据开放呈现的问题就提到“数据缺乏更新的时效性”。《公共信息资源开放试点工作方案》特别提到要“提高实时动态数据开放比重”。梳理发现,8个重点城市的政府数据开放平台上,数据集“实时更新”占比较高的为青岛市公共数据开放网、上海市公共数据开放平台。其中,青岛市公共数据开放网23.6%的数据集实现实时更新。

至于数据集实时更新较多的部门,各市平台也不同。分析发现,上海市公共数据开放平台有38个部门或多或少选择数据集实时更新,其中上海市生态环境局开放的数据集实时更新占比最高,为22.3%。青岛市公共数据开放网也有36个部门的数据集包含实时更新。贵阳市政府数据开放平台上实时更新数据集的部门最少,只有5个。

成都数据集下载转化率超八成,深圳仅3%

开放的数据集若没有被下载利用,数据开放的价值也无法真正得到释放。南都大数据研究院梳理了8市政府数据平台数据集访问量、下载量,分析数据集下载转化率,衡量各平台数据集对访问者的吸引程度以及实际效果,还梳理了各平台数据集零访问率、零下载率。

在下载转化率(下载量/访问量)方面,成都市公共数据开放平台数据集最高,为81.6%,其次为济南市公共数据开放网、青岛市公共数据开放网,数据集下载转化率均为32%。数据集下载转化率较低的为深圳市政府数据开放平台,仅3%,但该平台数据集访问量最高,截至5月10日数据集访问量为8069108。

数据集下载量较多的是上海市公共数据开放平台,为1419289。值得注意的是,上海市公共数据开放平台的数据集零下载率也高,为21.7%,在8市政府数据开放平台中排名第二。数据集零下载率最高的是成都市公共数据开放平台,1645项数据集中有871项下载量为零。平台上所有数据集均有下载量记录的只有贵阳市政府数据开放平台。而在数据集零访问率方面,只有青岛市公共数据开放网上的数据集“落实药品集中采购制度信息”访问量为零。

贵阳全提供CSV下载,上海该格式数据集仅三成

除了保证数据的完整性、准确性、原始性、及时性,开放的数据集提供可机器读取格式(如CSV、JSON、XML、XLS等),也是提升数据下载率、提高数据利用价值的手段。《公共信息资源开放试点工作方案》明确要求“可下载的数据集应采用可机器读取格式(如CSV、JSON、XML、XLS等)开放,可机读率不低于90%,鼓励优先采用CSV格式”。

南都大数据研究院梳理8市政府数据开放平台发现,广州市政府数据统一开放平台、深圳市政府数据开放平台、济南市公共数据开放网等5市平台可机读下载格式数据集占比高,至少4种可机读下载格式占比都超过90%。其中,贵阳市政府数据开放平台的数据集100%提供CSV下载格式,而上海市公共数据开放平台提供CSV下载格式数据集只有30.5%,成都市公共数据开放平台提供CSV下载格式数据集占比为47.1%。

出品:南都大数据研究院

数字政府研究中心

统筹:邹莹 研究员:袁炯贤

实习生 黄芮雯

设计:何欣 技术:郑冰蓉

手机看报
分享到:
返回奥一网 意见反馈