交通运输领域生成和储存的公共数据内容丰富,应用面广,开放交通运输领域的公共数据对推进数字经济和数字社会发展具有重要意义。
近日,复旦大学数字与移动治理实验室发布了《2021交通运输公共数据开放报告》和“交运数林指数”,对交通运输领域公共数据开放的现状和水平进行了评测,提出了一系列对策建议。
报告包括全国交运概况,“交运树林指数”体系及评估办法,各地区交运概况评估及标杆,国外案例,建言等内容。
全国交运数林概貌
交通运输部开放数据容量最大
目前,国家交通运输部官网数据开放栏目和交通运输部综合交通出行大数据开放云平台都已开放了交通运输领域的数据集。其中,无条件开放的数据集47个,数据容量近6千万,数据内容主要涉及国内部分省市的交通线路站点、客运站班次、线路、货运车辆、运输与维修经营业务等。
与其他条线部门相比,交通运输部门开放的数据容量达到2.78亿,在各部门居于首位,其次是住房和城乡建设、市场监管、文化旅游等部门。
各条线部门开放的
数据容量( 单位:万)
在相关法规政策制定上:
-- 北京市、台州市等 7 个城市制定了专门针对交通运输领域数据开放的法规政策,对数据开放、全生命周期安全管理等方面作出了详细的规定。
在数据的数量、质量和规范上:
-- 各地开放的交通运输领域数据集在总量与容量上存在显著的地区间差距;
-- 开放的交通运输类数据仍以静态数据为主,尚未有地方在数据开放平台上提供实时动态数据。少部分地方的数据存在碎片化与低容量等数据质量问题,数据更新及时性仍有待提高。
-- 各地开放的数据在标准规范上也不一致,各地开放的数据范围也不够全面,数据丰富程度不足。
在开放数据的利用成效上:
-- 少数地方在交通运输领域已开展了诸如开放数据创新利用比赛、项目案例试点等利用促进活动;
-- 各地的利用促进活动类型仍较为单一,有效成果数量较少,且主要由企业开发利用,个人、社会组织、高校等其他社会主体参与利用的程度不足。
交运数林指数
浙鲁贵川成为优质“数木”
基于开放数林指标体系,结合交通运输领域特点,报告重点从三个维度及下属多级指标对交通运输领域开放的公共数据开展评估。三个维度包括:
-- 准备度是 " 数根 ",是数据开放的基础,包括数据开放要求、数据利用要求、安全管理要求、保障机制等四个一级指标。
-- 数据层是 " 数叶 ",是数据开放的核心,包括数据数量、数据质量、数据规范、开放范围等四个一级指标。
-- 利用层是 " 数果 ",是数据开放的成效,包括利用促进、利用多样性、 有效成果数量、成果质量等四个一级指标。
2021交通运输领域开放数林省域指数如下表所示。浙江省的综合表现最优,进入A+等级;山东省也表现优异,进入A等级,其次是广东省、四川省等省域。在单项维度上,浙江省在数据层和利用层上表现最优,进入 A+ 等级。
交通运输领域开放数林指数
综合等级(省域)
2021 交通运输领域开放数林城市指数(前二十)如下表所示。深圳市和丽水市的综合表现最优,进入A+等级;青岛市、宁波市、金华市也表现优异,进入A等级,其次是台州市、贵阳市、绍兴市、烟台市、上海市、武汉市等城市。
在单项维度上,舟山市、丽水市和青岛市分别在准备度、数据层和利用层上表现最优,进入 A+ 等级。
交通运输领域开放数林指数
综合等级(城市前二十)
交通运输领域数据开放水平较高的省域主要集中在东南部沿海地区的浙江、山东等省域以及位于西部的贵州、四川等省域,成为全国交通运输领域的优质“数木”。
交通运输领域开放数林指数
空间分布(省域)
报告展示了省本级与城市开放的数据容量最高的前10个交通运输领域数据集,这些数据集主要集中于经营许可、运输证、公交线路站点、车辆船舶道路基本信息、班次时刻表、客货运量等方面。
报告还列出了各地交通运输领域开放的10类常见数据集。
各地开放的交通运输领域
10类常见数据集
报告分析了各地政府为促进交通运输领域开放数据的社会化利用而组织的各类活动。2021北京智慧交通开放创新大赛设置了路口流量预测、干道信号灯协调控制、共享单车出行里程计算、出行方式识别、拥堵特征时空演化等7个赛道。上海市在交通运输领域开展应用试点合作项目。例如,上研智联自动驾驶试点项目利用临港新片区汇聚的企业自动驾驶数据和政府部门的道路设施、 客流等数据,为企业训练自动驾驶算法提供数据支撑。
报告还展示了美国、纽约、伦敦、巴黎等国外案例。
交运数林建言
最后,报告从准备度、数据层和利用层对提升交通运输领域公共数据开放水平提出了一系列对策建议。
1. 准备度
-- 在数据开放要求方面,建议各地在制定有关交通运输领域数据的法规政策时对数据开放目录与清单、开放数据质量、开放方式、开放数据需求征询与回应作出具体要求。
-- 在数据利用要求方面,建议各地在相关法规政策中对交通运输领域数据开放的利用促进活动、示范应用作出要求。
-- 在保障机制方面,建议各地在相关法规政策中对交通领域数据开放工作的人员与资金保障作出要求。
2. 数据层
-- 在数据数量方面,建议各地持续开放更多交通运输领域数据集,重点提升数据容量,开放更多高容量数据集,提高单个数据集的容量,特别是以 API 接口形式开放的动态的、高容量的数据。
-- 在数据质量方面,建议各地开放更多实时动态的交通运输领域数据,而不只是开放静态的数据集,甚至是颗粒度很低的统计数据。建议清理高缺失、碎片化、极低容量的数据集,并确保开放数据集的动态更新。
-- 在数据规范方面,建议推进交通运输领域数据的分级分类开放,并配备相应的、差异化的开放授权协议。提高可机读、非专属与 RDF 格式的数据比例,降低申请和调用 API 接口的难度;为开放数据集提供丰富的元数据说明。
-- 在开放范围方面, 建议参照报告中的“常见数据集”清单开放各地已普遍开放的交通运输领域数据,参照国内外优秀案例,扩大交通运输领域数据的开放范围。
3. 利用层
-- 在数据比赛方面,举办专业性的交通运输领域开放数据利用比赛,或在举办综合性开放数据创新利用大赛时为交通主题设置分赛道。
-- 在引导赋能方面,组织专门针对交通运输领域的引导赋能活动,例如开展主题沙龙、数据供需对接会、利用案例试点等活动,促进交通运输领域数据的开放与利用。
-- 在利用多样性方面,鼓励和引导高校、社会组织、个人等多元社会主体参与交通行运输领域开放数据的利用,构建价值共创生态。
关于“开放数林”指数
“中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品,自2017年5月首次发布以来,定期对我国政府数据开放水平进行综合评价,精心测量各地各领域“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。2018年以来,中国开放数林指数为国家互联网信息办公室信息化发展局跟踪监测我国公共信息资源开放情况提供数据支撑。