大数据时代广州市政府数据开放策略研究
2018-03-13

摘要:随着大数据时代的到来, 开放政府数据运动席卷全球, 我国有些城市也已经开始尝试。当前, 广州市政府数据开放已初见成效, 但是在发展过程中仍然存在一些不足。本文在深入研究广州市政府数据开放发展现状的基础上, 分析政府数据开放对广州发展的意义, 并提出了若干意见。

我国政府在近20年的信息化建设中, 积累了海量的数据, 这些数据是整个社会经济活动的数字化记录, 是可以重复利用的非物质财富, 也是政府管理和决策的依据。随着技术的进步, 特别是大数据时代的到来, 政府部门的数据管理面临数据中心基础设施、数据存储、数据分析、数据价值应用、数据人才匮乏等挑战, 与此同时, 公众对政府数据开放的要求也越来越高。在此背景下, 政府部门越来越注重对数据进行挖掘以实现精细化管理, 而政府数据开放有利于公众监督政府决策的合理性, 提高政府的管理水平和透明度, 促进政府管理创新, 创造更多有价值的数据资源, 促进经济社会快速发展。开放政府数据不仅是在国家治理体系中发挥政府主导作用的现实需要, 也是在全面深化改革的时代背景下实现政府职能转变的重要举措。

目前我国还没有具体的法律推动实施政府数据开放, 但一些政府信息化建设方面领先的城市已经开始进行政府数据开放的尝试, 例如北京市政务数据资源网, 上海市政府数据服务网, 广州市政府数据统一开放平台等。本文以广州市为例, 研究目前政府数据开放现状, 了解发展中存在的优势和不足, 为全面的政府数据开放提供参考。

一、广州进一步开放政府数据的意义

其一, 有利于公众监督政府开放数据, 推动政府数据进一步开放。李克强总理提出“为提高社会治理能力、建设现代化政府, 最先考虑的应该是要开放政府数据”。政府70的数据集中在政府部门, 但这些数据的开放程度远远不够, 真实性有待验证, 只有政府开放的数据都是原始数据, 数据真实, 具有客观性, 才能经得起公众的检验。而公众通过发表意见和建议, 评价政府数据开放程度, 监督政府数据开放进程, 可以推动政府进一步开放数据。

其二, 有利于促进社会诚信建设。李克强总理指出, 政府大数据建设, 凡是不涉及国家秘密, 并且可以引导社会经济发展的数据都应该向公众开放。因此, 与信用相关的数据开放十分必要。虽然, 企业信用数据可以通过相关的平台查询, 但是, 所有的活动离不开人, 而最关键的也是人, 只有将人的信用度用数据加以描述, 并在数据开放平台公开, 社会活动中的不诚信行为将会大大减少。试想, 一个有不诚信记录的人, 谁会去相信他, 如果他知道不诚信带来的后果, 那么他就不会做违背诚信的事情。所以, 个人信用数据的开放将会促进社会信用体系的建立。

其三, 有利于促进社会公平。任何人都可以获得数据政府开放数据的基本原则, 这说明开放数据是没有歧视性的。公共数据是可以被任何人使用的, 无需申请更无需个人的详细信息。广州市政府数据统一开放平台允许用户匿名访问公共数据, 用户使用的数据的记录不会被监管, 充分体现了公平性。因为开放的数据都是在法律法规规定的范围内开放的, 所以也不存在数据是否会被恶意使用, 因为, 数据不会因为使用者不同而不同, 也不会数据会被不同的人使用也改变, 人们可以随意对开放的数据进行加工分析, 据为己有, 在数据使用上实现人人平等的公平的社会关系。

其四, 有利于商业发展, 提升经济效益。要说政府数据开放带来的经济效益, 高德地图或百度地图就是最好的例子。这些商家利用自身和政府开放的数据开发电子地图软件, 提供导航等功能, 服务了大众, 让人们出行更便利, 也为自身带来了巨大的经济利益。与此同时产生的衍生数据带来的经济利益更巨大, 通过分析人们利用软件搜索地址等信息, 通过数据挖掘、大数据分析等技术, 发现商机。有了政府开放的数据, 小微企业将和大型企业一样平等拥有数据利用的权利, 将会大大减少不正当竞争。

二、广州市政府数据开放现状分析

(一) 广州市政府数据开放进程中存在的优势

2009年美国推出开放政府计划之后, 欧盟等国家和地区也相继出台政府数据开放政策, 此后, 开放政府数据运动席卷全球, 关于开放政府数据的研究也逐渐成为热点。如图1所示, 根据CNKI查询关键字“政府数据开放”, 发现2010年才开始有先关研究文献发表, 最近两年相关文献数量有非常明显的增长, 相关课题研究逐年递增, 由此可见关于政府数据开放的研究如火如荼。广东省为适应这一趋势, 于2014年成立大数据管理局, 由政府牵头统筹政府数据开放。2015年, 参照广东省大数据管理局情况, 依托市科信局, 建立广州市大数据管理局, 统筹全市政府机关和事业单位的信息采集、整理、共享和应用, 消除信息孤岛, 开展数据挖掘和决策支持服务, 建立公共数据开放机制, 除法律法规明确规定不宜公开的信息, 一律及时向社会公开。广州市政府公开的数据主要发布在各级政府部门官网、政府主导建设的中国广州政府网站以及广州市政府数据统一开放平台。

微信图片_20180313152000.jpg

1 政府数据开放相关文献量分布图

政府部门官方网站主要包括46个广州市政府机构的官方网站, 含行业统计数据、领域实用数据以及科技数据等三类。例如市科创委可以查询科技成果, 市卫生和计生委查询医生信息, 市教委可以查询教育资源, 广州市统计局提供《广州市统计年鉴》等统计数据。这些数据包含大量实用的与民生相关的信息, 具有实用性, 通过开放数据库接口, 将其发布于政府数据开放平台可以提升利用率。

广州市政府数据统一开放平台由广州市人民政府主办, 于2016年10月20日正式开通。广州市政府数据统一开放平台门户网站设置有数据目录、数据分析、地图服务、应用服务、开发服务、互动交流、网站统计七大栏目。平台首期开放46个政府职能部门的310项数据集, 合计约3000万数据量, 涉及经济发展、城市建设、道路交通、教育科技、民生服务、企业服务、健康卫生、资源环境、文体娱乐、机构团体、公共安全、农业农村、财税金融、劳动人事等14个重点领域。与传统意义的信息公开不同, 广州市政府数据统一开放平台可实时接收政府信息资源共享平台推送过来的开放数据资源, 保障开放的数据质量和鲜活性。广州将继续加快政府信息平台整合, 大力推动政府信息系统和公共数据互联开放共享, 消除信息孤岛。

广州市政府数据开放进程中存在的优势在于已经初步建立了开放数据的门户网站, 为公众提供了一个官方的、可靠的获取数据的途径广州经过几十年的数据积累, 已经具有可观的数据储备, 对数据进行采集、清洗、元数据描述和统一标准, 并且将处理完的符合法律规定可以公开的数据发布在广州市政府数据统一开放平台上。这些数据与公众日常生活休戚相关, 公众对这些数据的利用也将提升至新的高度。通过数据统一开放平台可以快速整合开放海量数据, 通过开放的接口, 以最低的成本开放和获取数据, 减少额外的成本, 大幅提升政府数据开放水平。广州市政府数据统一开放平台的开放标志着广州政府数据开放走在我国前列。

(二) 广州市政府数据开放进程中存在的不足

第一个不足在于目前开放的数据相对较少, 只包含简单的信息, 这些信息虽然真实, 但利用价值不高, 信息不够完整, 往往达不到人们的要求, 这不符合数据开放平台建设为了保证数据的完整性、可用性, 提高政府执政透明度, 实现数据的经济和社会价值的初衷。例如, “健康卫生—生育”类下, 只有“广州市各区、县级市计划生育情况 (年度) ”这一个数据集显然难以覆盖这个类目涉及的内容, 民众要的也不是这样的数据表单。“道路交通—服务”类下, 也只有与收费标准相关的四个数据集, 缺乏具体交通工具相关数据资源, 根本无法满足大众主流需求。

第二个不足在于广州市政府数据开放平台的元数据描述过于简单, 并没有对资源进行完整的、结构化的描述, 大部分数据只有名称、地址等简单信息, 并没有详细内容。例如, “健康卫生—医疗”中的“广州市各区医疗一览表”, 只有医院名称、地址等信息, 而没有医院等级、医院科室信息、医生信息等公众广泛需求的内容。只提供简单、低质量的元数据将会制约数据的增值应用能力和效果, 因此, 政府要重视建立更加完善的元数据。

第三个不足在于已经公开的数据缺乏统一的规范, 种类繁多、标准不一和元数据不同的数据资源更新周期也不明确, 将这些数据资源进行整合在技术上也存在一定的困难。并且还有许多价值很高的数据难以公开发布, 使得这些数据的应用价值大打折扣。此外, 各个政府部门之间缺少合作, 没有整合数据的意识, 增加了交叉数据被发现和应用的难度。而政府开放的数据的价值利用只靠政府部门实现远远不够, 还必须发动人民大众的创新意识, 仅仅靠需求调查和咨询建议这几种形式将严重制约公众的创造性和积极性。

三、广州市政府数据开放的策略

(一) 制定统一的标准, 完善数据结构

由于不同部门、不同领域的数据存在各种各样的差异, 没有统一的标准, 所以, 首先要对政府数据的整体情况进行梳理, 搞清楚有哪些数据, 那些数据可以开放, 那些数据已经开放, 数据的质量如何, 采用什么样的元数据标准来描述数据, 用什么格式来发布数据, 为后续的数据开放计划提供参考依据。在此基础上制定统一的标准规范数据, 提升数据的质量, 满足完整性、可用性、一致性、实效性和可读性, 最大限度提高数据的应用能力。此外, 数据结构至少要包括时间、用户等基本要素, 使数据可以在采集、整理、交换、展现、更新和维护等各个环节都有标准可以参考。同时, 针对数据开放平台上数据比较缺乏, 类别不全等问题, 还需要在数据量和数据类别上进行完善。

(二) 科学管理数据, 注重公众需求

随着政府数据的日益增加, 政府提供的数据服务难以面面俱到, 所以政府数据开放需要通过科学的规划和管理, 才能使政府部门和公众通力合作、互利共赢。一方面, 政府各部门应协同合作, 在保证自身效益的前提下跨部门合作, 共同梳理各政府部门的数据情况, 实现数据共享。并由大数据管理局牵头, 对数据分领域、分等级, 科学管理, 先易后难, 分阶段推进、协调施行数据开放, 保障数据开放得到有效执行。另一方面, 要注重公众对政府数据的需求调查, 参考从统一开放平台上收集的用户反馈的意见和建议, 对公众关注度高的数据加大数据量, 对大众关注较少的数据进行精细化, 并面向广大受众进行需求调研, 只有满足公众需求的数据才能获取更多的关注, 将更有利于大众创新, 万众创业。

(三) 依法保护公民的数据隐私权

在大数据时代开放政府数据为我们带来便利的同时, 个人隐私数据保护也受到极大的挑战, 政府在收集、保存、使用、公开公共数据的过程中可能会对公民隐私权造成侵犯。究其原因除了民众对个人隐私保护意识淡薄, 相关行业从业人员为追求利益而丧失职业道德及个人隐私保护的技术障碍外, 个人隐私保护的法律法规不健全也是很重要的原因。要想协调政府与公众在隐私权方面的矛盾, 必须要确立科学的原则, 建立健全的法律体制。一是要加强行业自律建设, 健全行业自律制度, 提升从业人员的道德修养。二是要完善相关法律, 加强行政监督, 强化数据收集和使用者的责任, 明确数据的相关权利, 建立数据溯源机制, 记录数据使用者的相关信息。三是要增强个人隐私保护技术的研究, 对政府数据开放平台的数据进行清洗和匿名发布, 对元数据进行分解等手段, 在保证数据可用性基础上保护个人隐私。四是要权衡利益, 树立公共利益优先的原则。当公众知情权和隐私权发生冲突时, 应在兼顾双方利益的基础上进行协调, 把握平衡点, 在侵犯公众知情权的前提下推进政府公众数据开放。健全的法规政策是保障政府数据开放的关键所在, 发达国家在政府数据开放实践上的成功也都离不开完善的法规政策。

(四) 加快政府数据开放的人才培养

随着政府数据开放的深入, 相关领域的人才需求量也越来越大。数据开放既要精通大数据分析等先进的技术, 又要熟悉相关业务和行业需求, 门槛相对较高, 传统高校培养人才的模式因为缺乏真实的大数据环境无法满足当前数据开放的发展形势, 因此, 要逐步探索大数据时代数据开放人才的培养。其一是要建立高校大数据人才培养模式, 结合大数据行业需要的人才特点, 设置专门的大数据专业, 设置统计学、数据分析、数学、信息论和计算机相关课程。建立高校大数据分析实验室, 培养有实战经验的相关人才, 并加强企业与高校的合作, 打造专业化的师资队伍。其二是要通过大数据发展在线教育, 为人们提供更多的学习机会, 让大家在空余时间也可以在任何有网络的地方学习。为政府数据开放人才培养的途径提供了新的选择。

(五) 完善广州市政府数据统一开放平台

政府数据开放的关键是靠政府统一的平台发布公开数据, 广州虽然已经建立了政府数据统一开放平台, 但是并不完善。政府建立的统一开放平台应该具有较高可信度和高普及率, 并且数据内容丰富。然而, 表面上看广州市政府数据统一开放平台虽然涉及几乎所有的部门和相应的数据类别, 但是数据量相对还是非常少的, 在大数据时代, 不到3000万的数据显得比较寒碜。因此需要加大数据量, 特别是用户需求多的数据更要提供下载, 例如广州市房屋所有权信息, 在当前房地产火热的时代, 人们急需知道要购买的房子是否正常, 避免出现一房多卖等现象, 可以从一定程度上规避买卖房屋诈骗犯罪现象。另外, 不仅政府部门, 公众不但有获取公共数据的权利, 也应该可以通过统一平台发布数据, 这样就扩大了数据量, 保证了数据的可信性。政府部门通过数据整合可以过滤掉重复、无效、虚假的数据, 细化政府数据分类, 让数据更贴近民生需求。

来源:《探求》

作者:中共广州市委党校信息网络中心 帅文明

图片来源:网络

免责声明:本文转自网络公开渠道,旨在为广大用户提供最新最全的信息,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。