李栋博士,长期从事区域和城市发展方面的建模、分析和规划实践。目前担任清华同衡规划设计研究院创新中心副主任、北京城市实验室执行主任,主管城市级大数据分析,指导相关产品研发。在国内多个城市开展项目实践,推动城市规划与决策向数据驱动的定方面发展。
“智慧城市”与“城市智慧”的区别
我们不是做智慧城市,但不得不批评一下智慧城市,我想说一下智慧城市和城市智慧的区别,我是这么理解城市智慧的,从标题上看,城市智慧把多元的数据融合在一起,挖掘其中的价值。
有两个案例。第一个案例用了数据,我们融合了其它数据分析思路框架,做了全国性自下而上的宏观研究。
第二个案例用了数据融合,我们做了贵阳乡村建设层面的研究。
关于智慧城市,我看了一下建设部三期的试点,有300多个智慧城市试点,不仅有地级市、园区,开发区也算进去,基本上每个都地方或多或少都有试点区域。
这是很火热的一个产业,但同时也会听到很多批评的声音,包括专家学者、老百姓。从我个人感觉来看,这些试点在早些年都是以硬件进来为主,精细化、系统化的服务能力还是不太能跟上。
回顾一下智慧城市这个概念是怎么来的?很早以前,IBM公司提出的智慧地球公关战略提到智慧城市,当时想用这些信息技术把基础设施效率提升,其实目的很简单,但是翻译成中文以后,这个概念就非常大。
我们一直在做城市发展研究,认为城市是一个非常复杂的系统,IT系统也很复杂,把两个很复杂的东西交织在一起,复杂程度可想而知。我们后来做了一点文献调查。到底什么是智慧城市?我一直很好奇,也没有办法回答,所以我看别人怎么回答。我把中文文献与英文文献中的智慧城市搜出来,合计起来有几千篇,把观点、文献与文献引用、关键词作分析。我们看出,中国智慧城市与老外理解的智慧城市有很大区别。这篇文章目前在投稿,会很快发出来。
在中文里面,你会发现智慧城市所呈现的特征,紧跟国家政策,这大概是我们做事的习惯,如新型城镇化,顶层设计等等;关注的城市范围很广泛,如城市管理、运行等等。英文文件里显示的核心就几个关心技术,如物联网、大数据等等。除了有可持续发展、城市规划,智慧城市跟城市没有太多关联。考察技术,这是我们学别人概念有跑偏的直接概念。
IBM提到认知计算,当你开始建系统,数据来了,第二步,应该提供你一种分析能力和分析服务,之前收集上来的数据没办法处理,没办法提取当中有效的工具,提供人工智能、机器学习,就再也不会提智慧城市。这里面是不是包含有城市智慧呢?当你的数据充分丰富,当然不会有最丰富,只有更丰富、越来越丰富,你的智慧是从数据中挖掘和学习出来。
如何从“智慧城市”跳到“城市智慧”阶段
谈一下我个人的理解,我们怎样从智慧城市这个坑跳出来,跳到前景比较光明和美好的城市智慧阶段。
它不在于硬件设施的建设,最关键在于你的理念与运行,系统建好后,怎样从中得到有效信息指导下一步决策。
第二步在精明的决策,最关键的源于对数据的洞察,这是有可能把跑偏的东西拧回来的一个方向。
国家城镇科创网络体系研究与贵阳农村人居环境优化
我接下来举的例子与规划、咨询行业相关,我想说的主要核心观点就是这个。
我们的数据资源不断在丰富,如政府、企业、互联网、物联网的种种数据,收集这些数据能使我们精明决策,城市层面的精明决策得到可能,直接用处就是城市规划。
在这里面,我觉得数据用于决策最难的不是收集数据,数据门槛越来越低,越来越容易,最难是分析和解读,换句话说,关于行业的问题,怎样提出行业里有特征性的问题。做城市管理、人口管理或是产业园区管理,你提出来的疑问是不一样的,首先提出这样的疑问,你才有可能寻找答案。
第二是指标,你用什么样的指标回答你的问题。
这里面有一本书,觉得非常有意思,1686年已经有大数据的概念,法国的人口统计里就提到,如果国王坐在他自己办公室里能够了解他国家有多少人,有多少财富,那是一件多么好的事,三百多年前法国人已经有这个观念,我们现在还做不到这一点,数据完善程度还不如300年前,当然现在世界更复杂。我想说数据一直都有,怎么让数据分析解读还是最重要的。
第一个例子很宏观,自下而上,我们做国家城镇科创网络的研究,用各种各样的数据去看这些城市当中科创的关联,还有科创能力的强弱,给他们一些定位和决策,我们做的大概是这么一个任务。实际上,做起来是一个核心的逻辑,针对这个课题本身而言,你怎么样去考核城市的科创能力,我们把里面分为两类,创新的产出与产出效率,包括各种要素等等。
另外一个层面,我们考虑这些产出是一个结果,但是这些结果不是凭空来的,肯定有很多要素支撑它。所以,有一个创新支撑指标,可能关联性稍微弱一点,间接一点,但它是构成城市创新的基础。我的思路是根据这个问题去设计这样的指标体系,这是一个自下而上的方式,然后我们再去寻找数据,去构建指标体系,比如常规的各种各样的年鉴,肯定是不够的,我们在这儿特别引入了龙信的企业数据、普查数据,还有百度POI数据。
我们把所有数据汇集汇总,通过算法得到指标,这很详细,指出各指标到底是什么。指标设计有很多讲究,囊括各方面的特点,如相关性、综合性、系统性等。
汇总表中,你可以看见绿色,这是从龙信数据得到。仲伟说了个体层面和园区层面,这个数据非常有价值。全国层面去用,威力也非常大,筛选指标数据,我们认为科创行业、文创行业具有创新代表性,你用无数种方法去构建你的指标,这个指标最有效,还有通过专业知识回答,包括百度的一些POI,还有传统没有颜色指标的统计年鉴。所以,我们还是采用多元数据融合的方式去制图,去解决和回答面临的问题。
我们有了指标以后,还不够,指标做出来有很多挖掘方式,聚类相似性,寻找指导你下一步指挥,我们也在做,比如用雷达等刻画出来。
这个图是我们分析的结果,这个结果是需要大量的输入、融合和计算。
我们还是要做规划,分析怎么样为你下一步的决策提供建议。构建一些科创的走廊,全国创新网络,我们怎么做?你的建议看起来跟我们数据分析是有很强的逻辑关系的,所以我想说智慧提炼、智慧获得的过程,采集数据是很容易的,但是我们想提炼出有智慧的内容是很困难的,一步一步用多种数据融合,然后通过行业认识、专业的方法去提炼出我们所需要的智慧或者知识来。
第二,我们自下而上来讲贵阳农村的问题。这是另外一个课题,对贵阳农村人居环境进行优化,也是很常见的规划命题。
贵阳市虽然不大,但农村也有好几百。大部分是农村,你很难构建出一个很全面的数据库来,像龙信高大上的数据放到贵阳农村就不好用,我们希望用融合的方式去解决问题。我们挨家挨户去问,了解每个村子的信息,也包括现在已有政府部门在做这个事。
这是建设部村镇管理平台,贵阳市大部分村庄基本信息都有,政府部门统计的一些数据,以及后面加了一些新数据。村有600多个,但是村和村之间哪些是比较相似,哪些是有特点、差异性的,我们核心分级,一个是看相似,一个看差异或者看组团,对村庄有一个这样类似的认识。我们把它分到不同的类型,打标签,给每个村子打标签,提出正确导向,每个村适合做什么不适合做什么,其实这就是我们规划的逻辑过程。当我们获取完各种各样的数据之后,就可以给贵阳全市进行分析。
刚才前面基础都是常规数据,我们觉得还不够,几个刷红色的是引入别的数据。交通可达性,通过手中的方式,我们难以获得每个村道路信息,但是我们现在有百度地图,有各种各样互联网方式。贵阳经常做旅游,怎么了解各个村庄旅游状况,可以用微博,用社交网络方式。很多时候旅游是口碑经济,当微博上有人说你这个村子很好玩,反映了你这个村庄旅游品质不错等等。
这是我们做的交通可达性,完全是基于互联网的,不管是通过百度、高德等互联网的方式,互联网数据可以获得偏僻村庄交通可达性。
这是微博的数据,微博数据在发表的时候有时间、地理位置,还有标签。包括你今天在这儿逛了这个村,明天跑那个村等等都,有行为轨迹,我们都弄下来,看说的话、拍的照片、每天去几个村子等等。
我们把这些数据转化为指标之后,就得到了跟刚才传统数据可以对等的一些特征指标,也就是我今天的主题一直想说的数据融合方式。
不管传统表格式的数据,还是新的普查数据,还有互联网上非结构化的数据,我们真正用的都是变成指标后的,这些指标的设计完全根据分析问题或者是想解决的问题来定的。
还是那个例子,不同的景区说的话都不太一样,现在文本挖掘、文本分析的技术也都比较成熟了。
我们通过前面的分析,把贵阳村子分类,相应提出未来五年十年做的事情,这就是我们规划产出的结果。
案例大概就是这样。关于案例做的事情,大家并不是规划院的人,没有太多的借鉴,但是,我想通过这个案例表述一个逻辑和我的一个观点。
城市的智慧,智慧是数据驱动精明决策,首先有数据,还得精明,最后要决策,怎么实现这一点,最关键还是要融合多个来源数据;第二,你要提出行业特征问题;最后,找到更具有刻画度的指标。只有这三个指标结合在一起,城市层面与园区层面才能得到更有智慧的措施。