如果要给2015年的地理信息行业打一个标签,地理大数据一定是其中之一。在信息技术飞速发展的今天,“大数据”作为一种潮流铺天盖地的席卷了各行各业,从央视的春运迁徙图到旅游热点预测,从大数据工程师奇货可居到马云布道“DT”时代,“大数据”被推到了一个前所未有的高度,连国家领导人出访演讲都言必称大数据。地理信息数据天生具有大数据属性,作为整天和地理信息数据打交道的地信人自然不甘落后,地理大数据概念脱颖而出。

    地理大数据是什么?大体来说就是把社会经济、自然资源、商业信息等但凡具有一点空间维度的数据一股脑儿拿来进行空间化处理,并和基础底图进行叠加整合,形成一种新的数据表现形式。地理大数据真正兴起大约是从去年初开始的,吸引了包括百度、四维图新、ESRI、超图等在内的众多豪门的参与。经过近两年的摸索和实践,应用方向逐渐聚集在地理商业智能领域(Geo-BI)。地理商业智能并不是一个新的概念,无非是将地理大数据和地理信息技术等地理基因注入到商业智能,说白了就是传统的数据仓库的改头换面,加入了一些地理因子,新瓶装旧酒罢了。传统的商业智能(BI)很重视数据可视化技术,通过可视化技术使人们对数据仓库中的数据不再局限于通过关系表来观察和分析,而是以更直观的方式来看待数据及其结构关系。虽然可视化技术可以将数据的各个属性值以多维数据的形式表示,并从不同的纬度进行观察,但是它在空间维度面前缺无能为力,而地理数据可视化的出现恰好弥补了这个遗憾。

    地理数据可视化充分利用了地理信息技术提供的空间数据可视化的能力,将所有的行业信息通过处理整合成地理大数据,用地图的方式进行可视化表达,以完美的姿态解决了大数据中的空间位置表达问题;同时,利用地理信息技术的空间分析能力,为地理大数据涉及到的大量的空间分析提供了处理能力,在空间维度上初步实现了大数据的分析。

    看到这儿,地信专业的同学估计要忍不住噗哧得笑了:别整这些玄乎的,这不就是地图制图嘛,和平日里搞的专题数据配图一样样儿得嘛。你们说的没错,如果地理大数据的应用到此为止,那地理数据可视化和地图制图还真的区别不大。是不是很Simple?门槛很低?连我们这些普通从业者都觉得简单,资深牛人们岂会不知?于是一系列地信背景的创业公司如雨后春笋般拔地而起,纷纷入场:超图成立了“超图数据”从事地理大数据服务、地图汇升级成地图慧专注于互联网地理商业分析服务、几个从超图离开的年轻人创立了“地图无忧”专业提供地理商业智能相关服务、北京捷泰天域的智图(GeoQ)全面发力地理大数据、ESRI原技术总监王昊创立了GeoHey剑指地理在线服务……

    笔者满满的技术情怀被彻底激发了,花了两周时间仔细研究了这些创业公司提供的互联网地理大数据服务,试图把握地理数据可视化的行业脉搏,然而逛完一圈后却发现情况并非和想象的一样美好……从时间节点上看,这波地理大数据创业风应该是受去年CaroDB获风投青睐,从大洋那边儿刮过来的,在国内迅速落地,各家凭借资本的力量大肆开始跑马圈地。CartoDB和MapBox一直是我比较关注的两个在线地图应用产品,第一次使用CaroDB时被其Symbol和CartoCss给震惊了,原来在线地图制图还可以这样玩。国内类似的创业项目或多或少都有CartoDB的影子,他们提供的服务比较类似,基于在线地图应用提供地理大数据服务。当笔者在使用地图无忧、智图和GeoHey三个产品时,竟然产生了傻傻分不清楚的感觉。地理大数据服务的基础是地理数据可视化,相较于CarotDB对地图元素展示控制的细腻程度,国内的项目在地理数据可视化上下的功夫显然是不够的,粗糙得多了(坦白地说,也算够用)。他们更多地强调地理大数据的多元性和丰富性,各家争相提供种类齐全的地理大数据。

    笔者产生了第一个疑问:用户自有数据的管理是不是足够了?笔者在使用的时候发现一个共性,几个平台基本只能接受Excel、CSV、Json等几类格式的离线数据,这本无可厚非。这几类格式简单明了,容易掌握。问题处在离线这个点上。离线数据意味着不能自动更新,意味着数据一次导入以后就“死”了,要更新只有两个选择:在线逐一修改或重新导入一份新数据。数据量少还好,如果数据量大呢?如果用户自有数据不是手工生成的,而是由已有业务系统自动生成的呢?数据在线更新后如何反向流回业务系统里?这些问题横亘在创业公司面前,是躲不开的。

    笔者的第二个疑问:如何保障这些平台提供的地理大数据的准确性?这些数据的来源是否权威可信?提供海量的丰富的地理大数据为地理商业智能提供弹药本无可厚非,但既然是商业智能,自然得保证数据的准确性和现势性,过时的数据和不正确的数据同样都是没有价值的。国内信息孤岛普遍存在,跨部门、跨行业的数据共享并不顺畅,有价值的公共信息资源和商业数据开放程度比较低,基本处于死锁状态,无法顺畅流动。有意思的是,几个平台提供的同一类地理大数据的结果还不完全相同,显然保证第三方数据的精准度是赢得用户信任的基础。

    笔者的第三个疑问:地理可视化是本还是末?传统的商业智能经过了二十多年的发展才逐步形成一套规范化的理念和运作模式,地理商业智能是一个比较新的概念,至少在国外也还没有成熟的解决方案,在国内更是新生事物。地理商业智能究竟是GEO-bi还是geo-BI?至少从国内目前几个项目来看,没有商业智能体系所必须的数据仓库、数据抽取、OLAP、数据挖掘等部件,更多的还是数据展示。GEO-bi也许已经回答了这个问题。

    地理数据可视化是一个非常有意思的方向,对于习惯了生活在ArcGIS和Supermap平台商为我们构建的生态环境下的地信人来说,就仿佛是推开了一扇窗户,感受外部世界吹来的一股清风。笔者的闲言碎语看过听过就罢了,只是,地理数据可视化:Simple,Not Easy!