查看原文
其他

【南人一周微评】测绘数据能算大数据么?

南人 GIS圈 2021-04-28


当大数据时代来临之际,咱们测绘人特别高兴,都感到迎来了我们的大好机遇,很多单位都说,我们数据库那么多数据,可要发挥大用场。

可是又迟迟都没看到有什么实质性的应用出来,没看到因大数据帮什么大忙,改变了很多,谈的人倒是很多,几乎言必称大数据,逢报告就会搭上边,写文章也定涉及,好像不沾上大数据就显得落伍和低端,因此大数据满天飞。

后来当看完两本有关大数据的书以后,渐渐的我不自信起来,觉得我们说的大数据跟别人描述的好像区别挺大的,甚至不是那么一回事。


这两本书一本是《大数据时代》,作者是牛津大学的维克托·迈尔·舍恩伯格和《经济学人》的编辑肯尼恩·库克耶,两人都被称为最权威人士;另一本是《智能时代》,作者吴军,留美博士,具有大数据操作实践经验。我原来最早翻阅过徐子沛写的《大数据:正在到来的数据革命》,那时看得一头雾水,没看下去,而前面两本要通俗易懂一些,适合我这样智商的人群阅读,特别是《智能时代》,写得更明白,毕竟是中国作者。


在这两本书里,得到这么几个基本认识:所谓有价值的大数据是指量大、多维度(多样化)、完整的数据;是数据化,不是数字化,无需精准,而是混杂;是能快速获取,而不是静止的、陈旧的数据;大数据挖掘的结果不是因果关系,而是相关关系,描述的“是什么”,不是“为什么”。

按照这样的描述,想想我们的测绘数据,虽然很多很大,比如全国重力、三角、水准及GPS大地测量成果,包括2500余个2000国家GPS大地控制点,近5万个2000国家大地控制点, 1600多个全国CORS站点;全球1:100万、1:25万、1:5万各种数据,还有各省市覆盖重点区域的1:500-1:10000大比例尺地形图数据;超过500万张的航空影像数据,覆盖陆地国土超过7000万平方千米(含重复覆盖面积)的多种分辨率卫星影像数据,以及分辨率优于2.1米的225TB(截至2012年)的资源三号卫星影像数据等等,够恐怖吧。


可是,都够不上书里所指的大数据,因为无论怎样多,都是单一的、静止的、过去的数据,甚至只能说是数字化的成果,还不能完全算得上数据,谈不上多维多样化,都很精准很有序,一点都不混杂,而且很讲因果逻辑,绝非相关关系,采集数据也是有组织有计划的,不是无意而为,因此,我的理解测绘数据算不上大数据,只能算数据大。

既然算不上大数据,那就会缺乏挖掘的价值。如果真如此,那就不要再过多花心思,否则等于明明没金矿,你还非要去挖,岂不浪费资源吗?当然,那么多数据共享多用,发挥它的价值,是有必要的,但跟大数据挖掘可是两码事。

怎么样的算是大数据呢?比如淘宝的电子商务数据、移动通信的个人数据、信用卡的消费数据,这些属于大数据之列,随时收集、非常杂乱、多样化、全样本,从中是可以挖掘出很多有价值的信息来。要说起来,电子地图的出行数据,应该算其中一个维度,还需要结合其它数据才能挖掘出新的应用。

尽管如此,我们对大数据的探索仍要继续,我也只是作为门外汉瞎想的,也许荒谬,希望不要受此影响。另外,非常欢迎留言讨论。




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存