zoukankan      html  css  js  c++  java
  • 白话空间统计之五:空间关系的概念化(上)

    空间统计分析与传统的统计分析,最大的差别就在于空间统计学把空间信息和空间关系都直接整合到了算法之中。假设取消掉空间相关的特性,空间统计学与传统统计学就没有多大的差别了。

     

    因此在做空间统计时。都要求在分析之前进行“空间关系的概念化”。这个名词说起来非常绕口。事实上意思就是,你须要在分析时候。使用的“空间”这一概念,进行一个定义。

     

    通俗的来说,空间非常多时候就等于“距离”。特别是在生活中,我们对两个物体的“空间关系”进行定义,很多其它的是对这两个物体之间的距离进行描写叙述。比方“A距离B,直线距离90公里”。

    那么既然有直线距离,自然也有其它的距离,比方“A距离B。车程大约3小时”。

     

    这样的使用距离来对空间概念进行的描写叙述的方式,就是所谓的空间关系的概念化。当然,这是一种狭义的说法。之所谓狭义。是针对广义的空间概念而言的。

    如两个国家之间的空间描写叙述,就从地理关系上来说。假设两个国家接壤,自然能够用“相邻”关系来描写叙述。

     

    而在人文上面的关系就更加多种多样了,比方两个国家处于战争状态。哪怕他们接壤,你从当中一个国家去另外一个国家,还有可能要绕道半个地球。通过第三方国家才干进入。这样的情况的话,通行的距离,远远大于实际地理距离。

     

    所以,对于不同的分析,就须要选择定义好对应的空间关系概念。比如,我们要研究某一地区的通勤情况。使用行程时间或者行程成本这样的方式作为空间关系的概念,是一个非常好的选择。

    可是有一些研究。时间和空间变得不是那么重要。比方我们要研究城市间的相关程度。或者交互程度。比如拿手机通话数来说,北京与上海之间的通话数,可能要远远的高于北京与涿州(或者保定)之间的通话数。从这样的概念上来说,北京与上海的相关程度要高得多。

     

    常见的空间关系概念化包含了距离、行程时间、固定距离、K最邻近、邻接等,详细使用哪个。取决于要測量的对象是什么。

    比如上面举出的几个样例。度量不同的研究对象,选择的概念就不同。

     

    以下我们来对这些概念化内容进行一个简单的描写叙述:

     

    一、反距离、反距离平方(阻抗)

     

    假设选择的是“反距离”这样的方式的话,空间关系的概念模型就表示为一种阻抗或者是距离衰减。

    依照地理学第一定律。不论什么要素都会影响其它的要素,可是距离越远,影响就越小。

    所以使用反距离这个概念,即:随着距离的增大,影响就会降低。通常使用距离这个概念来描写叙述空间关系的话进行分析的话,还会去设定一个距离范围。或者说阈值,这样能够降低所须要的计算数(特别是对于大型数据集而言,至关重要)。

     

    假设你不去指定不论什么距离范围或者距离阈值。那么在计算的时候,系统会强行将每个要素,都指定为其它全部要素都相邻的要素。把全部的数据都增加到计算中来。当然。在软件实现中(比方ArcGIS)。就算你不指定。系统也会设定一个默认阈值,除非你强行指定阈值为0,这样就表示全集计算了。

     

    反距离的表演示样例如以下:随着距离X的增大,影响力Y不断的衰减。



    反距离(欧式距离)适用于对连续的数据(比方温度变化,直线測量等)进行建模,假设是在城市中固定位置的设施之间的空间关系衡量的时候,直线距离和路网距离可能都不太好用了,这样的情况下,我们使用曼哈顿短距离,反而效果更好。

     

    有时候我们还会选择“反距离的平方”这个概念。实际上与反距离的概念是一样的,仅仅是你的曲线的坡度更陡,相邻要素之间的影响下降得更快,而且仅仅有目标要素的近期相邻要素会对要素的计算产生重大影响。下面是关于反距离的幂对影响力的说明:



    能够从图上看见,你选择反距离的幂越大。对距离就越敏感。

     

     

    二、距离范围(影响的范围)

     

    对于某些研究,比方热点分析,使用固定的距离是默认的空间关系的概念化。

    什么叫固定距离呢?就是在同等距离范围内的全部要素,都觉得每一个事件对我的影响是同等的。

     

    如,在研究区域热点的时候。我们定义空间尺度为10公里,也就是将整个区域划分成10公里一个的网格,每一个落在这个网格里面的事件点,都是这个网格的影响因子。而至于这个事件点,是落在网格的正中心,还是落在网格的最边缘,影响因子的强弱都是全然一样的。

    例如以下图:

    ABC三个点,它们都对这个网格产生影响,可是它们在网格的不论什么位置(不管是中心或者偏远)。影响的权重都是一样的,即在固定距离范围内,全部的要素效果一样(范围内全部要素权重全然相等)。

    而一旦超出了指定范围,那么范围之外的全部要素都不影响计算(范围外全部要素权重为零)。

     

    固定距离的函数表演示样例如以下:

    比方我要研究的是小区居民对周边商业的影响,那么固定距离就是这个小区的范围。

    在小区里面居住的全部居民,不管是住在小区的中心,还是住在小区最角落里面的那栋楼。都对我的研究时候所产生的影响是一样的。

     

    未完待续。

    有问题请关注虾神公众号。谢谢



  • 相关阅读:
    【Vue】 computed和watch的区别
    【总结】html5新增标签以及css3新增属性
    【前端经典面试题】前后端分离(说一说你理解的前后端分离?)
    【前端面试CSS】—垂直水平居中终极版
    【CSS】清浮动的常用四种方法
    【前端面试CSS】——盒子模型(标准模型和怪异模型)
    【JavaScript】JS常用的方法总结(不定期更新中)
    【Cordova】开发app遇到的坑之 按两次返回键退出程序
    【JavaScript】深拷贝和浅拷贝的总结(含义、区别及实现)
    【vue】路由传参的三种方式
  • 原文地址:https://www.cnblogs.com/claireyuancy/p/7093067.html
Copyright © 2011-2022 走看看