zoukankan      html  css  js  c++  java
  • 空间统计之七:中心要素

    写到这一章,空间统计系列的内容已经写了七章了,前面的全部内容包含了空间统计的几个基本理论基础。如空间自相关、空间异质性、莫兰指数、空间关系概念化以及他们之间的量化度量方式P值和Z得分等。那么空间统计学与经典统计学在理论上的不同点,就说得差点儿相同了。毕竟空间统计学还是发源于经典统计学上面的,经典统计学上面的非常多概念,在空间统计学里面也照样能用得上。所以从今天開始,我们会介绍一些经典统计学上的概念内容在空间统计学上代表的意义和作用。

     

    要说到统计。大部分人脑子里面立即就会蹦出一堆的折线图、饼状图、柱状图等等。当然这些图表所能表示的内容和想要表示的内容。都是由人们去进行判读的。

     

    在这些进行须要人工识别判读的关键性指标里面,让人更耳熟能详的,无非是“平均数、中位数、众数”这样的可以对整个数据样本有代表性的一些值。

     

    相同。在空间统计中,也会去寻找这种具有代表性的值。现在天我们要说“中心要素”。

     

    在经典统计学中,中位数表示从它開始。能够将整份数据分成上下两个部分。关键是这个数不能是被计算出来的,而是数据中的一个样本(当然,假设是偶数个,那么是中间两个样本的平均值)。

     

    那么假设是空间数据,比方一堆点,那么我们怎么去选择它们的中心要素呢?

     

    经典统计学中,对一组数据进行排序之后寻找中位数,往往都是一维的。也就是排列成了一条直线队列,这样非常easy找到中位数。

     

    可是在空间分析中,哪怕是点状要素,也是平面二维分布的,那么假设让你对二维平面的数据线进行一个排列。那么安装你的想法,怎样进行?以X坐标为准,Y坐标为第二顺位?还是以Y坐标为准,X为第二顺位?南向北排列,还是北向南?所以在二维平面上进行排列,本来就是不靠谱的事情。

     

    那么中心点,有什么作用呢?

     

    看以下这个样例:


    这里面的每个房子代表是城内的一个仓库,如今有一批货物,要分发到每个仓库中去,那么我们要关心的是。怎样选择最少的成本。也就是最短的运输路径来完毕。

     

    假设依照传统的思想。我当然找到一个中心点,这个中心点离全部的仓库的距离都差点儿相同。这样当然是最好的,可是假设这个中心点并不是是一个仓库,难道为了这个中心点。我们还要新建一个仓库么?那当然是不可能的。

     

    所以我们要从这些仓库里面。寻找到位于最中心的一个仓库。从这个仓库出发。到全部的仓库。他们的路程距离最短。

     

    这个仓库,就是中心要素了。计算例如以下:


    如上图。红色的这个点。就是全部仓库的中心要素了,它可能不在全部数据的中心位置。可是它是现有数据中,全部其它要素的最小累积距离相关联的要素。

     

    当然,在ArcGIS里面,还提供了权重选项。假设选择了加权。就还能够设置其它的条件。比方考虑到仓库的承载量等。

     

    关于加权的问题,我们以后再说。接下去。我们继续说他的工作原理。

     

    经典统计学里面,寻找中位数的方法,是对样本数据进行排序,然后依照样本的个数。找到中间的那个数据,在空间统计中。由于无法直接进行排序,所以须要把二维空间点的分布。变成一维的线性排序来寻找。

     

    这个变化的方式,就是用点与其它每一个点的距离之和,来作为该点的值,例如以下:

    A点的距离总和 = 7 + 9 + 4 + 7 + 7 + 3 = 37

    B点的距离总和 = 3 + 4 + 3 + 6 + 6 + 3 = 25

     

    以此类推,把全部点的距离总和都计算出来。然后进行排序,最后距离总和最小的那个点。就是所谓的中心要素。

     

    距离计算的方式。ArcGIS提供了两种。分布是欧式距离和曼哈顿距离。当然。你假设已经明确了这个工具的算法,自己去写代码实现也是能够的。

     

    中心要素的作用非常广泛,像上面举例的仓库选择问题。当然还有非常多应用,比方:我如今要建立一个超市,我当然希望找到全部居民都路程最短的地方来建立。

    可是城市规划可不会容许我计算之后,选择最佳的位置,他肯定已经画出了若干地块,我仅仅能在这些地块里面去选择最优的一块,那么这个工具和算法,就能派上用场了。

    例如以下:

    每一个一个小块。表示一个小区,那么假设依照计算,红色的点,作为中心点,肯定是效果最好的,可是未必同意你使用,以下这些是同意你建立超市的地块,例如以下:



    每一个一个小块,表示一个小区,那么假设依照计算。红色的点。作为中心点。肯定是效果最好的,可是未必同意你使用,以下这些是同意你建立超市的地块。例如以下:

     

    那么你会发现。你计算出来的点,根本就不能用于建设超市,仅仅能从这些能够建设的区块中去挑选,继续计算:


     

    挑选出了。最中心,并且同意我们进行建设的那一块地。

     

    像我上面的这个计算,你就无法通过现成的工具来直接实现了,由于你是要计算与全部区块的位置,然后再挑选出符合建设的用地,所以我上面所说的算法。你就能够自己进行编程实现了。

     

    步骤例如以下:

     

    1、计算出每个面与其它全部面的距离的总和。

    2、挑选出能够用于建设的那些地块,进行排序。

    3、取出距离总和最小的结果,作为中心要素。

     

    最后总结一下空间统计里面的中心要素与经典统计里面的中位数的异同点

     

    同样点

    不同点

    1、寻找到的数据,都是样本数据中的一个样本。

    2、从位置上来看,中位数和中心要素都是到全部其它样本近期的一个点。

    计算方法不同。

    中位数是通过排序然后通过样本在序列中的位置来确定的。而中心要素是通过与全部要素的距离总和进行计算。得到距离最小的那个要素。


    假设对文章有疑问,请关注虾神的微信公众号:



  • 相关阅读:
    Linux 下使用gettimeofday函数时已添加time.h后,还是报找不到gettimeofday函数问题
    记录linux编译opencv时报错: relocation R_X86_64_PC32 against symbol `XXXX' can not be used when making a shared object; recompile with fPIC
    记录Linux 没有声音/Gnome 没有声音输出设备问题
    c#抓屏(截屏)
    抽象类与接口区别 (收集)
    种方式遍历repeater中的CheckBox全选
    .net 发送电子邮件
    Repeater 双向排序
    通过SessionID和用户名来保证同一个用户不能同时登录
    ASP.NET页面刷新方法总结
  • 原文地址:https://www.cnblogs.com/jhcelue/p/7248246.html
Copyright © 2011-2022 走看看