日期:2023-01-12 阅读量:0次 所属栏目:社会论文
0 引言
空间统计学(spatial analysis)起始于20世纪60年代左右,经过五十几年的发展,已广泛应用于人类生活和发展的各个领域。空间现象不同于传统的统计对象,它们之间存在不同方向、不同距离成分等相互作用。传统的数理统计方法无法有效地解决空间样本点的选取、空间估值和两组以上空间数据的关系等问题。空间统计学的一些基本理论都是在传统统计学的基础上发展起来的。空间统计分析主要用于研究与地理位置有关的数据之间的空间关系,基于空间地理位置利用空间统计分析模型计算空间数据的关联度。它不仅能够进行数值计算,将数据分析与地理位置相结合,既考虑到样本值的大小,又弥补传统统计分析忽略空间方位的缺陷,更能描述和揭示空间数据中所蕴涵的独特的空间信息、关系、格局和过程。
空间统计分析主要分析的内容有基本统计量、探索性空间统计分析、分级统计分析、空间插值、空间回归和空间分类。空间统计数据在地方、区域和全国各级水平的经济发展分析过程中都发挥着重要作用 。城市的建设和发展与周边的环境是相互联系和影响的,因此城市布局的空间规律可以运用空间统计分析方法进行系统的计算。基于空间统计分析,可以通过对人均GDP的空间分布模式研究以探讨区域经济发展状况。利用GIS系统开发一个分析空间关联的功能模块,运用度量空间自相关、空间关联的一些空间统计分析方法,可将其应用于区域经济分析的各个方面。
本文首先分析了空间统计学中的基本原理,概念与经典分析方法,介绍了空间统计分析在区域社会经济分析各方面的应用实例,最后展望了空间统计分析的应用前景。
1 空间统计分析方法
空间数据基本上都具有定位、定性、时间、空间依赖、空间自相关等特征。数据间的空间关联对传统统计分析中相互独立的基本假设不成立,故在处理离散的区域社会经济数据时,需要引入空间统计分析方法。空间连续数据分析方法包括反距离加权法、简单克里格方法、普通克里格方法以及泛克里格方法。本文探讨了面状数据空间模式分析方法,研究地理位置数据间的空间依赖、空间关联或空间自相关。介绍空间权重矩阵,空间地物其位置邻近关系、确定空间权重矩阵的两个简单标准以及空间自相关的几种最著名的方法。
1.1 空间权重矩阵
通常情况下,为体现空间自相关指数,反映空间链接和空间邻近关系,常定义一个二元对称空间权重矩阵W来表达个位置的空间邻近关系。
空间权重矩阵的建立规则可以分为三类:一是根据相邻关系;二是根据距离关系;三是选择最近的个点(不论距离远近)。空间权重矩阵可以用来衡量空间位置之间的空间关联程度。
1.2空间自相关度量
空间自相关指同一变量在不同空间位置上的相关性。与区域社会经济相关的各方面因为受到地理分布上具有连续性的过程所影响而在空间上具有自相关特征。空间自相关指数能够对变量空间分布的自相关强度进行检验,空间自相关分析可以包括全程空间自相关分析和局部空间自相关分析。全程空间自相关用于分析整体范围内某一属性是否具有自相关性。局部空间自相关用于分析局部地区某一理现象或某一属性值是否具有自相关性。
1.2.1全局空间自相关
全局空间自相关一般用Moran系数和Geary比率来度量。
Moran I指数反映的是空间邻接或空间邻近的区域单元观测值的相似程度,其公式为
Moran指数I值取值一般在之间,小于零表示负相关,大于零表示正相关,等于零表示不相关。
Geary系数等方法也是可选择的统计指标,它与Moran指数是负相关关系。
对于Moran指数,可计算检验统计量标准化值Z来判断n个区域是否存在空间自相关性,如公式(4)所示。
当Z值为正且显著时,表明存在正的空间自相关,即相似的观测值趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,即相似的观测值趋于空间分散;当Z值为零时,则呈随机的空间分布。
1.2.2局部空间自相关
一般而言,全局Moran系数可以很好的反映观测值全局的空间相关情况。而观测值的局部特征往往在全局评估中被掩盖了。当需考虑局部特征时,就需要引入局部空间自相关指标。常见的指标包括:空间联系的局部指标、G统计、Moran散点图。这里主要介绍Moran图和LISA。
1) 空间联系的局部指标LISA
LISA包括局部Moran指数和局部Geary指数。局部Moran指数I 被定义为:
式中,。当I>o时表示该区域单元周围相似值的空间集聚,当I<0时,则表示非相似值的空间集聚。
空间联系的局部指标满足下列两个条件:(1)每个区域的LISA是描述其周围显著的相似值区域空间集聚程度的指标;(2)所有LISA总与全局空间联系指标成正比。
局部指数Local Moran’s I可以将空间关联模式为四种类型,分别与MORAN散点图中的四个象限相对应。正的空间关联包括两种类型:“高-高”关联和“低-低”关联。而负的空间关联也有两种类型:“高-低”关联,或者相反的“低-高”关联。
2)Moran散点图
Moran散点图以(,)为坐标点,常用来研究局部空间的不稳定性。对相邻域单元观测值的空间加权平均值(又称为“空间滞后”向量)和数据(所有观测值与均值之间的离差组成的向量)进行了可视化的二位图示,构成散点图。对Moran指数以及外值具有强烈影响的区域,可通过标准回归诊断出来。 Moran散点图中第一、三象限代表正的空间联系,第二、四象限代表负的空间联系。“Moran显著性水平图”可以由将Moran散点图与LISA显著性水平相结合得到。
1.3空间统计分析与GIS集成
地理信息系统数据库中存储了海量的数据及信息,如能与空间统计分析方法有效集成,提高其空间分析的能力,必将大大拓宽GIS数据库的知识发现和在GIS分析决策上的应用。从而更深入地探索、分析、处理和解释与经济发展相关的各地理特征之间的相互关系。完成空间统计分析与 GIS的集成,要在现有成熟的GIS系统中,嵌入空间统计分析功能模块,充分的利用GIS强大的可视化和交互功能,实现区域社会经济数据的空间化统计。
2 应用实例
人均GDP是反映区域经济发展整体水平的重要指标,故在探讨区域经济发展水平时,多采用GDP数据以了解经济发展水平的好坏。经济持续增长是一个国家和地区长期追求的目标,也是区域经济持续发展、社会福利增进和政治稳定的前提条件,历来受到各国和地区政府、学术界长期关注和普遍重视。随着理论和实践的发展,有关的理论研究也日益深化。利用空间统计学知识对经济学和经济地理学从不同的角度对经济增长和区域差异的理论做研究已成为重要应用之一。
研究区域经济差异可通过对个地域年平均GDP增长速度进行分析。这里作者将给出两个研究实例以帮助分析应用的过程与技术关键。根据计算出的全局Moran系数各个区域的MC可以大致说明空间统计分析方法计算经济区域内存在的空间关联的有效性。首先需要按要求生成一个空间权值矩阵,再计算数据集中的空间自相关性质和强度。同时进行显著性检验 (一般取0.05)。又称可进一步分析得到局部区域的Moran系数以考察各个区域之间存在的局部空间经济关联模式。
2.1 分析湖南省长沙市经济增长速度及区域差异
实验数据为1988~2009年长沙市内五区的GDP数据。实验方法为:计算各个区年平均GDP增长速度,在计算全局的Moran系数、各县市的局部MC系数,并借助局部Moran系数散点图来确定空间显著特征点。
在生成空间权值矩阵的过程中,首先采用邻近多边形列表来表示区域单元空间邻近关系。在生成邻近多边形列表后,可计算数据的Moran系数、均值及检验统计量标准化值Z,得到数据集中的空间自相关。可以得到1988~2009 年长沙市各区 GDP年平均增速之间存在显著的正的空间自相关。再计算各个区局部Moran系数及检验统计量可以考察区域经济的局部空间关系。通过与GIS集成,可将上述的空间统计方法集成到一个ArcView中使用的一个模块,为经济决策提供一个种灵活方便的、交互式的可视化支持工具。
2.2 分析1978―2001年全国各省区人均GDP水平
实验数据选取1978~2001年中国大陆31个省区的人均GDP(可比价)统计数据,采用自然对数变换方式,对人均GDP进行数据变换以减小变幅来用于空间数据统计分析。
实验方法为:先各省份的人均GDP数据计算Moran I指数,检验建立在正态分布假设之上,分析各省份人均GDP水平的空间聚集特征,再计算Moran散点图以分析对样本全局相关性影响较大的几个省份及各省份空间自相关性的正负,揭示全国经济发展区域分异的空间格局及演变过程。最后,由LISA分析来进一步探究显著性水平较高的局部空间集聚指标。
实验结果可以得到东部发展水平高,西北、西南发展水平低,且它们在空间上都趋于集聚。集聚的发达地区主要集中在以北京和天津为核心的环渤海区域,以上海为核心的长江三角洲地区,和以广州、深圳为核心的珠三角地区。
2.3 分析湖南省县级及以上城市人均GDP分布的空间分布模式
实验数据位为湖南省县级及以上85个城市的“人均GDP”的统计数据。实验方法为先提取数据总体特征,再分析分布的局部特征。
首先用spss软件对实验数据镜像快速聚类并结合标准化z分数将人均GDP指标分为5个级别,使用ArcGIS查看分类结果。计算人均GDP统计数据的Moran I指数值,随机选择999中变化进行检验,接受零假设-空间自相关性不显著的概率仅为0.0010,即认为拒绝零假设,表明全局分布具有较强的正自相关,有显著的空间聚集。再将Local Moran系数的显著水平较高的空间单元计算空间关联类型,最后得到湖南省东部、中部和西部区域城市存在的或正或负的空间关联模式。
3 应用前景
区域之间存在的扩散和极化效应,会改变区域空间的差异,传统的数理统计分析通常不能获取这些空间数据的空间依赖性和关联性。对于空间数据的分析与处理,运用传统的统计方法,会在空间关系和数值的相关性上产生很多的问题。空间统计分析方法既考虑了样本的值,又重视了样本的空间位置和空间距离,比传统统计分析方法更适合分析地理空间问题。随着观测技术和计算机技术的发展,空间信息及其处理能力已经得到了很大的提升,利用空间信息分析的理论和方法,有利于人们了解和把握地球与社会的空间运动规律。本文介绍的空间统计分析方法表明了分析区域经济的过程中地理位置的重要性,在分析空间关系的基础上进行数值的相关分析,充分考虑空间的相互作用,更为科学合理地展示了区域社会经济分布情况。基于GIS建立空间统计分析功能,采用空间统计方法研究空间关联数据,更加直观和深刻地展示出了区域经济发展的空间分布特征。
在GIS中嵌入空间统计分析模块,利用空间统计分析的方法计算得出的结果,发挥了GIS技术作为一种交互式的、可视化的决策支持工具的优势,使得空间统计学方法能比传统的分析方法更好的对区域社会经济进行研究与分析。在大多数的区域研究中,相对独立的经济区构成了分析的重要基础。在未来研究中可以研究核心区与邻近区域之间可能存在的以下几种空间经济关联:扩散效应;离心效应;极化效应;无关性。如何可以更好地理解空间因素在经济分析中的高级应用,更好地适应区域经济分析对空间统计分析方法加以改进,更好的利用GIS这门科学技术对区域经济准确高效的统计,提升空间统计精度和效率,将是今后发展的重点。
本文链接:http://www.qk112.com/lwfw/sklw/shehuiqita/158214.html下一篇:社会转型期新闻伦理的困境与突围