基于因子分析和聚类分析的重庆市经济发展状况研究

来源:岁月联盟 作者:唐 敏 时间:2010-06-25
摘 要:基于因子分析和聚类分析法,对重庆市40个区、县的状况进行了定量化综合评价。在分析重庆市经济发展不平衡的特点和原因的基础上,探讨了经济全面协调发展的对策和思路。?
关键词:重庆市;因子分析;聚类分析;经济发展状况?
  
  重庆是典型的大城市、大,其经济发展仍然处于非均衡发展的进程,各区县经济发展水平具有明显的地域差异。随着城乡综合配套改革试验区这一重大战略决策的实施,重庆的发展迎来了千载难逢的机遇。重庆各区、县只有对当前的经济发展状况有一个客观、全面的了解,才能更好地实现有效的区域整合。?
  近年来,社会统计分析软件在社会经济统计、工程技术以及教学科研等领域的研究已取得广泛应用。本文以重庆市内40个区县为研究对象,结合重庆市地域特点,综合运用多元统计中的因子分析和聚类分析,较大限度地避免人为因素所产生的偏差,对全市经济发展状况进行了定量化综合评价。在分析重庆市经济发展不平衡的特点和原因的基础上,探讨了经济发展的对策和思路,以期对未来经济发展状况的改善起作用。?
  
  1 经济发展状况评价指标体系的构建?
  
  国内外学者对城市经济发展状况的评价指标体系进行了不少研究,但由于城市经济系统本身的复杂性,以及城市经济发展状况评价指标体系的理论尚有待深入,所以目前还没有一种公认的、可靠的评价方法。本文在遵循性、全面性、可操作性原则的基础上,参阅相关并结合重庆市现状,构建了以下影响城市经济发展状况的8项指标作为评价指标体系:地区生产总值(万元),总产值(万元)、公路货运量(万吨)、建设与改造投资(万元)、社会消费品零售总额指数(上年=100)、城乡居民储蓄(万元)、城镇居民最低生活保障人数(人)、专业教师数(人)作为分析样本,数据来源——重庆统计年鉴[2006]。所采用的分析软件是SPSS13.0。?
  
  2 模型方法概述?
  
  2.1 因子分析?
  因子分析属于多元分析中处理降维的一种统计方法,它是主成分分析的推广和发展,它也是将错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类。?
  Z因子分析的数学模型。?
  通常针对变量作因子分析,称为R型因子分析,另一种对样品作因子分析,称为Q型因子分析。R型因子分析写成数学的形式,就是下面的模型:假定随机向量X满足:?
   X=A•F+ε?
  其中A是p×m的常数矩阵,称为因子载荷矩阵;F=(F?1,…,F?m)是不可观测的向量,F称为X的公共因子;ε称为X的特殊因子,通常理论上要求ε的协方差阵是对角阵,ε中包括了随机误差,且?
  ⅱ)Cov(F,s)=0 即F和ε是不相关的;?
  ⅲ)D(F)=I?m即不相关且方差皆为1。?
  因子分析的目的就是通过模型X=AF+ε以F代替X,由于m  2.2 聚类分析?
  聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法,在统计分析的应用领域已经得到了极为广泛的应用。?
  聚类分析至今,有许多种不同的聚类方法,其中应用得最多、最成熟的方法为系统聚类法,也是本文将采用的方法。其思路为:首先将每个数据对象各视为一类,根据类与类之间的距离或相似程度将最相似的类加以合并,再新类与其它类之间的相似程度,并选择最相似的类加以合并,这样每合并一次就减少一类,不断继续这一过程,直到所有数据对象合并为一类为止。?
  
  3 实证分析?
  
  3.1 因子分析结果?
  运用因子分析法,借助SPSS对以上数据进行分析处理,在处理过程中采取以下步骤:(1)遵循系统性、科学性、可操作性的原则,对所有指标的原始数据进行标准化,消除量纲的影响。由标准化后的数据求协方差矩阵,即原始数据的相关矩阵,判断能否进行因子分析;(2)根据公共因子在变量总方差中所占的累计百分比例,一般为大于85%规则,确定描述数据所需要的公共因子数;(3)公共因子的命名和意义解释。运行结果如下:?
  在表2中,按照提取原则即特征值大于1,选入3个主成分,其方差累计贡献率达88.08%,即反映了原始信息的88.08%,这三个因子就可以解释原始数据的大部分信息了。我们将这3个主成分作为评价重庆市40个区、县状况的综合参量。?
  从表3可以看出,地区生产总值、总产值、城乡居民储蓄、公路货运量等四个指标与第一主成分的相关系数较高,主要反映了经济总量状况及其环境状况;专任教师数在第二主成分上的载荷较大,即与第二主成分相关程度较高;消费总额指数在第三主成分上的载荷较大,即相关系数较高。因此我们可将主成分命名如下:?
  第一主成分:产出主成分;?
  第二主成分:主成分;?
  第三主成分:消费主成分。?
  把我市40个区、县的经过标准化的数据(X?1,X?2,…,X?8)代入对应的线性模型,可以得到各地区的主成分值,并以各主成分的方差贡献率为权重进行加权汇总,得到综合得分F(其中F=0.0113×F?1+0.1412×F?2+0.7821×F?3)。?
  3.2 聚类分析结果?
  运用SPSS的系统聚类法,根据各个地区的综合得分值进行分类,共将重庆市40个区、县划分为三类:第一类渝中、九龙坡、江北、双桥、沙坪坝、大渡口、南岸、渝北、万盛、长寿;第二类巴南、北碚、梁平、永川、黔江、大足、铜梁、合川、荣昌、南川、潼南、江津、酉阳、武隆;第三类壁山、万州、巫溪、巫山、忠县、丰都、开县、秀山、綦江、石柱、涪陵、奉节、彭水、云阳、垫江、城口。?
  
  4 结论和对策?
  
  通过上述分析,不难看出:?
  (1)重庆市40个地区社会经济发展存在着明显的差异:第一类区县大部分分布在都市发达经济圈,第二、三类区县几乎均处于渝西经济走廊与三峡库区生态经济区。?
  (2)渝中区综合经济实力得分远远高于其他9个,这说明渝中区已成为整个重庆经济的发展极。其中江北、沙坪坝、九龙坡、南岸、渝北五区在地理位置上和渝中区相临,受经济辐射作用应影响,经济综合实力较强;巴南区、北碚区虽然位于都市发达经济圈,有着特殊的区位优势,但是由于受周边江北、沙坪坝等五区的经济回波效应影响,抵消了经济的辐射作用,所以综合实力得分较第一类地区低;壁山、万州等l6个区县大多为边远山区和少数民族地区,由于这些地区的不发达,这些地区的专业优秀人才大多流向一、二类地区,因此使得这些地区与第一、二类地区间经济发展差距有扩大的趋势。?
  (3)基于较大地区间经济发展的差距,重庆市要对以往三大经济圈的发展战略加以完善、发展和提升,切实贯彻并实施“一圈两翼”的新战略。努力增强一小时经济圈的带动辐射能力,加快以交通和水利为重点的基础设施建设,增加区域发展潜力。积极发展特色产业,加快区域经济社会发展,逐步缩小市域的城乡差距和区域差距,形成大城市带大的整体推进格局。?
  
  ?
  [1]?陈道平,刘伟.基于微小型汽车市场的影响消费者购买行为的消费者特性分析[J].消费经济,2005,(6).?
  [2]?唐敏,陈道平.上证A股与B股协整关系的实证研究[J].当代经济,2008,(2).?
  [3]?赵喜仓,吴梦云.江苏城市社会经济发展状况实证分析[J].统计研究,2003,(3).