当前位置:
舟山市人民政府> 法定主动公开内容> 统计信息> 统计报告>
索引号 001008009005125/2022-00534
组配分类 统计报告 发布机构 市统计局
生成日期 2022-01-17 公开方式 主动公开
基于因子分析的舟山经济发展研究
发布日期:2022-01-17 来源:市统计局 访问次数: 字号:[ ]

第3期

 

概述:目前开展的多项统计监测,多是用多个指标构建指标体系,分别设置权重进行综合评价。然而在实际中不难发现部分指标间存在一定的内在联系和相关性,相应在权重设置方面存在一定缺陷。本文采用因子分析法,力求在丢失最低限度信息情况下利用较少的互不相关的变量来综合反映统计监测对象的整体水平。

 

舟山市是我国第一个以群岛建制的地级市,地处我国东南沿海,中国大陆海岸线的中心,背靠中国最富沃及最经济活力的长江三角洲地区,因海而生、向海而兴,2011-2020年十年间,舟山市牢牢抓住海洋经济发展契机,多项国家战略和重大项目落地见效,改革创新活力不断迸发,为经济发展注入源源不断的新动力。尤其是“十三五”期间,经济社会发展取得明显成效,综合实力不断增强,经济增长速度领跑全省。

2011-2020年,全市经济总体保持平稳较快增长,GDP年均增长8.7%,尤其“十三五”期间,地区生产总值(GDP)年均增长9.2%,高于全省平均2.7个百分点,位居全省各市首位。人均GDP于2018年突破10万元,2020年达13万元,是2010年的2.4倍,居全省各市前列。规上工业经济发展步伐加快,对经济贡献渐强,规上工业增加值十年年均增长19.1%。其中“十三五”期间年均增速达25.4%,快于“十二五”年均增速12.1个百分点。财政总收入十年年均增长9.9%,其中“十三五”期间,年均增长9.7%,增速高于全省平均2.2个百分点。城镇与农村常住居民人均可支配收入均呈上升态势,城乡居民收入比由2010年的1.83逐年缩减至2020年的1.63。

为了全面、客观、系统地评价和分析地方经济发展水平,往往需要利用多个指标去进行综合评价,然而在统计分析时,不难发现这些经济指标之间存在一定的内在联系和相关性,从而影响分析效果。基于这种矛盾,我们希望在丢失最低限度的信息情况下,能够利用较少的几个互不相关的变量来反映整个的经济现象。因子分析法正是能够满足这种要求,将多个指标化为少数综合指标,并对大部分信息进行分析。

本文拟就舟山市2011-2020年间的部分指标为例,利用因子分析法有效地克服传统多指标综合评价方法在处理指标高度相关和权重设置方面存在的缺陷,将指标数据进一步量化,以几个综合因子的得分大小作为经济发展综合水平的度量,对舟山市2011-2020年间的几个指标开展经济发展水平综合分析,得到2011-2020年的经济发展综合评价得分,展现十年间经济发展水平的变化情况。

1.基于因子分析的舟山市近十年经济发展量化研究

1.1因子分析的相关理论

因子分析的基本思想是将观测变量进行分类,使得同组内的指标之间相关性较高,不同组的变量之间的相关性较低,把一些具有错综复杂的变量归纳为少数几个综合因子,利用少数综合因子来说明相关变量之间复杂结构的多变量统计分析方法。

因子变量具有以下特征:数量小于原始指标数量;重新组织形成原始变量,传达原有变量的大多数信息;各因子变量之间不存在线性相关关系;具有命名解释性,便于评价和分析结果,有现实意义。

1.2因子分析的基本步骤

1.确认原始变量是否适合作因子分析

原始变量间应具有较强的相关性,计算相关系数矩阵,若相关系数矩阵中大部分相关系数小于0.3且未通过检验,变量则不适合作因子分析。SPSS软件提供了两种检验方法:

(1)KMO(Kaiser-Meyer-Olkin)检验

KMO统计量取值介于0到1之间,如果全部变量间相关系数平方和远大于偏相关系数平方和则KMO值接近1,KMO值越接近1越适合作因子分析。

(2)巴特利特球形检验(Bartlett test of sphericity)

原假设相关系数矩阵为单位阵,若得到的概率值小于规定的显著性水平(一般取0.05)则拒绝,认为数据适合做因子分析,反之则不能拒绝原假设,即数据不适合做因子分析。

2.构造因子变量

因子分析在主成分分析得到p个特征值和对应的特征向量的基础上,为减少变量数量只选取其中m个特征值和对应的特征向量,得到因子载荷矩阵。

m 的确定方法主要有以下两种:

(1)取大于1的特征值

(2)由因子的累计方差贡献率,一般应高于80%

3.利用旋转方法使因子变量具有可解释性

若每个变量在尽可能少的因子上有尽可能高的载荷(理想状态下某变量在某因子上的载荷趋于1,在其他因子上的载荷趋于0)则其实际含义更显著。

旋转方法包括正交旋转法、斜交旋转法以及常用的方差极大法。

4.计算因子变量得分

将因子变量表示为原始变量的线性组合,用因子得分函数计算因子得分。

1.3数据准备及预处理

表1  2011年-2020年舟山市各相关指标数据

年份

人均GDP

(元)

财政总收入

(亿元)

全体常住居民人均可支配收入(元)

金融机构人民币贷款余额

(亿元)

供应土地

(万亩)

全社会能耗(万吨标煤)

2011

61056

127.18

25771

1120.04

1.17

475.22

2012

66487

133.45

29018

1237.42

1.77

491.50

2013

71865

137.42

32027

1304.37

1.03

461.02

2014

77220

148.93

35330

1416.03

1.37

500.40

2015

80735

159.59

38254

1458.38

0.63

520.69

2016

92775

173.29

41564

1484.01

0.94

553.53

2017

96751

187.22

45195

1693.69

1.46

578.03

2018

106418

218.35

49217

2003.68

1.43

589.75

2019

116550

230.59

53568

2425.93

1.35

740.31

2020

130130

254.50

55830

2703.25

1.59

2853.56

基于可操作性原则,选取以上指标用SPSS 23.0软件对2011-2020年经济发展水平进行量化测度,由于收集的一些数据的量纲不同,首先将数据进行标准化处理,再对标准化之后的指标变量进行因子分析。

1.4因子分析

首先对标准化后的指标进行KMO和Bartlett球形检验,由表2可知,得到的KMO值为0.746,大于0.5接近1,同时巴特利特球形检验得到的概率P值小于显著性水平0.05,可以拒绝原假设,认为相关系数矩阵和单位阵之间有着显著差异,综合两者可知指标之间存在高度相关性,可以进行因子分析。

由公因子方差表可以看出各原始指标变量间的共同度,即各原始指标变量能被提取出的程度都大于0.8,说明因子能解释指标变量中的大部分信息,适合进行因子分析。

从方差累计贡献率表中可以看出选取2个因子时累计贡献率达到91.912%,超过80%,因此提取2个因子。

通过碎石图再次验证提取2个因子的合理性。

对数据采用最大方差法进行因子旋转后,对比旋转前后的结果,可以看出旋转后各因子方差贡献有改变,使得因子更具有解释性。

从旋转后的因子载荷矩阵可以看出:

人均GDP、财政总收入、全体居民人均可支配收入和金融机构人民币贷款余额在第1个因子上有较高载荷,分别为0.986、0.979、0.977和0.964,第一个因子主要解释了这4个变量,可解释为综合发展因子F1。

全社会能耗和供应土地在第2个因子上有较高载荷,分别为0.973和0.974,第2个因子主要解释了这2个变量,可解释为资源因子F2。

采用回归法估计因子得分系数并输出因子得分系数矩阵,由因子得分系数矩阵得到因子得分函数:

(1)F1(综合发展因子)=0.246*人均GDP+0.238*财政总收入+0.260*全体居民人均可支配收入+0.219*金融机构人民币贷款余额+0.116*全社会能耗-0.176*供应土地

(2)F2(资源因子)=-0.088*人均GDP-0.055*财政总收入-0.162*全体居民人均可支配收入+0.015*金融机构人民币贷款余额+0.225*全社会能耗+0.965*供应土地

将标准化后的数据代入以上2个表达式,并以旋转后的各因子贡献率为权重做加权平均可得到2011年-2020年舟山市经济发展水平的综合得分:

综合得分F=(0.72283*F1+0.19629*F2)/0.91912

从图2中可以更直观地看出,综合展现人均GDP、财政总收入、全体居民人均可支配收入和金融机构人民币贷款余额这4个指标变量的综合发展因子F1的得分在2013-2020年间逐年上升,于2016年起实现正得分,高于平均值,尤其是2017年起态势更为明显,并于2020年达到近十年来最高得分。

而综合展现全社会能耗和供应土地这2个指标变量的资源因子F2的得分则呈现不规则的波浪形,规律性不是特别明显,因为它的贡献率相对较低(19.6%),对综合得分未起到太大影响。在2012年达到近十年来的最高得分,从原始数据可以看出这2个指标变量在2012年较有较大取值。此外波动较大的拐点则分别出现在2013年、2015年和2019年,从原始数据看供应土地量和全社会能耗在这些年份有较大波动现象。“十三五”期间的最高得分出现在2020年,主要与浙石化投产大量使用能源影响有关。

综合得分F在2013年和2015年数值较其余年份略低,2016-2020年间逐年上升且较2011-2015年有较为明显的起势,可见“十三五”期间得分远远高于“十二五”时期,全市经济发展水平在“十三五”期间有较大的提升,同时2019年和2020年两年经济发展得分较高,与经济发展宏观趋势较为吻合。总体来看综合发展因子得分和综合得分在10年间整体呈现相近的稳定上升趋势,这也是由于综合发展因子对综合得分的贡献率达72.3%,基本上涵盖了大部分原始指标变量的信息,可以代表大部分因素的影响程度。

2.结论和思考

本文以舟山市2011年至2020年的相关指标数据为例,利用因子分析法借助SPSS软件将数据进一步量化,以2个因子的得分大小作为经济发展综合水平的度量,得到2011-2020年的经济发展综合得分,展现十年间经济发展水平的变化情况。但也可以看到,部分年份的得分有较大起伏,其原因一是受限于海岛自身经济体量总体较小,在某些特殊原因影响下,个别指标在个别年份波动较大。如2010年2011年,受民营银行大量集中入驻舟山影响,金融机构存贷款增长迅速;2018年2020年,受浙石化一期和二期项目部分贷款拉动,增长较快。2018年,受鱼山海域使用金、大皇山矿业权收益等一次性收入影响,财政总收入和一般公共预算收入快速增长。二是部分指标涉及统计口径变化或数据修订,数据衔接性和可比性较差,较难进行连续年份间的利用比较和长远的分析,检测样本合计为10年的数据,样本量相对较小,导致模型的延伸研究受到限制,因此可能会使呈现结果的科学合理性受到影响;且在指标的选取过程中,存在一定的主观因素,在研究的过程中还存在着不严谨之处。