




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ab s t r a c t ab s t r a c t w e u s e t h e p r i n c i p l e c o m p o n e n t a n a l y s i s ( p c a ) a n d c l u s t e r a n a l y s i s m e t h o d s i n m u l t i v a r i a t e s t a t i s t i c a l t h e o ry t o a n a l y s i s s o m e e c o n o m i c a l d a t a f o r t h e d i s t i n c t i o n s o f t i a n j i n i n 2 0 0 4 , a n d re a c h s o m e u s e f u l c o n c lu s i o n s . d i ff e re n t g o v e rn m e n t s s h o u l d p a y m o r e a t t e n t i o n t o t h e f a c t o r s w h i c h w o u l d a ff e c t t h e d e v e l o p m e n t w h e n d e v e l o p i n g . w e u s e t h e p c a m e t h o d t o a n a l y s i s t h e fi n a n c i a l a n d d o m e s t ic i n v e s tm e n t f a c t o r s a n d o b t a i n s o m e p r i n c i p le c o m p o n e n t s . a t t h e s a m e t i m e , w e u s e t h e c l u s t e r a n a l y s i s m e t h o d t o c l a s s i 斤t h e d i s t i n c t i o n s t o d i ff e r e n t s e t s , s o w e c o u ld m a k e d i ff e r e n t p o l i c i e s f o r d i ff e r e n t d i s t i n c t i o n s w i t h d i ff e r e n t b a c k g r o u n d s . k e y wo r d s : p r i n c i p l e c o m p o n e n t a n a l y s i s , c l u s t e r a n a l y s i s , c l a s s i f i c a t i o n 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定, 同意如下各项内 容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学 位论文的印刷本和电子版, 并采用影印、缩印、 扫描、 数字化或其它手段保存论文; 学校有权提供目 录检索以及提供 本学位论文全文或者部分的阅览服务; 学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版; 在不以 赢利为目的的 前 提下,学校可以适当 复制论文的部分或全部内 容用于学术活动。 学 位 论 文 作 者 签 名 : 书电 o 乙年11月z f 扫 经指导教师同意, 本学 位论文属于保密,在年解密后适用 本授权书。 指导教师签名: 劫 戊 行 学位论文作者签名: 杯几 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 南开大学学位论文原创性声明 本人郑重声明: 所呈交的学位论文, 是本人在导师指导下, 进行 研究工作所取得的成果。 除文中已经注明引用的内 容外, 本学位论文 的研究成果不包含任何他人创作的、 己公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体, 均已 在文中以明确方式标明。 本学位论文原创性声明的法律责任 由本人承担。 学 位 论 文 作 者 签 名 : 今 乙 凡 z 0 0 年t 1 月丁 日 第一章引言 第一章引言 数学的一个重要作用是应用,而数理统计学是一门应用性极强的科学,在 教育学、医学、 气象学、 环境科学、地质学、经济学、农业、工业、社会科学 等诸多领域中 经常利用多元分析的方法将统计数据进行分析、处理, 进而得出 一些有说服力的结论,有助于今后的发展决策。 天津市被国务院定位为中国北方经济中心,国际港口城市和生态城市,滨 海新区开发开放纳入国家总体发展战略布局,为此,天津市正在全面推进一大 批重点项目 的建设,如能在规划过程中注重对以 往经验的总结,科学分析, 准 确定位, 严格设计,精心实施,规避风险,减少失误,将会有利于国家, 造福 于百姓。 本文将利用多元分析中的聚类分析和主成分分析的理论,对全市财政收支 与企业改革发展,内 联引资等统计数据进行分析、归纳、总结,以 期对今后经 济的协调发展、收支状况、合理定位、综合布局等方面具有辅助和指导作用。 第二章 理论支持 第二章 理论支持 我们考虑到数据的组成与结 构, 采用多元统计的相关方法和原理对统计年 鉴里面的 相关数据进行一定的分析,作出合理的解释和判断,为下一步政策和 目 标的制定提供参考. 我们主要分析区县级政府的 一 般财政收支状况和内联引资 状况, 这些数据 都是对天津市各个区县在某些指标上的一些数值和评价。因此我们可以 使用主 成分分析来总结出影响各区县发展水平和潜力, 造成区县之间 差异的主要因素, 这样通过下一步的努力.可以 使得各区县优势得以 继续发挥,同时使得各区县 水平趋于一致。 针对数据, 我们可以 使用聚 类分析把各个区县按照一定的要求进行分类, 这样我们可以根据自己的需求搜寻出比 较合适的一组区县,进行进一步的投资 等。同时可以获知相近水平的区县的一些共同特征。 第一节 数据的处理 考虑到数据的可获得性, 本文选取了天津各区县2 0 0 4 年度的统计年鉴数据 来进行实证研究。 这里 把每个区县看成是一 个样品, 样品 数n . 假设每个样品 测得p 项指标 变 量 x , , . . , 弋, 得 观 测 数 据、 ( i = 1 , 2 , - 二 n ; 1 = 1 , 2 , . - - , p ) , 通 常 列 成 表 2 - 1 的 形 式 表中 样 本 均 值 x ! = 1 1 xy,n ,_, , 一 ,2 , ,p 样 本方差 $ a =共t ( 一 -x _ x ,)1 rs一i, . 1 = 1 , 2 , . . . , p, 样 本 标 准差气”兴t o , - rs一i福 s ) 2 , l = 1 , 2 , * - , p 第二章 理论支持 表 1观测数据 ty f1p x二x,二x p x(, ) x(, ) x 气 . 石 i“ 气 p x i,凡 二今 x ,x y 二z 4 , 均值 气 ,x i “凡 标准差 s , “s i“ 今 2 . 1 . 1 无量纲处理 实际问题中,对于我们观测到的不同的变量往往有不同的量纲,不同的量 级单位,不同的取值范围,为了便于比较以及要消除不同的量纲,不同的量级 单位, 不同的取值范围对评测结果的不良影响, 我们必须对数据进行变换处理。 利 用随 机 变量 标 准 化 的 方 法: 若e ( x ,) = a , v - ( x) = u , , 即 令 戈 =( i 二 1 , 2 , . 二 , p ) , 则 数 据 标 准 化 变 换 公 式 : 二 , = l - l , i = 1,2 ,.-.,n ) . s j 1 j = 1 , 2 , - - - , p ) 变换后的数据, 每个变量的样本均值为0 ,标准差为1 , 而且标准化后的数据 x y , 与 变 量 的 量 纲 无 关 第二章理论支持 表 2标准化后的观测数据 tt llq x 1*x x o x ( ,) x a ) x ( ) 气 1凡 i 二凡 v x ;1“ x n 二x p x 1 二x f“ x ,p 均值00二 ,0 标准差11二1 2 . 1 . 2 计算相关矩阵r 若令 s y= 月 dx a 一 x x x n i , .i= 1 , 2 , . . . , p t - 1 s = 1n - 1 客 (y u) 一 x x x (1) 一 ” 一 (s,.) . 定义样本相关阵r 为: 弓 l r = ( r v ) p = p其中 r . s y ( i , l = 1 , 2 , . . ., p ) 。 r . 1 s与 于是把样本相关阵作为总体相关阵的估计,其计算公式如下 1 月 r = ( s y ) p = , 二 ( n一1y l , x e x n ) p =p . r 一1 4 第二章理论支持 第二节具体使用的方法 2 . 2 . 1 主成分分析法 主 成分概念首 先由 k a r l p a r a o n 在1 9 0 1 年引进,1 9 3 3 年 h o t e l l i n g 将其加以 推广形 成t主 成分分析法 ( p r i n c i p a l c o m p o n e n t a n a l y s i s ,简 称p c a ). 主成 分分析是利用了降维的思想,将多指标问题重新组合成一组新的相互无关的几 个综合指标来替代原来的指标,同时根据实际需要从中提取几个较少的综合指 标( 主成分) ,尽可能多地反映原来指标的信息,虽然这样做会损失部分信息, 但由于我们抓住了主要矛盾,并从原始数据中进一步提取了某些新的信息。因 而在某些实际问题的研究中收益大于损失。这种方法使我们既减少了变量的数 目又抓住了主要矛盾,从而有利于问题的分析和处理。在本文中,将使用主成 分 法把罗列的 指标简化为少效 几个主成 分,以 便于进行定量分析。 过程 如下: 2 . 2 . 1 . 1 求 相关矩阵r 的特征 值和特征向 量 解特征方程林 i - 川 = 0 ,通常用雅可比( j a c o b i ) 法, 求得特征值 a _ , _ . . 2 : a p 0 及 相 应 的 正 交 单 位 特 征 向 量 a , ,* * , a p o 2 . 2 . 1 . 2 计算各主成分的贡献率及累计贡献率 入 口宁一问 定 义 1 : 主 成 分z t 的 贡 献 率 为 : 注意 定义2 - 定义3 : :每个主成分的贡献率代表了原数据总信息量的百分比。 .人 k艺间 凡 口七白问 4 . , 几累计贡献率为: 刃 个 主成分z . . . , z . 对变量x , 的 贡献率: ro r (w ) 一 j p z ( z戈 卜ia k a z 几 第二章理论支持 2 . 2 . 1 . 3 确定主成分: 设z i ,z 2 , . . z , 为p个主成分, 我们的目 标是用尽可能少的主成分 z , , z z . . ., z . ( n + 。 的 情 况 , 这 个 距 离 有 助 于 克 服 各 指 标 之 间 量 纲 的影响,但没有考虑指标之间的相关性。 计 算 任 何 两 个 样 品 气 与 毛 之 间 的 距 离 d o , 其 值 越 小 表 示 两 个 样 品 接 近 程 度越 大 , d u 值 越 大 表 示 两 个样 品 接 近 程 度 越 小. 如 果 把 任 何 两 个 样品 的 距 离 都 算出来后,可排成距离阵d: d , z , . . . d i . d 2 2 , - - d , d 2 . . . d m 风凤卜卜风 d= 其 中 d = d 22 = 一 d _ 二 。 。 d 是 一 个 实 对 称 阵 , 所以 只须 计 算 上 三 角 形 部分或下 三角 形部分即 可。 根据d 可对n 个点进 行分类, 距离近的点归为一 类, 距离远的点归为不同的类。 本文选用欧氏距离为样品之间的点距离。 2 . 2 . 2 . 2 聚类分析 . 选择聚类方 法 常见的聚类分析方法有系统聚类法、动态聚类法和模糊聚类法等。本文采 第 二章 理论支 持 用在实际应用中使用比较广泛的系统聚类法分析的方法,根据样本间距离及类 间距离的 定义, 逐步 合并类, 减小 类的 数目 , 达到聚类分析的目 标。 类与类之间用不同的方法定义距离,就产生了不同的距离递推公式,不同 的系统 聚类方 法。 在类间距离的 选择上, 有最短 距离 ( s i n g l e l i n k a g e ) 、重 心 法 ( c e n t r o i d m e t h o d ) 、 类间平均距离( a v e r a g e l i n k a g e)和离差平方和法 ( w a r d ) 等方 法, 本文将采用类间 平均距离 进行聚类。 l a n c e 和 w i l l i a m s 于 1 9 6 7 年 首 先 给 出 了 统 一 距 离 递 推 公 式 。 以 下 用 汽 表 示 样 品 x , 与 , 之 间 距 离 , 用 d o 表 示 类 g , 与 g , 之 间 的 距 离 . 设 g p 与 g q 合 并 为 g , : g , = g , , g , 卜n p , n q , n , ( n , = n , + n 9 ) 是 g p ,g q , g , 中 包 含 的 样 品 个 数 . 则 新 类 g与 其 他 类 g k (k m p , q ) 的 平 方 距 离 为 : d , 2 = a p d , k 2 + a gd q. 2 + ,6 d p g2 + y l d p k , 一 d,21 . 其 中 参 数 a , , a q a , y 在 不 同 的 系 统 聚 类 方 法 下 有 不同 的 取 值 , 见 下 表 表3系统聚类法的参数表 方法 a .a q y y 最短距离法 重心法 类平均法 1 / 2 n p i n , n p f n , 1 / 2 n . i n , n . i n , 0 一a p a q 0 1 / 2 0 0 离差平方和法 n p + n k n q 十 n . n , + n k n , +n k _n . n , 十n k 0 与类平均法相比,最短和重心法是 “ 空间浓缩”,即并类的距离范围小, 区 别类的灵敏 度差; 其他方法是 “ 空间 扩张”, 即并 类距离范围 大,区别 类的 灵 敏度强。随着统计分析越 来越广泛的 应用和计算 机软 件的 不断发 展, 现己开 发出 一整套的 统计分析软件, 如s a s , 因此聚类分 析的 计算过程 可方便地通过软 件上的模型来完成。 . 类数的确定 确定分类数是聚 类分析中 迄今为止尚 未完全解决的问题 之一, 主要的障碍 是对类的结构和内容很 难给出 一个统一的定 义。 通常情况下, 可以 由以下 三种 方法中选择一个或综合几个方法来确定: ( 1 ) 由谱系聚类图, 根据阀值确定;( 2 ) 第二章 理论支持 由 样本的 散点图 确定;( 3 ) 由 若 干统计量确定。本文中 使用的 是方法( 1 ) e . 分析聚类结果 对所得的分类结果结合问题的实际背景进行合理的分析和解释。 第三章数据及分析 第三章数据及分析 我们使 用了 多元分 析中的聚类分析 和主成分分析, 分析了 统计年鉴 提供的 数据。 数据结 构如下, 详细的数据及本 文分析中 用到的 变量的含义请参见附 录。 我们使 用了 1 8 个区 县, 每个区县考虑了1 5 个指标: 一般预算财政收 入、 增值 税、营业税、个人所得税、城市维护建设税、农业各税、企业所得税、其他各 项、一般预算、基本建设、支援农村、教育事业费、医疗卫生支出、社会保障 补助支出、公检法司支出。 下面就是我们的一些分析结果: 使用聚类分析对于区县级一般预算财政收支( 2 0 0 3 年) 数据分析。 f o r d a t a : 3 6 2 2 1 : 1 2 s u n d a y , s e p t e m b e r 1 2 , 2 0 0 6 2 8 t h e c l u s t e r p r o c e d u r e a v e r a g e l i n k a g e c l u s t e r a n a l y s i s e i g e n v a l u e s o f t h e c o r r e l a t i o n m a t r i x e i g e n v a l u e d i f f e r e n c e p r o p o r t i o n c u m u l a t i v e 1 7 . 9 0 6 9 6 5 5 3 5 . 4 9 4 7 7 5 4 9 0 . 5 2 7 1 0 . 5 2 7 1 2 2 . 4 1 2 1 9 0 0 5 0 . 6 7 4 0 1 9 3 6 0 . 1 6 0 8 0 . 6 8 7 9 3 1 . 7 3 8 1 7 0 6 8 0 . 4 1 8 6 2 4 7 8 0 . 1 1 5 9 0 . 8 0 3 8 4 1 . 3 1 9 5 4 5 9 1 0 . 8 1 0 6 9 2 5 5 0 . 0 8 8 0 0 . 8 9 1 8 5 0 . 5 0 8 8 5 3 3 6 0 . 1 8 0 1 1 9 5 7 0 . 0 3 3 9 0 . 9 2 5 7 6 0 . 3 2 8 7 3 3 7 9 0 . 0 5 5 1 7 5 0 3 0 . 0 2 1 9 0 . 9 4 7 6 7 0 . 2 7 3 5 5 8 7 6 0 . 0 8 5 4 2 5 0 7 0 . 0 1 8 2 0 . 9 6 5 9 8 0 . 1 8 8 1 3 3 6 9 0 . 0 4 4 7 9 0 5 1 0 . 0 1 2 5 0 . 9 7 8 4 9 0 . 1 4 3 3 4 3 1 7 0 . 0 6 5 3 7 5 6 8 0 . 0 0 9 6 0 . 9 8 8 0 1 0 0 . 0 7 7 9 6 7 4 9 0 . 0 1 9 8 9 4 2 8 0 . 0 0 5 2 0 . 9 9 3 2 1 1 0 . 0 5 8 0 7 3 2 1 0 . 0 2 9 2 6 3 7 5 0 . 0 0 3 9 0 . 9 9 7 0 1 2 0 . 0 2 8 8 0 9 4 6 0 . 0 1 5 2 1 5 1 4 0 . 0 0 1 9 0 . 9 9 9 0 1 3 0 . 0 1 3 5 9 4 3 2 0 . 0 1 1 5 3 3 7 3 0 . 0 0 0 9 0 . 9 9 9 9 1 4 0 . 0 0 2 0 6 0 5 9 0 . 0 0 2 0 6 0 5 9 0 . 0 0 0 1 1 . 0 0 0 0 1 5 0 . 0 0 0 0 0 0 0 0 0 . 0 0 0 0 1 . 0 0 0 0 t h e d a t a h a v e b e e n s t a n d a r d i z e d t o m e a n 0 a n d v a r i a n c e 1 r o o t - m e a n - s q u a r e t o t a l - s a m p l e s t a n d a r d d e v i a t i o n=1 第三章数据及分析 r o o t - m e a n - s q u a r e d i s t a n c e b e t w e e n伪s e r v a t i o n s二5 . 4 7 7 2 2 6 c l u s t e r h i s t o r y rcl17 - d u s t e r s j o i n e d - 佣 5 o b 6 o b 9 o b i 佣 3 佃 2 o h i o c l 1 4 (笼 旧 c l i o c l 1 6 以 1 2 o 月 c l 6 c i a c l 5 c l 2 砚 抽 r e 日 妞 q d i s t ( 阳1 5 2 o b 7 2 0 8 1 4 2 (旧1 1 2 以 1 1 3 2 o b 4 2 刀1 2 2 c l 1 3 4 c l 1 5 3 c l 1 7 6 c l i 1 4 0 8 1 7 3 c u 1 0 c l 9 6 0 8 1 8 7 c 口1 7 0 8 1 6 1 8 e 0 . 2 9 7 3 0 . 3 3 0 1 0 . 3 4 4 0 . 4 0 0 8 0 . 4 2 0 8 0 . 4 4 2 5 0 . 4 6 2 6 0 . 5 1 4 5 0 . 5 4 9 6 0 . 5 6 3 5 0 . 5 6 4 8 0 . 6 7 8 4 0 . 7 2 2 9 0 . 9 3 0 8 0 . 9 8 3 4 1 . 1 3 4 5 1 . 3 1 2 8 泊匕通,口n,二uo口0口月了口勺月,nj口.且 .几11,人.人1上11 1 2 第三 章 数据及分析 日了 口 日 妇:3 6 2 .己口 _ -u -. r cl u. t .r 圈刚.哪因哪困面哪哪困叫0 .1:叫国叫 res一一州 尸 ,- 了, 一 . - 丫 - 一 -, - -丫 - - r- -, 一res一 reses节ee ee . e.一介.6 . . 0. 1 1. 8 . 7.一1 . e, 。 .1 .1一 ,1 . /二 a . . . . . 口 d l rt-臼 吐 . . . , c i . . . 分析结论如下: 依照这个数据所给的信息,考虑把这些区县分成3 类: l 宝坛、静海、 大港、 蓟县、 汉沽、宁河、 河北、 河东、 红桥、 津南 h: 北辰、 东丽、 武清、 和平、 河西、南开、 西青 i i i :塘沽 我们很容易发现,这三类代表了三类地区的一般收入支出水平。第工 类中的 各 个区 县处于待开发和开发中 的阶 段, 因 此收 入和支出 水平比 较低而 第工 h类中 的区县则开发比较早,因此是比较高的。 下面我们再按照内联引资情况( 2 0 0 3 年) 来对区县进行聚类分析。 数据结构如下:仍然是针对1 8 个区县,每个区县考虑新签协议数、协议合同金 额、 实际 利用内 资金额、 外地投资、国 家部门 投资 这5 个指标, 详细的 请参见附 录中所列。 第三章数据及分析 f o r d a t a : 5 0 22 1 : 1 2 s u n d a y , s e p t e m b e r 1 2 , 2 0 0 6 2 9 t h e c l u s t e r p roc e d u r e a v e ra g e l in k a g e c lu s te r a n a ly s is e ig e n v a l u e s o f t h e c o r r e la ti o n ma tr ix e ig e n v a l u e d iff e r e n c e p ro p o rt io n c u m u l a t i v e 3 . 0 5 7 5 9 6 8 4 1 .8 5 0 1 2 2 0 7 0 . 6 1 1 5 0 .6 1 1 5 1 . 2 0 7 4 7 4 7 7 0 .5 3 1 8 8 5 8 4 0 . 2 4 1 5 0 .8 5 3 0 0 . 6 7 5 5 8 8 9 3 0 .6 1 6 2 4 9 铭0 . 1 3 5 1 0 .9 8 8 1 0 . 0 5 9 3 3 9 4 5 0 .0 5 9 3 3 9 4 5 0 . 0 1 1 9 1 .0 0 0 0 0 . 0 0 0 0 0 0 0 0 0 .0 0 0 0 1 .0 0 0 0 t h e d a ta h a v e b e e n a -d -d iz e d t o m e a n 0 a n d v a r ia n c e 1 r o ar - me a n -匆u a rc t o ta l - s a mp l e s ta n d a rd d n画。 。 二1 r o ar - me a n -翻u a rc dis ta n c e b e twe e n o b s e rva ti o n s - 3 . 1 6 2 2 7 8 clu s t e r 州 目 。 尽 - clu s t e r s j o i n e d - o b 3 o b 7 c l 1 6 o b 5 obi i o b i o b 2 c l 1 2 c l 1 0 c l 9 c l 1 1 c l s c l 6 c l 5 c l 4 o b s c 13 曰t e q o b1 2 o b1 4 0b g ob 1 5 o bi s cl1 7 o b 4 c l 1 5 ob 6 c l 1 3 ob 1 7 c l 1 4 c l 7 ob i o ob 1 3 o b1 6 c l 2 n o r mt rms i d i s t e 2 0 . 1 0 1 2 2 0 . 1 0 8 1 3 0 .1 5 1 8 2让1 5 3 3 2 0 . 1 5 3 7 3 0 .1 6 8 8 2 0 .2 5 5 9 6 0 2 7 6 2 7 0 .3 5 5 6 9 0 .3 6 0 9 3 0 . 5 0 0 4 1 1 0 .5 3 7 9 1 4 0 .6 2 0 1 1 5 0 . 7 7 3 4 1 6 1 .0 6 6 3 2 1 . 5 3 4 1 1 8 1 . 7 9 4 姐 似17、”14”12”10,.76,432 1 4 第三章数据及分析 比 由t a : 印2 山 . d 口 . r n t im a c l u s t e r 口口 阅叫回国口曰叫吐叫吐哪哪哪口哪 r-一- -r一一- 下一一一-一 丁一一一- 丁一一一一一 丁一一1一 . 一 一1 一1: 盆: 4:1: 11 :1 . 21 .41 :t . 1 6 2 1 . 4 6 . 1 1 . 1 1 . 1 1 . 2 1 .4 1 . 9 如 . 网 口 d i s t m m 时 . . , l l t e m 分析结论如下: l 宝坛、大港、河东、南开、河西、河北、静海、西青、汉沽、宁河、北 辰、东丽、武清、红桥 h:津南 i i i :和平、塘沽 这一 层次的分 析则是按照各个区 县在企业发 展方面来分析,实际 上代表了 目 前以及 将来一 段时 期内 某个区县在 企业发展和 吸引外资方面的潜力。 和平区 是天 津市的 中心地带,商 机必定比 其 他区县占 先。因此理 所应当 会 有更大的 潜力。 而 塘沽区由 于港口 优势,以 及开发区 优势,对于外资 有很强吸 引力。因 此这两个区 分在一类 ( 第i i i 类)。 而宝 坛、静海等周边临近的 区县目 前也处于被开发的阶段,比如兴建开发区和交通枢纽等。 第三章数据及分析 我们综合上面两组数据的数据一起进行聚类分析: f or a l l 2 1 : 1 2 s u n d a y , s e p t e mb e r i 之2 0 0 6 3 0 t h e c l us t e r p roc e d u r e a v e ra g e l in k a g e c lu s te r 劫 吻5 七 e i g e n v a lu e s o f t h e c orre l a ti o n ma t r i x e ig e n v a lu e d iff e re n c e p r o p o rt io n 1 9 .2 9 0 2 0 9 1 8 5 . 7 8 1 8 7 8 9 5 0 .4 6 4 5 2 3 . 5 0 8 3 3 0 2 3 1 . 1 2 6 2 5 3 7 7 0 . 1 7 5 4 3 2 . 3 8 2 0 7 6 4 6 0 . 8 0 0 3 0 9 9 9 0 . 1 1 9 1 4 1 . 5 8 1 7 6 6 4 8 0 . 4 6 0 0 7 3 6 1 0 .0 7 9 1 5 1 . 1 2 1 6 9 2 8 7 0 . 3 8 4 2 8 0 5 8 0 .0 5 6 1 6 0 . 7 3 7 4 1 2 2 9 0 . 2 4 7 8 2 7 1 7 0 .0 3 6 9 7 0 . 4 8 9 5 8 5 1 2 0 . 1 9 1 3 9 1 8 4 0 .0 2 4 5 8众2 9 8 1 9 3 2 8 0 . 1 0 8 9 4 3 5 1众 0 1 4 9 ,0 . 1 8 9 2 4 9 7 7 0 . 0 3 0 9 2 2 1 9 0 .0 0 9 5 1 0 0 . 1 5 8 3 2 7 5 8 0 .0 7 3 1 0 3 7 6 0 .0 0 7 9 1 1 0 . 0 8 5 2 2 3 8 2 0 . 0 1 3 6 3 6 5 4 0 .0 0 4 3 1 2 0 . 0 7 1 5 8 7 2 9 0 . 0 2 2 0 4 8 4 4 0 .0 0 3 6 1 3 0 . 0 4 9 5 3 8 8 4 0 . 0 2 2 8 9 0 6 1 0 .0 0 2 5 1 4 0 . 0 2 6 6 4 8 2 4 0 . 0 2 1 2 6 6 4 2 0 .0 0 1 3 1 5众阅 5 3 8 1 8 1 0 . 0 0 1 5 3 7 研o .o d 01 1 6 0 . 0 0 3 8 4 4 1 4 0 . 0 0 2 9 1 1 5 5 0 .0 0 0 2 1 7 0 . 0 0 0 9 3 2 5 9 0 . 0 0 0 9 3 2 5 9 0 .0 0 0 0 1 8 0 . 0 0 0 0 0 0 0 0 0 . 0 0 0 0 0 0 0 0 0 .0 0 0 0 1 9 0 .0 0 0 0 0 0 1犯0 . 0 0 0 0 0 0 0 0 0 .0 0 0 0 2 0气 峨 洲 洲 洲 洲 1 1洲 怕刃一 以 i c 旧 c u m u la t i v e 0 .4 6 4 5 0 .6 3 9 9 0 .7 5 兜 0 .8 3 8 1 0 。8 4 2 0. 9 3 1 1 0. 9 5 5 6 0. 9 7 0 5 0. 9 7 9 9 0. 9 8 7 8 0 .9 9 2 1 0 .9 9 5 7 0 . 98 2 0 .9 9 9 5 0 .9 9 9 日 l .0 以 旧 ! , 洲 洲 幻 1 .01 洲 洲 1 .1洲 洲 0 1 . 1 洲 洲 幻 t h e d a t a h a v e h - mwa i7 m 协 .on e 0 a n d v a ri a n c e 1 r o o t - m e a n - s q u a re t o t a l- s a m p l e s t a n d a r d d e v i a t i o n = 1 r o o t- me a n - s q u a re d i s ta n c e b e twe e n ob s e r v a t io n s = 6 .3 2 4 5 5 5 c lu s t e r h i s t or y n cl - c l u s te r s j o i n e d - 1 7 o b 5 1 6 o b 9 1 6 f r e q ob 1 5 ob 1 4 n o r m t r ms i 0 ; 目0 2 0 .2 6 8 6 2 0 . 31 0 8 第三章数据及分析 1 5 0 1 3 6 1 4 0 1 3 2 1 3 o bi 1 2 c l 1 3 1 1 c l 1 5 1 0 c l 1 2 9 c l i o 8 c l 1 4 7 c l 9 6 cl7 5 c j 4 c l s 3 c l 6 2 0 1 3 8 !cl 3 0 1 3 7 o日 月 01 3 1 1 ob 1 2 ob i o ob 3 c l 1 7 ob 1 7 c li i ob 1 3 ob i s c l 1 6 c l 4 o b1 6 ci - 2 0 . 3 2 7 2 0 . 4 0 4 0 . 4 1 9 9 0 .5 1 2 3 0 .5 2 4 3 0 .5 2 7 4 0 .5 6 侣 0 .6 3 8 6 0 . 7 0 0 2 0 .7 4 1 5 0 .8 5 3 1 0 . 8 7 7 9 1 .0 2 2 1 1 . 1 9 4 1 . 3 7 9 22233刁63,104616218 f o r 月! 比 . d 口 m m t i m o r c l u s t e r 团 国1 1 口 勺 之 . 画 国1 . 口 1 月 寻 口叫 口1 7 国困国 月. - - -,-了 -一 1一 .-】一丁 一 一一 一一 一一tt .1 . 2 1 . 1 1 . 4 1 . 5 1 . 1 8 . 1 1 . 1 1 . 1 1 . 1 1 . 1 1 二1 .1 . 1 自 .r . . d 阵 吐 . , . 加 吐 . . . , e 吐 . 怪 . , 1 7 第三章数据及分析 分析结果: i : 宝低、 静海、 津南、 大港、 汉沽、 宁河、 河北、河东、红 桥、 津南 h: 北辰、 东丽、 武清、西 青、 河西、南开 i i i : 和 平、 塘沽 我们综合考 虑了 收 入支出水 平以 及开发潜力, 那么和平区 和塘沽区 根据前 面的分析,必定是发展潜力和发展水平均优于其他区县。而第一类区县则因为 地理位置因素, 对它们 的开发尚 处于初级阶段,因 此总体水平比 较低。 下面我们使用主成分分析,来寻找上面两组数据中主要的因素。 c o rr e la ti o n ma tr ix 砂vtor。tumcart。朴femccsapoeefhc i .t s f 9 nn s c tacps gb f r f v a t o t ii t t u mc a r t f 1 e o t h e r s f e d c l c c 1 .0 0 0 0 0 . 6 5 2 6 0 .9 4 6 0 0 .9 3 0 9 0 .5 9 1 1 0 .8 2 7 7 0 .8 2 8 2 0 .8 0 8 7 0 . 8 2 8 4 0 .4 6 0 9 0 .6 5 2 6 1 ,0 0 0 0 0 . 4 3 8 2 0 . 5 8 3 7 0 .5 8 8 6 0 .4 4 2 1 0 . 9 0 0 9 0 .2 4 9 4 0 .7 4 8 9 0 . 6 4 8 7 0 . 9 4 6 0 0 .4 3 8 2 1 .0 0 0 0 0 .9 2 1 8 0 .5 1 7 0 0 . 7 3 4 3 0 .7 0 2 0 0 . 8 2 6 1 0 .7 6 5 8 0 .3 4 1 3 0 .9 3 0 9 0 . 5 8 3 7 0 .9 2 1 8 1 .0 0 0 0 0 .5 5 6 1 0 .7 2 5 3 0 .7 8 1 8 0 .7 0 5 6 0 . 7 9 9 7 0 .2 6 0 6 0 .5 9 1 1 0 . 5 8 8 6 0 . 5 1 7 0 0 . 5 5 6 1 1 .0 0 0 0 0 .1 7 0 1 0 .5 0 7 5 0 .5 9 4 0 0 .6 9 9 1 0 . 3 1 6 6 0 . 8 2 7 7 0 .4 4 2 1 0 . 7 3 4 3 0 .7 2 5 3 0 . 1 7 0 1 1 . 0 0 0 0 0 . 5 9 3 3 0 . 5 8 5 6 0 .5 2 6 2 0 .2 9 7 1 0 .8 2 8 2 0 .9 0 0 9 0 . 7 0 2 0 0 . 7 8 1 8 0 .5 0 7 5 0 .5 9 3 3 1 .0 0 0 0 0 .4 5 8 7 0 .8 4 3 7 0 . 7 0 4 5 0 . 8 0 8 7 0 .2 4 9 4 0 .8 2 6 1 0 .7 0 5 6 0 . 5 9 4 0 0 . 5 8 5 6 0 .4 5 8 7 1 . 0 0 0 0 0 3 7 2 1 0 . 2 2 8 4 0 . 8 2 8 4 0 .7 4 8 9 0 .7 6 5 8 0 .7 9 9 7 0 . 6 9 9 1 0 . 5 2 6 2 0 . 8 4 3 7 0 . 5 7 2 1 1 .0 0 ( 幻0 . 5 5 8 4 0 .4 6 0 9 0 .6 4 8 7 0 .3 4 1 3 0 .2 6 0 6 0 . 3 1 6 6 0 . 2 9 7 1 0 . 7 0 4 5 0 . 2 2 8 4 0 .5 5 8 4 1 .0 0 0 0 - 20 8 3 0 .2 5 8 5一 ,3 2 1 4 - .0 6 2 2 0 . 2 1 4 5一 3 1 3 4 0 . 0 4 3 4 - . 3 4 6 6 0 . 1 5 0 3 - .0 3 9 1 0 .6 1 4 8 0 . 3 0 7 0 0 .6 2 7 8 0 .7 2 6 2 0 .4 4 5 5 0 .5 0 4 6 0 3 9 3 9 0 .4 7 8 7 0 .6 5 4 5 - . 1 5 1 7 0 .6 1 7 8 0 . 4 5 7 5 0 .6 1 7 3 0 .7 3 0 6 0 . 1 7 3 6 0 .5 6 6 9 0 .5 9 5 7 0 2 7 1 6 0 . 5 2 8 5 0 .0 5 2 5 0 . 1 9 2 2 - .0 1 9 9 0 .2 6 7 0 0 . 1 5 6 4 0 .6 3 4 2一 , 0 5 8 6 - . 0 9 4 5 0 . 3 7 7 3 0 2 6 0 3 - . 1 8 2 2 0 . 5 6 6 7 0 .0 1 7 3 0 .6 7 4 2 0 .5 9 6 9 0 . 5 0 0 6 0 . 3 9 5 7 0 . 1 8 3 9 0 . 6 7 4 5 0 .4 4 9 5 - . 1 7 1 4 - . 0 4 9 5 0 . 1 9 3 ,- . 1 1 7 8 0 .0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度海绵城市建设项目工程合同管理订购协议
- 一年级数学计算题专项练习1000题集锦
- 国际化屠宰品牌创新创业项目商业计划书
- 2025年山村土地出租合同范文
- 施工安全标准化培训课件
- 2026届安徽定远示范高中化学高一第一学期期末考试试题含解析
- 2025年主题公园沉浸式体验设计沉浸式艺术创作与项目开发报告
- 施工单位培训课件
- 银行零售业务数字化营销转型中的线上线下融合策略报告2025
- 2025年资源型城市绿色转型发展路径与模式创新研究报告
- 插秧劳动指导课件
- 乡村振兴农民培训课件
- 幕墙施工培训课件
- 设备巡回检查管理制度
- 产房安全核查管理制度
- 2025至2030年中国水利工程勘察设计行业市场全景评估及发展趋向研判报告
- 阿尔茨海默症的护理
- 2024中级经济师《工商管理》真题和答案
- (2025)公共基础知识考试试题附及答案
- 中国五矿笔试题库及答案
- 2024年1月高考真题浙江卷英语试题(真题+答案)
评论
0/150
提交评论