基于统计方法的中美贸易逆差模型的构建.doc_第1页
基于统计方法的中美贸易逆差模型的构建.doc_第2页
基于统计方法的中美贸易逆差模型的构建.doc_第3页
基于统计方法的中美贸易逆差模型的构建.doc_第4页
基于统计方法的中美贸易逆差模型的构建.doc_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专 业 学 位 硕 士 学 位 论 文基于统计分析方法的中美贸易逆差模型的构建Construction of Sino-US Trade Deficit Model Based on Statistical Analysis 作 者 姓 名: 赵东明 工 程 领 域: 计算机技术 学 号: 40909127 指 导 教 师: 孟军 完 成 日 期: 2013年3月21日 大连理工大学Dalian University of Technology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目: 基于统计分析方法的中美贸易逆差模型的构建 作 者 签 名 : 日期: 年 月 日大连理工大学专业学位硕士学位论文摘 要由于研究中美贸易宏观问题时,需要的数据来源于各不同的国家、相同国家的不同部门,或者来源于一些不同的国际组织,这一般需要研究人员查询大量的文献资料来整理这些数据,中美贸易系统设计的指导思想就是让研究人员把自己整理出来的数据都添加到中美贸易系统中,聚集众多研究人员的力量,实现这些数据的共享和利用。个别人收集的数据有可能存在指标遗漏或者数据缺失,但利用中美贸易系统能很好的解决这一问题。由于中美贸易系统的需要各种用户根据规定的权限,通过网络对数据进行操作和利用。所以中美贸易系统选择 B/S 模式。中美贸易中最核心的问题是中国在中美贸易中存在很大的顺差,如果能够实现建立美中贸易逆差形成原因的数学模型,能为解决中美贸易中出现的问题提供理论支持和政策解决方案。所以我们一方面建立中美逆差模型,另一方面说明中美贸易系统的设计和实现。为了实现建立美中贸易系统中逆差形成原因的具体模型,我们首先采用灰色关联度分析方法,对中美贸易系统中的各种变量进行初步筛选,剔除与美中贸易逆差无关的变量;接下来采用主成分分析,把影响美中贸易逆差的众多存在线性相关的变量降纬为线性无关的影响因子。以因子为自变量,以美中贸易逆差为因变量,利用多元线性回归分析建立关于美中贸易逆差形成原因的数学模型,但此模型假设检验没通过,不能在实际中应用。根据现实经验,美中贸易逆差一定受降纬后线性无关的影响因子的影响,所以我们可以认为数学模型一定存在,另一方面,利用曲线回归分析我们发现因变量对每个影响因子的偏导数存在,最后利用多元非线性回归分析建立了美中贸易逆差的估计模型。关键词:美中贸易逆差;中美贸易系统;数学模型- I -Construction of Sino-US Trade Deficit Based on Data Statistical AnalysisAbstractWhen you study on macro issues of Sino-US trade, need the same data comes from various different countries, the different departments of the country, or from a number of different international organizations。In order to collect the data, the researchers need to check a lot of literature。The guiding ideology of the Sino-US trade system design is to allow researchers to sort out their own data are added to the Sino-US trade system。Forces gathered many researchers, sharing and use of these data. The data collected by the individual person may exist indicators omissions or missing data, but the use of the China-US trade system can be a good solution to this problem.Due to the needs of various users of the Sino-US trade system under the authority of the provisions of the operation and use of data through the network. Sino-US trade system to select the B / S mode.The core problem of the Sino-US trade is that China has a great surplus in the Sino-US trade, if we can achieve the mathematical model of the US-Sino trade deficit ,it can provide theoretical support and policy solution scheme to solve the problems in the Sino-US trade. So we establish Sino-US deficit model, another indicate o design and implementation of Sino-American trade system.In order to achieve the specific model of the US-Sino trade deficit, we use Grey Relational Analysis filter the variables and eliminate variables that has nothing to do with the US-Sino trade deficit; Next, we use the principal component analysis to reduce the Linearly independent variable dimension and achieve impact factor of linear correlation.We take the impact as the independent variables, the US-Sino trade deficit as the dependent variable. We use the multiple linear regression analysis establish the US-Sino trade deficit mathematical model, but the model hypothesis test did not pass, can not be applied in practice. Based on the experience, the US-Sino trade deficit must be affected by the impact factor of linear correlation, so we can think that the mathematical model must exist. On the other hand, we found that the partial derivative of the dependent variable for each impact factor exists by curve regression analysis, so we use Multivariate nonlinear regression analysis establish the estimate model of US-Sino trade deficit. Key Words: Sino - US Trade Deficit; Sino-US Trade System; Mathematical Model- V -目 录摘 要IAbstractII1 绪 论11.1 课题研究的背景11.2 课题研究的现状11.3 本文研究的内容22 相关技术42.1 国际贸易与贸易差额42.1.1 国际贸易42.1.2 国际贸易统计指标42.1.3 贸易差额的产生52.1.4 贸易差额的影响52.2 统计分析52.2.1 统计分析的定义52.2.2 统计分析方法的内容62.2.3 统计分析方法的步骤62.2.4 统计分析方法局限72.3 常用的统计分析方法72.3.1 灰色关联度分析72.3.3 主成分分析模型及作用102.3.4 多元线性回归分析预测方法及模型122.3.5 曲线回归分析方法及模型应用142.3.6 多元非线性回归分析方法及模型应用153 中美贸易系统和中美贸易逆差模型的设计163.1 系统的需求的分析163.1.1 系统的应用范围163.1.2 系统的功能需求173.1.3 系统的性能需求193.2 系统的设计193.2.1 系统设计的指导思想193.2.2 软件体系结构设计193.2.3 系统结构设计203.2.4 数据库设计223.3 中美贸易逆差模型的设计223.3.1 中美贸易逆差模型设计的基础223.3.2 中美贸易逆差模型的设计224 中美贸易逆差模型的实现244.1 系统的实现和功能244.1.1 用户登陆244.1.2 系统管理254.1.3 数据管理254.1.4 数据查询264.1.5 数据利用274.2 常用的统计分析软件294.2.1 SPSS统计分析软件294.2.2 灰色建模软件294.3 数据的预处理与分析294.3.1 数据的获得294.3.2 数据的整理314.3.3 数据的筛选324.3.4 影响中美贸易不平衡综合因素的提取384.4 利用多元线性回归分析构建模型及抛弃434.4.1 多元线性回归分析预测方法及模型假设444.4.2 多元线性回归分析预测方法及模型建立与抛弃444.5 利用多元非线性回归分析构建模型445.2.1 曲线回归分析方法对变量和分析445.2.2 美中贸易逆差估计模型建立47结 论49参 考 文 献51附录A 中美贸易系统部分代码节选52攻读硕士学位期间发表学术论文情况57致 谢58大连理工大学学位论文版权使用授权书591 绪 论 中美贸易中有很多问题,其核心问题就是美国不断指责中国根据自身利益的需要不断操纵汇率,导致中美贸易出现失衡状况和使得美国社会中存在大量失业等问题。而美国并不考虑人民币从2005年中国汇改以来实际有效汇率已提高30%现实。所以加快研究中美贸易失衡的原因等中美贸易宏观问题具有紧迫性。但研究中美贸易相关问题面临着数据收集工作量大,需要众多研究人员根据自己的需要反复收集利用,能不能把众多研究人员收集数据的工作简化,实现不同研究人员收集数据的共享也是重点研究的问题。1.1 课题研究的背景中美贸易失衡是指近年来中国对美国巨额贸易顺差导致的两国之间在经常账户下的国际贸易收支失衡。考察近 30年的中美贸易额,从20世纪90年代以来,特别是中国加入WTO 之后,呈现出逐步加快扩大的趋势。美国同中国的贸易出现多年来的逆差,直接原因是全球经济一体化,导致美国及其他发达国家及周边发达地区的产业转移到中国所导致。20世纪80年代中期以来,美国、欧洲以及中国周边国家和地区进行产业结构的升级和调整,把其在国内已经丧失比较优势的劳动密集型产业转移到中国,大量的进口原材料及零配件涌入中国进行加工组装,然后出口到美国或欧洲国家,使得美国与中国的贸易出现多年的逆差。美方连年逆差的另一方面原因是,由于中国居民的收人水平比较低,中国市场能够形成购买美国生产的高技术产品或高档产品得的有效需求不足。再加上美国对中国高技术产品出口限制很严。目前,中国取代日本成为世界上外汇储备最多的国家,90%是美元外汇。美国在中国的大量投资也获得了丰厚的利润,因此,美国一直期望人民币升值的预期下使美国资本进入中国能获得最大的利益。在人民币升值的同时,美元就相对贬值了,我们持有的美元资产就缩水了,等于要花更多的美元从美国进口相关货物1。但美国不顾从中美贸易逆差中得到的巨额好处和产生逆差的真正原因,一直指责中国操纵汇率,所以研究中美贸易逆差形成的真正原因,并掌握相关规律,对反击美国的无端指责,促进公平贸易有重要的意义。1.2 课题研究的现状经过前期很多研究贸易问题学者的研究,已经基本找出造成中美贸易失衡的原因是中美结构性失衡造成的,特别是美国对中国高科技产品出口的实行限制的限制政策,美国国内过度膨胀的需求和美中两国参与的国际分工不同等因素,汇率并不是造成中美贸易失衡的唯一的和主要原因。中国学者厉以宁(1991)通过对中国1970-1983年的贸易等数据研究,精密测算出中国进出口弹性分别为0.68和0.05,得出中国进出口商品的需求价格弹性严重不足的结果,中国人民币汇率贬值不但不能改善中国的贸易收支,反而会导致中国出口状况持续恶化的结论2; 诺贝尔奖获得者蒙代尔和前美联储主席Greenspan都曾表示中国的人民币升值对于西方贸易逆差没有改善的积极作用,反而有可能会刺激西方国家国内物价水平上涨;Fung(1998)、Davis(2002)、以及姚枝仲(2003)等的研究也表明美中贸易逆差并非归因于汇率因素3-5 ;黄基伟(2011)利用2005-2010年的月度数据对中美逆差和人民升值的关系进行实证分析,得出人民币汇率对中美贸易逆差是一个次要因素,不是主要原因,中美贸易逆差原因主要是美国对中国的出口限制,影响了美国贸易企业比较优势发挥,同时新国际分工体系下形成的中国加工贸易方式是另一个次要因素6;李强(2011)利用基于VAR模型进行实证分析得出中美贸易不平衡主要原因是美国国内过度膨胀的需求,其对两国不平衡的影响程度最大,时间最长,人民币对美元汇率的贬值也是导致不平衡的原因,但它影响有限7;彭红枫(2010)认为造成美中贸易逆差的真正原因是中国在劳动密集型和资源易消耗产业上发挥了比较优势8;范云芳(2010)利用1980-2008年的年度贸易数据对中美贸易进行协整分析,得出人民币升值并不能改变中美贸易失衡,中美贸易失衡是中美双方进出口结构、贸易政策等众多共同因素作用的结果9。1.3 本文研究的内容为了实现众多研究中美贸易系统各宏观问题的研究人员共享有关中美贸易系统的宏观经济数据,本文研究选用B/S 模式设计中美贸易系统,实现各种用户根据规定的权限,通过网络对中美贸易系统里的宏观经济数据进行操作和利用。并通过研究中美贸易逆差产生的原因这个项目引领全文。本项目按照提出问题、构建理论、分析问题和解决问题的思路,拟采用数学模型、文献法、调查法、实证与规范、比较等现代管理和经济研究方法。把国内经济、国外经济等各种因素放在一个统一环境中,来研究影响中美贸易不平衡的具体因素到底有哪些和这些因素发挥作用的大小。通过文献法和调查法收集有关的数据,并依此使用数学模型法建立数学模型,形成理论;通过文献法和调查法研究现状,找出制约因素。本项目的研究内容包括研究范畴的界定,数学模型的建立,现状与数据分析。研究范畴包括中美贸易不平衡的现状、中美贸易不平衡的发展、影响中美贸易不平衡的因素。系统在本文中需要根据数据特征选择适合的现代统计分析方法建立数学模型来影响中美贸易不平衡的因素。采用文献法、调查法收集中美贸易不平衡的现状、中美贸易不平衡的发展,找出制约因素。本项目研究的重点包括数据的采集、数据的整理、模型的建立。2 相关技术2.1 国际贸易与贸易差额2.1.1 国际贸易国际贸易是指不同国家(和/或地区)之间的商品和劳务的交换活动。国际贸易是商品和劳务的国际转移。国际贸易也叫世界贸易。 国际贸易由进口贸易和出口贸易两部分组成,故有时也称为进出口贸易。2.1.2 国际贸易统计指标(1) 贸易额和贸易量 贸易额就是用货币表示的贸易的金额,贸易量就是剔除了价格变动影响之后的贸易额,贸易量使得不同时期的贸易规模可以进行比较。对外贸易额就是一个国家在一定时期内的进口总额与出口总额的和值。一般用该国货币表示,也可用国际上习惯使用的货币表示;联合国发布的世界各国对外贸易额是以美元表示的;各国在统计有形商品时,出口额以FOB价格计算,进口额以CIF价格计算;无形商品不报关,海关没有统计。 国际贸易额是以货币表示的世界各国对外贸易值的综合,又称国际贸易值。它等于一定时期内世界各国用FOB价格计算的出口贸易额之和。 贸易量是为了剔除了价格变动影响,能准确反映国际贸易或一国对外贸易的实际数量,而确立的一个指标。在计算时,是以固定年份为基期而确定的价格指数去除报告期的贸易额,得到的就是相当于按不变价格计算(剔除价格变动的影响)的贸易额,该数值就叫报告期的贸易量。 贸易量可分为国际贸易量和对外贸易量以及出口贸易量和进口贸易量。 (2) 贸易差额 贸易差额是指一个国家在一定时期内(通常为一年)出口总额与进口总额之间的差额。 贸易顺差,中国也称它为出超表示一定时期的出口额大于进口额。 贸易逆差,中国也称它为入超、赤字,表示一定时期的出口额小于进口额。 贸易平衡就是一定时期的出口额等于进口额。 一般认为贸易顺差可以推进经济增长、增加就业,所以各国无不追求贸易顺差。但是,大量的顺差往往会导致贸易纠纷。2.1.3 贸易差额的产生贸易差额的产生,一般说来主要是受一国政治、经济发展的情况所制约。其次,人为的改变进口或出口政策,也会导致一国对外贸易差额的变化。解决贸易差额的方法,一是简单地采用增加进口或出口,对一国的国际收支变化起着重要作用。或减少进口或出口;另一方法是运用经济手段(如关税、税收以及补贴等)控制贸易差额的变化。2.1.4 贸易差额的影响贸易顺差的大小在很大程度上反映一国在特定年份对外贸易活动状况。通常情况下,贸易顺差越多并不一定好,一国也不宜长期大量出现对外贸易顺差。过高的贸易顺差是一件危险的事情,意味着本国经济的增长比过去几年任何时候都更依赖于外部需求,对外依存度过高。巨额的贸易顺差也带来了外汇储备的膨胀,给货币带来了更大的升值压力,也给国际上贸易保护主义势力以口实,认为巨额顺差反映的是货币被低估。这增加了货币升值压力和金融风险。当一个国家出现贸易逆差时,即表示该国外汇储备减少,其商品的国际竞争力削弱,该国在该时期内的对外贸易处于不利地位。大量的贸易逆差将使国内资源外流加剧,外债增加,影响国民经济正常有效运行。因此,政府应该设法避免出现长期的贸易逆差。 如果一个国家经常出现贸易赤字现象,为了要支付进口的债务,必须要在市场上卖出本币以购买他国的货币来支付出口国的债务,这样,国民收入便会流出国外,使国家经济表现转弱。政府若要改善这种状况,就必须要把国家的货币贬值,因为币值下降,即变相把出口商品价格降低,可以提高出口产品的竞争能力。因此,当该国外贸赤字扩大时,就会利空该国货币,令该国货币下跌;反之,当出现外贸盈余时,则是利好该种货币的。2.2 统计分析2.2.1 统计分析的定义统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与技术。统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。 统计分析是统计工作中统计设计、资料收集、整理汇总、统计分析、信息反馈五个阶段最关键的一步。如果缺少这一步或这一步做得不好,均将降低统计工作的作用。可以确切地说,没有统计分析,统计工作就没有活力、没有发展,也没有统计工作的地位。所以统计工作者必须学会写统计分析,积极地为领导决策服务,这既是统计工作者的职责,也是统计工作的最终目的。 2.2.2 统计分析方法的内容统计分析方法,按不同的分类标志,可划分为不同的类别,而常用的分类标准是功能标准,依此标准进行划分,统计分析可分为描述统计和推断统计。 1、描述统计 描述统计是将研究中所得的数据加以整理、归类、简化或绘制成图表,以此描述和归纳数据的特征及变量之间的关系的一种最基本的统计方法。描述统计主要涉及数据的集中趋势、离散程度和相关强度,最常用的指标有平均数()、标准差(x)、相关系数(r)等。 2、推断统计 推断统计指用概率形式来决断数据之间是否存在某种关系及用样本统计值来推测总体特征的一种重要的统计方法。推断统计包括总体参数估计和假设检验,最常用的方法有Z检验、T检验、卡方检验等。 描述统计和推断统计二者彼此联系,相辅相成,描述统计是推断统计的基础,推断统计是描述统计的升华。具体研究中,是采用描述统计还是推断统计,应视具体的研究目的而定,如研究的目的是要描述数据的特征,则需描述统计;若还需对多组数据进行比较或需以样本信息来推断总体的情况,则需用推断统计。 2.2.3 统计分析方法的步骤1、收集数据 收集数据是进行统计分析的前提和基础。收集数据的途径众多,可通过实验、观察、测量、调查等获得直接资料,也可通过文献检索、阅读等来获得间接资料。收集数据的过程中除了要注意资料的真实性和可靠性外,还要特别注意区分两类不同性质的资料:一是连续数据,也叫计量资料,指通过实际测量得到的数据;二是间断数据,也叫计数资料,指通过对事物类别、等级等属性点计所得的数据。 2、整理数据 整理数据就是按一定的标准对收集到的数据进行归类汇总的过程。由于收集到的数据大多是无序的、零散的、不系统的,在进入统计运算之前,需要按照研究的目的和要求对数据进行核实,剔除其中不真实的部分,再分组汇总或列表,从而使原始资料简单化、形象化、系统化,并能初步反映数据的分布特征。 3、分析数据 分析数据指在整理数据的基础上,通过统计运算,得出结论的过程,它是统计分析的核心和关键。数据分析通常可分为两个层次:第一个层次是用描述统计的方法计算出反映数据集中趋势、离散程度和相关强度的具有外在代表性的指标;第二个层次是在描述统计基础上,用推断统计的方法对数据进行处理,以样本信息推断总体情况,并分析和推测总体的特征和规律。 2.2.4 统计分析方法局限统计分析方法有其自身的优势与局限,正确认识其优势和局限,二者同样重要。统计分析方法的局限,归结起来,主要有下列几点: 1、现实生活极其复杂,诸多因素常常纠缠交错在一起,仅靠统计分析方法去控制和解释这些因素及其相互关系,是不全面、不深刻的。 2、统计分析方法的运用是有条件的,它依赖于数据资料本身的性质、统计方法的适用程度和研究者对统计原理及统计技术的理解、掌握程度与应用水平。方法选择不当,往往易得出错误的结论。 3、统计决断以概率为基础,既然是概率,就存在误差,因而可以说,统计决断的结论并非绝对正确。例如,从样本统计量推断总体参数的信息时,由于推断建立在一定的概率基础上,没有百分之百的把握认为推断是正确的;当在0.95概率基础上比较两个总体平均数是否相等并认为它们之间存在或不存在显著差异时,从可靠度上看,决断错误的可能性尚有5。2.3 常用的统计分析方法2.3.1 灰色关联度分析现实中的很多数据由于受自身特征的影响很难满足传统的统计分析方法如主成分分析、方差分析和因素分析等的要求。这些统计分析方法都要求样本服从某个典型的概率分布,要求因素数据之间无相关关系且因素数据与系统特征数据之间呈线性关系、数据样本也要求足够大等具体要求。灰色关联度分析法是一种多因素统计分析方法,它是以各因素的样本数据为依据用灰色关联度来描述因素间关系的强弱、大小和次序,若样本数据反映出的两因素变化的态势(方向、大小和速度等)基本一致,则它们之间的关联度较大;反之,关联度较小。此方法的优点在于思路明晰,可以在很大程度上减少由于信息不对称带来的损失,并且对数据要求较低,工作量较少;其主要缺点在于要求需要对各项指标的最优值进行现行确定,主观性过强,同时部分指标最优值难以确定。灰色关联分析方法由于对原始数据分布类型不加以限制,数据样本容量的大小也无特严格要求,因素之间的发展变化关系也不管是直线还是非直线都可以使用灰色关联分析方法,所以灰色关联分析方法是来判断因素之间关联程度的最实用方法,并且,它判断各因素之间关联程度主要是依据各因素变化曲线在几何形状上的相似程度,曲线在几何形状上的相似程度越高,各因素之间的关联程度就越大,反之就越小。此方法通过对系统内时间序列有关统计数据几何关系的严格比较,求出参考数列与各比较数列之间的灰色关联度,实现对动态过程发展态势的量化分析。如果比较数列与参考数列的关系越紧密,那么比较数列与参考数列关联度越大,其发展方向和速率也与参考数列越接近。其基要求是,在计算关联系数、关联度以及根据关联度的大小对待评指标进行排序前,要对原始观测数进行无量纲化处理。(1) 邓氏关联度做关联分析先要指定参考数据列。参考数据列常记为,记第1个时刻的值为,第2个时刻的值为,第k个时刻的值为。因此,参考序列可表示为。关联分析中被比较数列常记为。对于一个参考数据列,有m个比较数列的情况。可以用公式2.1表示各比较曲线与参考曲线在各点(时刻)的差。 (2.1)式中,是第 k 个时刻比较曲线与参考曲线的相对差值,它称为对在k时刻的关联系数。其中,是分辨系数,一般在0与1之间选取。一般不能用上述关联系数公式直接计算关联系数,这是由于作关联系数计算的数列的量纲最好是相同的,当量纲不同时要化为无量纲。此外还要求所有数列有公共交点。为了解决这两个问题,计算关联系数之前,先将数列作初值化处理,即用每一个数列的第一个数除其它数,这样既可使数列无量纲又可得到公共交点即第1点。最后在使用公式(3.1)计算第 k 个时刻比较曲线与参考曲线的相对差值。关联系数的数很多,为此有必要将各个时刻关联系数集中为一个值,以解决信息过于分散,不便于比较问题,做这种信息集中处理的一种好方法是求平均数。关联度的一般表达式为公式2.2。 (2.2)由于邓氏关联度存在很多缺陷,现在已经很少使用。(2) 绝对关联度做关联分析先要指定参考数列。参考数据列常记为,记第1个时刻的值为,第2个时刻的值为,第k个时刻的值为。因此,参考序列可表示为。关联分析中被比较数列常记为。关联数列可表示为。设,则新数列,分别为,的始点化象。记,则得,的绝对关联度为公式2.3。 (2.3)绝对关联度满足灰色关联公理中的规范性、偶对称性与接近性,不满足整体性。(3) 相对关联度同样,参考数据列常记为,记第1个时刻的值为,第2个时刻的值为,第k个时刻的值为。因此,参考序列可表示为 。比较数列常记为。关联数列可表示为。这里假设,的初值皆不等于0,则有,的初值象,。,。设,则新数列,分别为,进行始点零化象。记记,则得,的相对关联度为公式2.4。 (2.4)(4) 综合关联度设,的长度相同,初值不等于0,和分别为绝对关联度和相对关联度,则称公式2.5为,的综合关联度。 (2.5)其中,是分辨系数,一般在0与1之间选取。综合关联度体现了折线,的相似程度,有反映了,相对于始点变化速率的接近程度,是较为全面的表征数列之间是否联系紧密的一个重要指标10。(5) 灰色关联度检验根据前面所述关联度的计算方法算出比较数列与参考数列的关联系数,然后计算出关联度,根据经验,当时,关联度大于0.6便满意了。2.3.3 主成分分析模型及作用 设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。主成分分析在数理统计分析中常被用来寻找判断某种事务和现象的综合指标,使用主成分方法,能从可能存在线性相关关系的原始变量中找出几个彼此互不相关的独立主分量,并且要求这几个独立的主分量最可能多的保持原始变量大部分信息。所以统计分析中的主成分分析法是研究通过用少数几个线性无关的主分量来解释多个变量间的内部结构问题的好方法。在主成分分析中,为得到新的综合指标既线性无关的主分量,数学上通常将原始变量包含的 p 个指标做线性组合。如果选取的第一个线性组合即第一个综合指标为,原始变量中原来指标的信息应该被尽可能反映,用的方差表示反映原始变量信息的大小, 如果包含的原来的指标信息越多,则的方差越大。因此,所有的线性组合中第 1 个主成分应该是方差最大,如果原始变量中原来 p 个指标的信息不足以能被第一个主成既主分量分代替,再考虑第 2 个主成分,即第 2 个线性组合,依次类推。假设测得原始变量有 p 项指标,数据有 n 个样本(pn)。X=(,)为得到的原始数据巨阵,且为协方差阵,令 为协方差阵的特征根,因为有 0,相应的特征向量为向量 ,则 X 的第 i 个主成分为公式2.6。=X (i=1,2,.,p) (2.6)可以用样本协方差阵来代替协方差阵,因为通常协方差阵是不被知晓的。在统计分析中计算时消除数据纲量的影响一般往往通过把原始数据进行标准化的方法,以解决指标的纲量不同不能在一起进行比较和分析的问题。通常提取多少个主成分是由原始数据有多少个变量决定的,提取主成分目的就是简化数据,所以不能把所有的主成分全部提取出来。一般按累计贡献率的影响提取前 k 个主成分,数理论统计中的多数情况下,如果要想主成分包含了 90%以上的原始变量指标的信息,提取 23 个主成分既主分量已经足够了,不需要继续提取。提出的全部主成分中,每个主成分综合原来批P个指标的信息能力大小是有差别的,其衡量方式是使用每个主成分的方差贡献率,主成分 的方差在全部方差中的比重,由主成分 的方差贡献率表示,主成分综合原始变量,信息的能力越强,这个值越大11。在主成分分析中,为了用较少的几个线性无关的主成分来反映原有变量的绝大部分信息, 减少了变量的数目和实现降纬, 可以用选用前面几个方差最大的线性无关的主成分来进行, 一般要求这几个主成分不少于原始变量信息的85%被它们所包含。如多元线性回归方程的多重共线性问题可以利用主成分降纬来消除,多元线性回归方程中的变量可以利用主成分分析法来筛选几个线性无关的综合指标来代替原来的变量。数理统计分析中,在进行主成分分析时,需要对数据进行数据同趋化处理和无量纲化处理两个方面的数据标准化处理,以解决不同性质数据能在一起进行分析和实现数据的可比性。对不同性质指标进行简单的直接加总不能正确反映来自不同作用力的综合影响结果,为了能实现数据指标加总并得到正确结果,必须使所有指标对测评方案的作用力进行同趋化处理,即改变逆指标数据性质,数据同趋化处理主要解决不同性质数据问题。数据的可比性是通过数据的无量纲化处理实现的。数理统计分析中,在进行主成分分析中,需要将逆指标转化为正指标,以实现指标的同趋势化,一般为了评价分析的方便,原指标用逆指标的倒数值代替是早主成分分析中常用转化的方式12。均值为0方差为1的数据是无量纲数据,这样的数据可以直接进行比较,通常需要将原始数据进行标准化以消除量纲和数量级,使原始数据变成能直接比较的数据后,然后进行主成分分析。2.3.4 多元线性回归分析预测方法及模型(1) 模型建立在统计分析中,自变量与因变量是回归分析中所涉及的变量重要分类。当自变量是连续性的和离散性的,而因变量是非时间的连续性变量,且自变量直接线性无关急相互独立时,研究人员多使用多元线性回归分析来欲研究因变量和自变量之间的依存关系。这时,多元线性回归分析方法是一个有力的方法。 (2.7)在公式2.7中个总体回归参数(也称为回归系数)用、表示,它们是未知的,需要使用统计方法求证出;个自变量(即影响因素)用、表示,它们是已经积累下的历史数据,为随机误差,它反应回顾分析的结果与现实的差距,越大,回归分析结果越不理想。当 (、,)的组样本值后被研究者通过试验或者调研获得后,研究者一般运用最小平方法,求实际值与曲线上的点的离差平方和最小,总体回归参数的估计值、便可求出,所以就实现了多元线性回归方程式如公式2.8取代了多元线性回归模型进行预测等研究。 (2.8)在进行多元线性回归分析时,因为变量单位影响各的值。需要求出多元线性回归模型的标准化回归系数以便于对各回归系数之间进行比较,实现由单位不同所带来的差别被消除,达到可以比较的目的。数理统计中一般用Beta表示与一般回归系数对应的标准化回归系数。在多元线性回归分析中,一般认为回归方程中对应的因变量受自变量的影响越大,求解出的标准化回归系数的绝对值也就越大。但是,有时候多元线性回归分析中回归系数受模型中其它自变量的影响,模型中自变量之间彼此相关不独立,若遇到这种情况,研究人员就必须采取谨慎的态度解释标准化回归系数。多元线性回归分析中的自变量之间严重的多重共线性(Multicollinearity) 可以通过回归诊断(The Diagnosis of Regression)判断,最终,回归模型中保留下来的所有自变量之间尽可能线性无关互相独立,而舍去其中作用较小的变量。此时,利用多元线性回归分析中的标准化回归系数做出解释最合适。bi的标准误差为残差的方差的估计值为,在多元线性回归分析中它回归系数估计值的离散程度用残差的方差的估计值bi的标准误差反应12。 (2) 统计检验在多元线性回归分析中,在回归模型求出后研究人员不能直接使用,还要采用一定的方法来验证所建的模型是否符合理论和实践,必须由研究人员进行科学的统计检验和理论检验,看线性关系是否显著,多元线性回归模型一定的精度要求是否达到,多元线性回归模型与实际值是否有较好的拟合度,最后才能决定多元线性回归模型能否进行分析和预测研究。在多元线性回归分析中,理论检验这是研究人员进行定性认识的重要组成部分,它从定性到定量的综合集成认识的第一步,主要是考察科学理论和人们的在社会实践中积累的经验常识与回归模型中的参数的方向和大小程度是否符合。多元线性回归分析中,必须进行统计检验,才能使通过经验理论检验模型得以应用。通常,拟合度检验方法,参数显著性检验方法、模型显著性检验方法等是多元线性回归模型的主要的统计检验方法。对通过实验和调研等取得的样本观测值与样本回归模型之间拟合程度的检验研究人员都采用拟合度检验(或),计算公式为公式2.9和2.10。 (2.9) (2.10)在统计分析中,如果变量不断增加,肯定不会减小,它随模型中的变量的增加而增加,但如果自变量太多可能导致模型不稳定,模型的这种不稳定很可能是由模型中的变量太多而引起共线性问题造成的,所以研究人员仅看是不能看出一个模型好坏的,研究人员还要看 ,因为它对自由度(也即变量数)作了校正,计算公式如公式2.11。 (2.11) 模型显著性检验在多元线性回归分析中,研究人员依据样本观测值推断总体模型的线性关系是否显著成立,通常需要研究人员通过模型显著性来考察,计算公式如公式2.12。 (2.12) 参数显著性检验在多元线性回归分析中,研究人员检验每个因变量受自变量影响是否显著,通常又研究人员通过参数显著性检验来考察,计算公式为公式2.13。 (2.13)2.3.5 曲线回归分析方法及模型应用(1) 模型的建立在数理统计中,研究人员使用曲线回归分析找出一个近似函数来表达样本数据的总体趋势和特征,大多数情况下,研究人员通过使实测值和模型拟合值差值的均方差最小即最小二乘法法来求得模型参数。表达线性关系的Linear 线性模型 , Compound 复合模型 ,Quadratic 二次模型 ,Power 幂函数模型 ,Logarithmic 对数模型,Cubic 抛物线模型,Exponential 指数的模型,Growth 生长模型 , S 形模型 ,Logistic 逻辑斯蒂模型和Inverse 倒数模型 等是曲线回归分析中研究人员唱使用的模型 14。 (2) 假设检验曲线归回分析和多元线性回归分析一样,研究人员为验证所建的模型是否符合理论和实践,所建的模型是否达到一定的精度要求,所建的模型线性关系是否显著能否进行分析和预测研究,所建的模型是否与实际值有较好的拟合度,研究人员要使用科学的理论检验和统计检验方法对求出的回归模型进行检验。在曲线归回分析中,理论检验业是从定性到定量的综合集成认识的第一步,是研究人员实现定性认识的重要组成部分。它主要是考察科学理论和人们的经验常识与回归模型中的参数的符号和大小是否符合。在曲线分析中,在模型通过理论检验以后,也还必须进行统计检验。通常,检验样本数据聚集在曲线周围的密集程度的拟合度检验一般用判定系数R2来,回归曲线的拟合越差她就越接近0,回归曲线的拟合越好它越接近1。根据样本观测值推断总体模型的曲线回归关系是否显著成立的模型显著性检验,研究人员一般用F检验进行 15。2.3.6 多元非线性回归分析方法及模型应用回归分析中包含两个以上变量的非线性回归模型,成为多元非线性回归分析。多元非线性回归分析分为内蕴的线性回归和内蕴的非线性回归。内蕴的线性回归一般经过简单的数字变换就可以得到它的线性化表达方式,而内蕴的非线性回归不能做到这一点。 所以当遇到内蕴的线性回归分析时,首先要把它转换成多元线性回顾分析,用多元线性回归分析法则求解出多元非线性回归分析模型。 3 中美贸易系统和中美贸易逆差模型的设计3.1 系统的需求的分析系统的需求是用户要求软件系统提供的各种功能和限制。开发一个软件系统首先要进行系统的需求分析,系统需求分析是软件系统开发的基础性工作。3.1.1 系统的应用范围各类研究中美贸易宏观问题的研究员、教师和学生等研究者在研究中美贸易宏观问题时候都需要对中美贸易系统进行查询和利用,为研究和决策提供数据基础。中美贸易系统研究员管理员教师学生图3.1 中美贸易系统应用范围Fig. 3.1 Sino-US trade Applications3.1.2 系统的功能需求为防止用户对系统进行非法操作,系统根据不同用户给予不同的权限,采用分级功能,其目的是保护信息的安全性、可靠性和完成性。(1) 普通研究者用户功能需求普通研究者使用帐号和密码登陆后仅仅可以对中美贸易系统中的数据进行查询、利用等简单操作,并可以导出中美贸易系统中的数据,但不能修系统数据。普通用户查询导出数据中美贸易系统数据库图3.2 普通用户使用流程Fig. 3.2 Ordinary user processes(3) 高级用户功能需求高级用户使用账号和密码登陆后可以增加、修改和删除有关中美贸易的宏观经济数据,可以方便快捷地进行信息查询,可以进行各种数据的导出和利用工作。高级用户数据添加、删除等导出数据中美贸易系统数据库查询等图3.3 高级用户使用流程Fig. 3.3 Advanced Users and Processes(4) 系统管理员系统管理员使用账号和密码登陆后可以增加、修改和删除用户信息,可以增加、修改和删除有关中美贸易的宏观经济数据,可以方便快捷地进行信息查询,可以进行各种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论