版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
长沙民政职业技术学院教案
课程名称经济数学
课题描述性统计分析授课课时2
课型新授课教案编号
教学目标(知识、技能、素质):
1、知识目标:掌握基本统计量及线性相关的度量。
2、技能目标:分析解决问题的能力和严谨的逻辑思维能力
3、素质目标:培养学生理性的思维方式和数学应用意识
教学重点:掌握基本统计量,散点图和相关系数
教学难点:随机变星的分布形状,用EXCEL求常用统“量
主要教学方法:启发引导式、讲授法
教学环节与内容
一、问题引入
统计在日常生活和各类职业中有着广泛的应用,例如,在社会学领域,需要调查青年对
婚姻家庭、经济收入、相貌等因素的态度以便进行正确引导;在康复医疗领域,需要对患有
抑郁症的病人,按照测带得到的指标,进行恰当地归类以便进行有针对性的治疗;在经济活
动中,需要考虑商品的市场反应与价格、消费者收入和广告等因素之间的相互关系,以及建
立数学模型进行预测等问题。
二、新课讲授
(1)重要统计概念
在一个描述性统计问题中,往往涉及到三个主要概念:总体、样本以及描述性统计。
定义1:总体是指研究对象的某一个指标(或多个)全体,组成总体的每一个单元称为个
体,总体中所包含个体的总数称为总体容量。
定义2:在总体中随机地抽取〃个个体,记其指标值为X1,X2,…,X“,则X1,X2,.一Xn
称为总体的一个样本,〃称为样本容量,样本中的个体称为样品。
(2)常用统计量
定义5统计量是统计理论中用来对数据进行分析、检验的变量。
i)中心趋势
中心趋势乂称为定位度量或者平均数,是一组数据典型的或者有代表意义的值。由于这
些典型值趋向于落在根据数值大小排列的数据的中心,因此被称为中心趋势度量。可以定义
中心趋势的统计量包括:算数平均数、几何平均数、中位数和众数等。
算数平均数(简称为样本均值):设一个样本的观测值为X,与,…,X”,样本算数平均数
记为7,则有
n
其中,符号”-”表示将西+&++%记作!£工的意思,读成“记作〃。
nn/=,
几何平均数:度量平均值的另一种方法,特别是在计算平均增长率.、平均收益率时被经
常使用。
中位数:把所有观测值依序排列(递增或递减),位于最中间的观测值就是中位数。当观
测值个数为偶数时,则中位数是位于中间的两个观测值的平均数。
众数:样本观测值中发生次数最多的观测值。使用众数作为中心趋势统计量,会有两个
问题:第一,在一个小样本内,它可能不是一个很好的观测值;第二,它可能不唯一。
例9.1求引例9.1牙膏销售问题中的本公司销售价格的平均价格,价格的众
数和中位数?
解平均价格元=工的区75+3.7。11三冬山2=3.735(元);因为本公司销
30
售价格3.7元出现的次数最多,所以众数加。=3.7;将本公司销售价格从低到高
排序,第15位、第16位都是3.75,因此中位数M「3.75.
对于一组数据,仅仅知道平均数、众数、中位数等这些描述数据中心趋势的
统计量还不够,还需知道数据的分散程度.描述数据的分散程度的常用统计量有
极差、样本方差和样本标准差等.
ii)离散趋势
除了知道中心趋势外,对数据进行统计描述还需要知道数据围绕中心点是如何分散的,
称之为离散趋势。常用的统计量有:极差、样本方差、样本标准差和方差系数等。
极差:样本最大观测值和最小观测值之间的差。
样本方差:一个样本的观测值为百,马,•/“,样本算数平均数记为样本方差记为
小,则有
52=(--,)2+(5/)2++(乙7)2,1汽“_嚏)2
〃一1H—1|=|
需要注意的是,样本方差的计算公式中,是使用偏差平方和除以〃-1,而不是除以〃,这
是因为我们在用样本估计总体时,除以〃-1所建立起的统计量是对总体方差更好的估计。
样本标准差:样本方差的算术平方根,即5=々。
样本方差在比较两组或者更多组数据的离散程度时,是•个很好的统计量。通常,样本
方差越大,代表数据本身的离散程度越大。而样本标准差则可以帮助我们了解数据大致集中
在哪个区域。
方差(或标准差)能较好的反映出数据的离散程度,是描述一组数据变异程度或
离散程度大小的重要指标.
例9.2求引例9.1牙膏销售问题中的本公司销售价格的极差、方差和标准差.
解因为本公司销售价格的最大值为3.9,最小值为3.55,所以极差为
/?=3.9—3.55=0.35,
元=3.735,
2222
S4(3.852+3.752+3.702++3.80+3.70-30x3.735)=0.008129,
5=VF=70.008129=0.090163.
方差系数:样本观测值的标准差除以样本均值的结果,即”=%.
例9.3表3-7给出了东风汽车和上海机场两种股票在12个交易口的价格,试比较两种
股票价格在这12个交易口内的活跃程度。
表3-7两只股票12个交易日的价格表
日期东风汽车上海机场日期东风汽车上海机场
200503103.1716.06200503182.9716.52
200503113.1616.55200503212.9416.65
200503143.1017.27200503222.7117.17
200503153.1016.82200503232.7416.90
200503163.0916.60200503242.7616.86
200503173.0216.65200503252.7516.79
解分别计算两组样本均值,样本标准差和方差系数,得
东风汽车:均值为2.96,标准差为2176,方差系数为0.059;
上海机场:均值为16.74,标准差为0.316,方差系数为0.019。
如果从标准差来看,上海机场的股票活跃程度要大于东风汽车,但从方差系数来看,上
海机场的方差系数仅为0.019,远小于东风汽车的0.059.两者存在矛盾是因为上海机场的
股价要高于东风汽车,因比含有量纲的标准差就会偏高,而采用方差系数考虑了股价的均值,
因此能更好地反映股价的活跃程度,因此可以从方差系数做出判断,东风汽车股价的活跃度
高于上海机场。
iii)分布形状
随机变量的分布形状主要包括偏度和峰度。
偏度:反映以平均值为中心的分布的不对称程度的量,其计算公式为
其中,;为样本均值,S为样本标准差,〃为样本容量。
若sk<0,则分布具有负偏态,此时数据位于均值左边的比位于右边的少,直观表现为
左边的尾部相对于右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长.
若sk〉O,则分布具有正偏态,此时数据位于均值右边的比位于左边的少,直观表现为
右边的尾部相对于左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长.
图3-11三种偏态示意图
如果偏度表示的是数据分布的对称程度,则峰度用天表述分布的尖锐度或者平坦度,川
与正态分布的比较值来度量。
峰度:反映与正态分布相比某一分布的尖锐度或平坦度,其计算公式为
…_/?(/!+1)3(〃-1产
(〃一1)(〃一2)(n-3)£(s)(〃-2)5—3)
其中,x为样本均值,s为样本标准差,〃为样本容量。
若bk<0,则表示峰度比正态分布平坦;若bk>0,则表示峰度比正态分布陡峭;若bk=O,
例9.4表3-8给出某股票在18个交易口的价格,试求该股票价格的偏度和峰度。
表3-8某股票18个交易日的件格表
日期价格日期价格日期价格
200503106.4200503186.29200503285.97
200503116.38200503216.16200503295.93
20050314G.44200503226.12200503305.94
200503156.36200503236.08200503315.54
200503166.24200503245.99200504015.36
200503176.35200503255.93200504045.4
解数据的偏度和峰度的计算公式较为复杂,我们可以借助EXCEL辅助计算。其中,偏度
的EXCEL指令是“=SKEW(数据对象)”,峰度的EXCEL指令是“=KURT(数据对象八
借助EXCEL求解,汇得该股票价格的偏度欣=-0.9236,峰度为人&=0.0687。说明
股票价格成负偏态;峰度值接近于0,其陡峭程度与正态分布接近。
事实上,由于上述统计量的应用十分广泛,EXCEL在分析工具中专门编写了“描述统计〃
指令来实现快速和智能化的计算,其调用步骤为:单击【数据】中的【数据分析】命令,在
弹出的数据分析对•话框中,选中【描述统计】。
注意:如果在【数据】中没有见到【数据分析】选项,则要依次通过【文件】->【选
项】T【加载项】T【/到】,在出现的【加载宏】对话框中选定【分析工具库】。
(3)相关分析与回归分析
现实生活中,事物之间存在相互关系上匕如,职业种类和收入之间的关系、
商品销售收入与广告支出经费之间的关系、粮食产量与施肥量之间的关系、人体
类内的脂肪含量与年龄之间的关系、工业产值与用电量等等.认识事物之间的关
系可以对经济现象进行预测和推断.下面将介绍线性相关关系,并利用线性相关
关系进行回归分析.
1.变量间相关关系的描述与度量
什么是线性相关关系?由表9-1看出,随着其他厂家平均价格与本公司销售
价格之差(即价格差)的增加,牙膏销售量也在增加,这就说明牙膏销售量与价格
差有关系,但是这种关系不是我们以前研究过的函数关系.也就是说当一个变量
(如价格差)确定后,无法确定另一个变量(如牙膏销售量).相关关系是指变量之间
确实存在密切关系,但是一个变量或几个变量取的确定值时,不能求出另一个变
量的确定值,而在大量的资料中,这种关系又具有统计规律性的关系.
为了刻画变量之间是否具有线性相关关系,可以通过散点图直接观察,也可
以通过相关系数的大小进行判断.
⑴散点图
用坐标的水平轴代表自变量x,纵轴代表因变量每组数据(西,男)在坐标
系中用一个点表示,〃组数据在坐标系中形成的〃个点称为散点,由坐标及其散
点形成的二维数据图称为散点图(scatterdiagram).散点图是描述变量之间关系的
一种直观方法,从中可以大体上看出变量之间的关系形态及关系强度.
如果散点图中的散点都大致分布在一条直线的周围,这就说明变量之间存在
线性相关关系,否则不存在线性相关关系.
以引例9.1中所给的数据为例,得到牙膏销售量对价格差及广告费用的数点
图分别如图9-1、图9-2所示.
1000--------------------------------------------10.00
《9150
与
y9.&00
.9.V
u9._50
8J00
"&
之-50
UN
-8备1
)》
v
:?;
E7b
Ss
7.007.00
-0.200.000.200.400.600.805.005.506.006.507.007.50
价格望《破位:元》广告费用(单位:百万元)
图9-1销售量对价格差散点图图9-2销售量对广告费用散点图
由图9-1、图9-2可以看出,虽然数据点不全在一条直线上,但近似在一条
直线附近.因此可以认为牙膏销售量对价格差及广告费用之间存在线性相关关系.
⑵相关系数
相关系数(correlationcoefficient)是对变量之间线性关系密切程度的度量.
若变量x、y的〃个数据(七,y),(/=1,2,«••,«),则变量x、y相关系数。的计
算公式为
£(马一刀)(),一刃
r=।”---------
位⑷一方次(),厂用2
V加121
其中亍=巧为,y=.
可以证明,相关系数的取值范围在+1和一1之间,即
若0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智商经典数学题目及答案
- 政府审计辩论题目及答案
- 1《沁园春雪》课件(共27张)
- 临床执业(助理)医师资格实践技能考试 全真模拟演练 A卷
- 阿里云大模型工程师aca考试题目及答案
- 吉水县2026年城北菜市场片区老旧小区改造项目水土保持方案报告表
- 南县6万吨粮食绿色仓储建设项目(茅草街地块)环境影响报告表
- 华能大通湖区千山红镇种福村胜利渠风电场工程环境影响报告表
- BIM-建筑工程计量与计价 课件 第16、17章 工程量清单编制、最高投标限价编制
- 2026服装城文员面试题及答案
- 不得诋毁对方的协议书
- 行星架铸造工艺设计【版本2】
- 公安院校公安学科专业招生政治考察表
- 雨水泵站管理制度上墙
- 电梯使用单位日管控、周排查、月调度电梯安全检查记录表
- 商场超市消防安全管理制度
- T-SZRCA 009-2024 拖链型机器人特种线缆技术规范
- 江苏省医保基金智能监管系统(定点医药机构)用户操作手册
- CJT 486-2015 土壤固化外加剂
- 2023年江苏省无锡市中考政治真题含解析
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
评论
0/150
提交评论