《标志变异指标》课件_第1页
《标志变异指标》课件_第2页
《标志变异指标》课件_第3页
《标志变异指标》课件_第4页
《标志变异指标》课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节标志变异指标一、标志变异指标的意义和作用二、全距三、平均差四、标准差五、离散系数六、用EXCEL计算描述统计量

上一页下一页返回本章首页第四节标志变异指标一、标志变异指标的意义和作用上一页下一页1一、标志变动度的意义和作用标志变异指标也称为标志变动度,是与平均指标相联系的一种综合指标。用于综合反映总体各个单位标志值的差异的程度。总体指标和平均指标都是对总体的规模和一般水平的认识,但这些指标不能反映各单位的差异情况,相反地却掩盖了这些差异。如:变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大一、标志变动度的意义和作用标志变异指标也称为标志变动度,是与2例某车间两个生产小组各人日产量如下:甲组:20,40,60,70,80,100,120乙组:67,68,69,70,71,72,73从下图可以看出甲组离散程度大,乙组离散程度小。上一页下一页返回本节首页上一页下一页返回本节首页37070上一页下一页返回本节首页7070上一页下一页返回本节首页4上一页下一页返回本节首页标志变动度的作用用来反映总体各单位标志值分布的离中趋势;可以说明平均指标的代表性程度;说明现象变动的均匀性或稳定性。 上一页下一页返回本节首页标志变动度的作用用来反映总体各单位标5指所研究的数据中,最大值与最小值之差,又称极差。二、全距最大变量值或最高组上限或开口组假定上限最小变量值或最低组下限或开口组假定下限【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则《统计学》第五章变量数列分析指所研究的数据中,最大值与最小值之差,又称极差。二、全距最大6【例B】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—1824900计算该公司该季度计划完成程度的全距。《统计学》第五章变量数列分析【例B】某季度某工业公司18个工业企业产值计划完成情况如下:7优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差往往应用于生产过程的质量控制中全距的特点《统计学》第五章变量数列分析优点:计算方法简单、易懂;往往应用于生产过程的质量控制中全距8第个单位的变量值⑴简单平均差——适用于未分组资料是各个数据与其算术平均数的离差绝对值的算术平均数,用表示三、平均差计算公式:总体算术平均数总体单位总数《统计学》第五章变量数列分析第个单位的变量值⑴简单平均差——适用于未分组资料是9【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。解:即该售货小组5个人销售额的平均差为93.6元。《统计学》第五章变量数列分析【例A】某售货小组5个人,某天的销售额分别为440元、48010⑵加权平均差——适用于分组资料平均差的计算公式总体算术平均数第组变量值出现的次数第组的变量值或组中值《统计学》第五章变量数列分析⑵加权平均差——适用于分组资料平均差的计算公式总体算术平均11【例B】计算下表中某公司职工月工资的平均差。月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000《统计学》第五章变量数列分析【例B】计算下表中某公司职工月工资的平均差。月工资(元)组中12解:即该公司职工月工资的平均差为138.95元。《统计学》第五章变量数列分析解:即该公司职工月工资的平均差为138.95元。《统计学》第13优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。平均差的特点一般情况下都是通过计算另一种标志变异指标——标准差,来反映总体内部各单位标志值的差异状况《统计学》第五章变量数列分析优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差14⑴简单标准差——适用于未分组资料是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用来表示;标准差的平方又叫作方差,用来表示。标准差计算公式:总体单位总数第个单位的变量值总体算术平均数《统计学》第五章变量数列分析⑴简单标准差——适用于未分组资料是各个数据与其算术平均数的15【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。解:(比较:其销售额的平均差为93.6元)即该售货小组销售额的标准差为109.62元。《统计学》第五章变量数列分析【例A】某售货小组5个人,某天的销售额分别为440元、48016⑵加权标准差——适用于分组资料标准差的计算公式总体算术平均数第组变量值出现的次数第组的变量值或组中值《统计学》第五章变量数列分析⑵加权标准差——适用于分组资料标准差的计算公式总体算术平均17【例B】计算下表中某公司职工月工资的标准差。月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000《统计学》第五章变量数列分析【例B】计算下表中某公司职工月工资的标准差。月工资(元)组中18解:(比较:其工资的平均差为138.95元)即该公司职工月工资的标准差为167.9元。《统计学》第五章变量数列分析解:(比较:其工资的平均差为138.95元)即该公司职工月工19由同一资料计算的标准差的结果一般要略大于平均差。证明:当a,b,c≥0时,有标准差的特点不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.《统计学》第五章变量数列分析由同一资料计算的标准差的结果一般要略大于平均差。标准差的特点20简单标准差加权标准差标准差的简捷计算避免离差平方和计算过程的出现目的:变量值平方的平均数变量值平均数的平方《统计学》第五章变量数列分析简单标准差加权标准差标准差的简捷计算避免离差平方和计算过程的21可比变异系数指标《统计学》第五章变量数列分析可比变异系数指标《统计学》第五章变量数列分析22身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比较可比《统计学》第五章变量数列分析身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比23平均差系数标准差系数变异系数指标用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小:——标准差系数小的总体,其平均数的代表性大;反之,亦然。应用:《统计学》第五章变量数列分析平均差系数标准差系数变异系数指标用来对比不同水平的同类现象,24【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。解:一班成绩的标准差系数为:二班成绩的标准差系数为:因为,所以一班平均成绩的代表性比二班大。《统计学》第五章变量数列分析【例】某年级一、二两班某门课的平均成绩分别为82分和76分,25是非标志总体分组单位数变量值具有某一属性不具有某一属性10合计—为研究是非标志总体的数量特征,令指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志是非标志《统计学》第五章变量数列分析是非标志总体分组单位数变量值具有某一属性1合计—为研究是非标26是非标志总体的指标具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数《统计学》第五章变量数列分析是非标志总体的指标具有某种标志表现的不具有某种标志表现指是非27是非标志总体的指标均值标准差《统计学》第五章变量数列分析是非标志总体的指标均标《统计学》第五章变量数列分析28是非标志总体的指标方差标准差系数《统计学》第五章变量数列分析是非标志总体的指标方差标准差系数《统计学》第五章变量数列29【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。是非标志总体的指标解:《统计学》第五章变量数列分析【例】某厂某月份生产了400件产品,其中合格品380件,不合30三、平均差㈠平均差的概念与计算平均差是各单位标志值对平均数离差绝对值的平均数。计算公式上一页下一页返回本节首页三、平均差㈠平均差的概念与计算上一页下一页返回本节首页31㈡平均差的特点:计算方便、易于理解指标粗糙上一页下一页返回本节首页㈡平均差的特点:上一页下一页返回本节首页32例:书上P131表4-23⒈用加权平均数公式计算加权算术平均数2ndF,ON,7.5,,30,M+,12.5,,70,M+,17.5,,100,M+,22.5,,50,M+,27.5,10,M+,x→M,结果为16.35⒉计算离差绝对值,分别为8.85、3.85、1.15、6.15、11.15⒊对离差绝对值计算加权平均数2ndF,ON,8.85,,30,M+,3.85,,70,M+,1.15,,100,M+,6.15,,50,M+,11.15,10,M+,x→M,结果为4.11上一页下一页返回本节首页例:书上P131表4-23上一页下一页返回本节首页33四、标准差㈠标准差的概念与计算平均差是各单位标志值与其算术平均数离差平方的算术平均数的平方根。计算公式上一页下一页返回本节首页四、标准差㈠标准差的概念与计算上一页下一页返回本节首页34例:书上P133表4-242ndF,ON,55,,10,M+,65,,19,M+,75,,50,M+,85,,36,M+,95,27,M+,105,,14,M+,115,,8,M+,2ndF,RM,结果为14.85称为方差。上一页下一页返回本节首页例:书上P133表4-24上一页下一页返回本节首页35五、离散系数标志变动度的数值大小,不仅受离散程度影响,而且还受平均水平高低的影响,因此,在平均数不相等时,不能简单根据标准差或平均差大小来比较离散程度。例:有两组工人日产量甲组:60、65、70、75、80乙组:2、5、7、9、12不能简单断言甲组离散程度大于乙组离散程度上一页下一页返回本节首页五、离散系数标志变动度的数值大小,不仅受离散程度影响,而且还36可以计算离散系数本例中即乙组的离散程度大于甲组。由此可见,当我们比较两组数据的离散程度时,如两组平均数相等,可以直接比较标准差;如两组平均数不等,则需比较两组的离散系数。上一页下一页返回本节首页可以计算离散系数即乙组的离散程度大于甲组。上一页下一页返回本37六、用EXCEL计算描述统计量用EXCEL计算平均数、标准差等描述性统计量有两种方法,一是用函数,二是用“数据分析”工具。第一次使用“数据分析”时,需在EXCEL工具菜单中选“加载宏”,选“分析工具库”。这样在“工具”菜单中就会出现“数据分析”。上一页下一页返回本节首页六、用EXCEL计算描述统计量用EXCEL计算平均数、标准差38①打开“4数据描述.xls”工作簿,选择“网上冲浪”工作表。②打开“工具”菜单,选择“数据分析”选项,打开数据分析对话框如图所示。上一页下一页返回本节首页①打开“4数据描述.xls”工作簿,选择“网上冲浪”工作表。39③双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计对话框打开如图所示。④在“输入区域”中输入A1:A21。上一页下一页返回本节首页③双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计40⑤由于所选数据范围包括一个标志名称,单击“标志位于第一行”选项边上的复选框。⑥单击“输出区域”项,旁边出现了一个输入框,单击此框出现插入符,单击C1,在输入框中出现输出地址“$B$1”,这是输出结果的左上角起始位置。⑦单击“汇总统计”,如不选此项,则Excel省略部分输出结果。上一页下一页返回本节首页⑤由于所选数据范围包括一个标志名称,单击“标志位于第一行”选41⑧单击“确定”按钮,将产生输出结果,如下图所示。上一页下一页返回本节首页⑧单击“确定”按钮,将产生输出结果,如下图所示。上一页下一页42在上表中:平均—算术平均数标准误差—估计标准误差,在抽样调查一章会讲到中值—中位数模式—众数标准偏差—样本标准差s,分母除以n-1样本方差—s平方峰值—反映钟形分布峰高的一个指标偏斜度—反映偏斜程度的一个指标区域—全距,等于最大值减最小值计数—单位数上一页下一页返回本节首页在上表中:上一页下一页返回本节首页43第五节案例研究:

“OldFaithful”间歇喷泉的喷发间歇喷泉是一种向空中喷出热水和热气的温泉,其名字的由来是因为这种喷泉要经过一段相对稳定的状态后才能喷发。有时它喷射的时间间隔不太稳定。Ohio(俄亥俄)州黄石国家公园中的“OldFaithful”间歇喷泉是世界上最著名的间歇喷泉之一。参观者们都希望到公园后不用等多久就能看到喷泉的喷发。国家公园的服务部门就在喷泉处安装了一个指示牌预报下次喷泉喷发的时间如下表所示。上一页下一页返回本章首页第五节案例研究:

“OldFaithful”间歇喷泉的喷44开始时间持续时间预测区间预测下一次喷发时间6:351分55秒58分7:33am7:32接近4秒82分8:54am8:591分51秒58分9:57am10:124分33秒89分11:41am11:461分42秒58分12:44am中午吃饭2:061分41秒55分3:01am注:数据来源:《应用线性回归》第二版,作者:S.Weisberg。“OldFaithful”间歇喷泉喷发时间表上一页下一页返回本节首页开始时间持续时间预测区间预测下一次喷发时间6:351分55秒45那么,公园是如何得到这个结果的呢?为了了解喷泉喷发间隔时间的规律,以1978年8月至1979年8月间喷泉222次喷发)的间隔时间记录为样本(见上表)进行分析。①打开”4数据描述.xls”工作簿,“喷泉“工作表。②单击“工具”菜单,选择“数据分析”选项,打开“直方图”对话框。③在输入区域输入单元格C1:C223,选择“标志”,在输出区域中输入单元格“D1”,选择“图表输出”,单击“确定”按钮。上一页下一页返回本节首页那么,公园是如何得到这个结果的呢?为了了解上一页下一页返回本46将所得的直方图进行修饰,便得到下图:从图中可以看出,喷泉喷发的间隔时间一般在40~100分钟内变动。但是,在数据中明显地存在两个子群,它们的中心大约分别在喷发间隔55分钟和80分钟,这样在图形中间形成一个缺口。然而我们利用描述统计分析工具所得的结果与此便大不一样。上一页下一页返回本节首页将所得的直方图进行修饰,便得到下图:上一页下一页返回本节首页47利用描述统计分析工具分析该喷泉的间隔时间,方法如下:①打开“4数据描述.xls”工作簿,选择“喷泉”工作表。②从“工具”菜单中选择“数据分析”选项,打开“描述统计”对话框。③在输入区域中输入“C1:C223”,选择标志位于第一行。“输出区域”选择D19。⑥选择“汇总统计”和“平均数置信度”,单击“确定”按钮,结果如下表所示。上一页下一页返回本节首页上一页下一页返回本节首页48

“OldFaithfaul”

喷泉间隔时间描述统计表

(表一)(表二)

统计指标数值平均数71.00901标准误差0.859024中位数75众数75标准差12.799018样本方差163.8189峰度-0.48552统计指标数值偏度-0.48552全距53最小值42最大值95合计15764单位数222置信度1.692928上一页下一页返回本节首页统计指标数值平均数71.49由于描述统计指标的概括性与抽象性,容易使人对事物的真实情况产生误解。例如:从上表中可以看出平均间隔时间大约为71分钟。事实上,间歇时间大致呈现双峰分布,因而这一平均数并不能确切描述上述两个子群中任何一个子群的特征。按喷发持续的时间将观察值分成两组,可以对两种喷发的不同特性在更多细节上作出检测。下表是以喷发持续的时间是少于还是大于3分钟为依据分组,分别列出喷发间歇时间的主要统计指标。上一页下一页返回本节首页由于描述统计指标的概括性与抽象性,容易使人对事物的真实情况产50喷泉喷发间歇时间的主要描述统计指标间歇时间统计指标喷发时间<3分钟喷发时间>3分钟样本数67155平均数54.46378.161标准差6.29896.8911最小值42.00053.000中位数53.00078.000最大值78.00095.000上一页下一页返回本节首页喷泉喷发间歇时间的主要描述统计指标51根据上述统计指标和图表,可以得出一个简单的预测规律:一个持续时间少于3分钟的喷发将必然伴随着一个大约55分钟的间歇;一个持续时间大于3分钟的喷发将必然伴随着一个大约80分钟的间歇。并且,后者这种较长的间歇发生的可能性为67%。这样,通过一个非常简单的规则,国家公园的工作人员能够保证来黄石公园的游客不用等很长时间就会观看到“旧费尔斯福”间歇喷泉的喷发。上一页下一页返回本节首页根据上述统计指标和图表,可以得出一个简单的预测规律:一个持续52第四节标志变异指标一、标志变异指标的意义和作用二、全距三、平均差四、标准差五、离散系数六、用EXCEL计算描述统计量

上一页下一页返回本章首页第四节标志变异指标一、标志变异指标的意义和作用上一页下一页53一、标志变动度的意义和作用标志变异指标也称为标志变动度,是与平均指标相联系的一种综合指标。用于综合反映总体各个单位标志值的差异的程度。总体指标和平均指标都是对总体的规模和一般水平的认识,但这些指标不能反映各单位的差异情况,相反地却掩盖了这些差异。如:变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大一、标志变动度的意义和作用标志变异指标也称为标志变动度,是与54例某车间两个生产小组各人日产量如下:甲组:20,40,60,70,80,100,120乙组:67,68,69,70,71,72,73从下图可以看出甲组离散程度大,乙组离散程度小。上一页下一页返回本节首页上一页下一页返回本节首页557070上一页下一页返回本节首页7070上一页下一页返回本节首页56上一页下一页返回本节首页标志变动度的作用用来反映总体各单位标志值分布的离中趋势;可以说明平均指标的代表性程度;说明现象变动的均匀性或稳定性。 上一页下一页返回本节首页标志变动度的作用用来反映总体各单位标57指所研究的数据中,最大值与最小值之差,又称极差。二、全距最大变量值或最高组上限或开口组假定上限最小变量值或最低组下限或开口组假定下限【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则《统计学》第五章变量数列分析指所研究的数据中,最大值与最小值之差,又称极差。二、全距最大58【例B】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—1824900计算该公司该季度计划完成程度的全距。《统计学》第五章变量数列分析【例B】某季度某工业公司18个工业企业产值计划完成情况如下:59优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差往往应用于生产过程的质量控制中全距的特点《统计学》第五章变量数列分析优点:计算方法简单、易懂;往往应用于生产过程的质量控制中全距60第个单位的变量值⑴简单平均差——适用于未分组资料是各个数据与其算术平均数的离差绝对值的算术平均数,用表示三、平均差计算公式:总体算术平均数总体单位总数《统计学》第五章变量数列分析第个单位的变量值⑴简单平均差——适用于未分组资料是61【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。解:即该售货小组5个人销售额的平均差为93.6元。《统计学》第五章变量数列分析【例A】某售货小组5个人,某天的销售额分别为440元、48062⑵加权平均差——适用于分组资料平均差的计算公式总体算术平均数第组变量值出现的次数第组的变量值或组中值《统计学》第五章变量数列分析⑵加权平均差——适用于分组资料平均差的计算公式总体算术平均63【例B】计算下表中某公司职工月工资的平均差。月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000《统计学》第五章变量数列分析【例B】计算下表中某公司职工月工资的平均差。月工资(元)组中64解:即该公司职工月工资的平均差为138.95元。《统计学》第五章变量数列分析解:即该公司职工月工资的平均差为138.95元。《统计学》第65优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。平均差的特点一般情况下都是通过计算另一种标志变异指标——标准差,来反映总体内部各单位标志值的差异状况《统计学》第五章变量数列分析优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差66⑴简单标准差——适用于未分组资料是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用来表示;标准差的平方又叫作方差,用来表示。标准差计算公式:总体单位总数第个单位的变量值总体算术平均数《统计学》第五章变量数列分析⑴简单标准差——适用于未分组资料是各个数据与其算术平均数的67【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。解:(比较:其销售额的平均差为93.6元)即该售货小组销售额的标准差为109.62元。《统计学》第五章变量数列分析【例A】某售货小组5个人,某天的销售额分别为440元、48068⑵加权标准差——适用于分组资料标准差的计算公式总体算术平均数第组变量值出现的次数第组的变量值或组中值《统计学》第五章变量数列分析⑵加权标准差——适用于分组资料标准差的计算公式总体算术平均69【例B】计算下表中某公司职工月工资的标准差。月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000《统计学》第五章变量数列分析【例B】计算下表中某公司职工月工资的标准差。月工资(元)组中70解:(比较:其工资的平均差为138.95元)即该公司职工月工资的标准差为167.9元。《统计学》第五章变量数列分析解:(比较:其工资的平均差为138.95元)即该公司职工月工71由同一资料计算的标准差的结果一般要略大于平均差。证明:当a,b,c≥0时,有标准差的特点不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.《统计学》第五章变量数列分析由同一资料计算的标准差的结果一般要略大于平均差。标准差的特点72简单标准差加权标准差标准差的简捷计算避免离差平方和计算过程的出现目的:变量值平方的平均数变量值平均数的平方《统计学》第五章变量数列分析简单标准差加权标准差标准差的简捷计算避免离差平方和计算过程的73可比变异系数指标《统计学》第五章变量数列分析可比变异系数指标《统计学》第五章变量数列分析74身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比较可比《统计学》第五章变量数列分析身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比75平均差系数标准差系数变异系数指标用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小:——标准差系数小的总体,其平均数的代表性大;反之,亦然。应用:《统计学》第五章变量数列分析平均差系数标准差系数变异系数指标用来对比不同水平的同类现象,76【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。解:一班成绩的标准差系数为:二班成绩的标准差系数为:因为,所以一班平均成绩的代表性比二班大。《统计学》第五章变量数列分析【例】某年级一、二两班某门课的平均成绩分别为82分和76分,77是非标志总体分组单位数变量值具有某一属性不具有某一属性10合计—为研究是非标志总体的数量特征,令指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志是非标志《统计学》第五章变量数列分析是非标志总体分组单位数变量值具有某一属性1合计—为研究是非标78是非标志总体的指标具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数《统计学》第五章变量数列分析是非标志总体的指标具有某种标志表现的不具有某种标志表现指是非79是非标志总体的指标均值标准差《统计学》第五章变量数列分析是非标志总体的指标均标《统计学》第五章变量数列分析80是非标志总体的指标方差标准差系数《统计学》第五章变量数列分析是非标志总体的指标方差标准差系数《统计学》第五章变量数列81【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。是非标志总体的指标解:《统计学》第五章变量数列分析【例】某厂某月份生产了400件产品,其中合格品380件,不合82三、平均差㈠平均差的概念与计算平均差是各单位标志值对平均数离差绝对值的平均数。计算公式上一页下一页返回本节首页三、平均差㈠平均差的概念与计算上一页下一页返回本节首页83㈡平均差的特点:计算方便、易于理解指标粗糙上一页下一页返回本节首页㈡平均差的特点:上一页下一页返回本节首页84例:书上P131表4-23⒈用加权平均数公式计算加权算术平均数2ndF,ON,7.5,,30,M+,12.5,,70,M+,17.5,,100,M+,22.5,,50,M+,27.5,10,M+,x→M,结果为16.35⒉计算离差绝对值,分别为8.85、3.85、1.15、6.15、11.15⒊对离差绝对值计算加权平均数2ndF,ON,8.85,,30,M+,3.85,,70,M+,1.15,,100,M+,6.15,,50,M+,11.15,10,M+,x→M,结果为4.11上一页下一页返回本节首页例:书上P131表4-23上一页下一页返回本节首页85四、标准差㈠标准差的概念与计算平均差是各单位标志值与其算术平均数离差平方的算术平均数的平方根。计算公式上一页下一页返回本节首页四、标准差㈠标准差的概念与计算上一页下一页返回本节首页86例:书上P133表4-242ndF,ON,55,,10,M+,65,,19,M+,75,,50,M+,85,,36,M+,95,27,M+,105,,14,M+,115,,8,M+,2ndF,RM,结果为14.85称为方差。上一页下一页返回本节首页例:书上P133表4-24上一页下一页返回本节首页87五、离散系数标志变动度的数值大小,不仅受离散程度影响,而且还受平均水平高低的影响,因此,在平均数不相等时,不能简单根据标准差或平均差大小来比较离散程度。例:有两组工人日产量甲组:60、65、70、75、80乙组:2、5、7、9、12不能简单断言甲组离散程度大于乙组离散程度上一页下一页返回本节首页五、离散系数标志变动度的数值大小,不仅受离散程度影响,而且还88可以计算离散系数本例中即乙组的离散程度大于甲组。由此可见,当我们比较两组数据的离散程度时,如两组平均数相等,可以直接比较标准差;如两组平均数不等,则需比较两组的离散系数。上一页下一页返回本节首页可以计算离散系数即乙组的离散程度大于甲组。上一页下一页返回本89六、用EXCEL计算描述统计量用EXCEL计算平均数、标准差等描述性统计量有两种方法,一是用函数,二是用“数据分析”工具。第一次使用“数据分析”时,需在EXCEL工具菜单中选“加载宏”,选“分析工具库”。这样在“工具”菜单中就会出现“数据分析”。上一页下一页返回本节首页六、用EXCEL计算描述统计量用EXCEL计算平均数、标准差90①打开“4数据描述.xls”工作簿,选择“网上冲浪”工作表。②打开“工具”菜单,选择“数据分析”选项,打开数据分析对话框如图所示。上一页下一页返回本节首页①打开“4数据描述.xls”工作簿,选择“网上冲浪”工作表。91③双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计对话框打开如图所示。④在“输入区域”中输入A1:A21。上一页下一页返回本节首页③双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计92⑤由于所选数据范围包括一个标志名称,单击“标志位于第一行”选项边上的复选框。⑥单击“输出区域”项,旁边出现了一个输入框,单击此框出现插入符,单击C1,在输入框中出现输出地址“$B$1”,这是输出结果的左上角起始位置。⑦单击“汇总统计”,如不选此项,则Excel省略部分输出结果。上一页下一页返回本节首页⑤由于所选数据范围包括一个标志名称,单击“标志位于第一行”选93⑧单击“确定”按钮,将产生输出结果,如下图所示。上一页下一页返回本节首页⑧单击“确定”按钮,将产生输出结果,如下图所示。上一页下一页94在上表中:平均—算术平均数标准误差—估计标准误差,在抽样调查一章会讲到中值—中位数模式—众数标准偏差—样本标准差s,分母除以n-1样本方差—s平方峰值—反映钟形分布峰高的一个指标偏斜度—反映偏斜程度的一个指标区域—全距,等于最大值减最小值计数—单位数上一页下一页返回本节首页在上表中:上一页下一页返回本节首页95第五节案例研究:

“OldFaithful”间歇喷泉的喷发间歇喷泉是一种向空中喷出热水和热气的温泉,其名字的由来是因为这种喷泉要经过一段相对稳定的状态后才能喷发。有时它喷射的时间间隔不太稳定。Ohio(俄亥俄)州黄石国家公园中的“OldFaithful”间歇喷泉是世界上最著名的间歇喷泉之一。参观者们都希望到公园后不用等多久就能看到喷泉的喷发。国家公园的服务部门就在喷泉处安装了一个指示牌预报下次喷泉喷发的时间如下表所示。上一页下一页返回本章首页第五节案例研究:

“OldFaithful”间歇喷泉的喷96开始时间持续时间预测区间预测下一次喷发时间6:351分55秒58分7:33am7:32接近4秒82分8:54am8:591分51秒58分9:57am10:124分33秒89分11:41am11:461分42秒58分12:44am中午吃饭2:061分41秒55分3:01am注:数据来源:《应用线性回归》第二版,作者:S.Weisberg。“OldFaithful”间歇喷泉喷发时间表上一页下一页返回本节首页开始时间持续时间预测区间预测下一次喷发时间6:351分55秒97那么,公园是如何得到这个结果的呢?为了了解喷泉喷发间隔时间的规律,以1978年8月至1979年8月间喷泉222次喷发)的间隔时间记录为样本(见上表)进行分析。①打开”4数据描述.xls”工作簿,“喷泉“工作表。②单击

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论