统计实习指导及统计学 易错点_第1页
统计实习指导及统计学 易错点_第2页
统计实习指导及统计学 易错点_第3页
统计实习指导及统计学 易错点_第4页
统计实习指导及统计学 易错点_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实习一电子计算器的应用随着计算机的广泛使用,SPSS、SAS等统计软件也已经被各行各业广泛应用,但是,电子计算器仍然以其使用简单、便于携带等优点而成为统计计算中重要的、使用较多的统计工具之一。我们下边以CASIOfx-3800为例,介绍一下电子计算器的使用。电子计算器根据其功能功能可以分为5类:如果只有加减乘除的功能等简单功能,称为简易型计算器;在简易型计算器功能的基础上具备了括号、成方、开方、百分比、储存运算功能,则称之为普及型计算器;科技型(函数)计算器:除了具有普及型计算器功能外,还有三角函数,指数函数,双曲线函数,以及它们的反函数,统计中的均数、标准差等运算功能。较高级的科技型计算器还有储存器,坐标变换、排列组合、积分、线性相关与回归等功能;程序型计算器:除了科技型计算器功能外,还有编辑程序功能,数高科技型计算器。专用型计算器:能根据特殊需要完成特定功能。CASIOfx-3800属于程序型计算器。一屏幕显示符号及其意义1.“E”:出现“E”表示溢出或操作错误,应停止运算,按AC键消除后,重新运算。2.“M”:为存储运算符号,表示M寄存器内有数据,有的计算器以“,”代替。3.“S”:为第二功能指示符号,指示可使用各键的第二功能。4.“SD”:为统计运算符号,指示可以启用统计功能键。5.“LR”:相关与回归状态。6.“LRN”:学习模式,及编程状态,可将具有变量的代数式存入计算器内。7.“DEC”:(度)RAD(弧度)GRA(梯度)为角度模式符号,指示相应的角度模式。角度模式选择状态对其它计算无影响(900=π/2=100梯度)二常用的键钮功能1.AC总清除2.C只清除最后输入的数字3.SHIFT第二功能启动键4.MODE3统计运算状态5.DATA统计状态时输入数据键6.SHIFTDEL清除输入错误的统计数据7.SHIFT均数8.SHIFTΧσn-1样本标准差9.SHIFTΧσn总体标准差10.Koutn样本例数11.Kout∑x变量值的和12.Kout∑x2变量值的平方和13.MODE3SHIFTKAC清除统计状态存入的数据14.M+累计存储15.MR显示储存数据(M系统)16.SHIFTMin清除M系统原数据并存储屏幕正在显示值17.MODE7小数点定位(所按数字及保留位数)18.MODE9恢复位数19.+/-符号转换20.ENG工程键以10的三倍级表示21.[()]括号22.XD,YD寄存交换器(输入双变量使用)23.SHIFTX!阶乘24.SHIFTxy乘方25.SHIFTx1/y开方26.log常用对数27.10x常用对数的反对数28.SHIFTln自然对数29.SHIFTex自然对数的反对数30.MODE2相关与回归31.1/x倒数三四则运算四则运算的规则是先乘除后加减,如果遇到括号括号优先,对于分数处理,以除号代替分数线,分子和分母的式子分别用括号;遇到开平方时,根号内式子用括号后再按平方键,这样才能保证对整个式子的值开方。例1.37.5×(17.5+34)÷(-86.5)例2.操作37.5×(17.5+34)÷86.5±-22.3265896(4.61-5.50)÷((1.57X2×11+1.20X2×9)÷(11+10-2)×(111/X+101/X))=-1.46四定数运算用于某些数共同加或减、乘或除某一个数例1.535+126=例2.383-14=548+126=156.3-14=385+126=36-14=例3.259÷6=例4.158×27=178÷6=-23.5×27=253÷6=498×27=操作例1.126eq\o\ac(□,+)eq\o\ac(□,+)(屏幕显示k)例3.6eq\o\ac(□,÷)eq\o\ac(□,÷)(屏幕显示k)535=661259=43.16666667548=674178=29.66666667385=511253=42.16666667例2、例4计算方法类似。五对数,反对数运算例操作显示Log23.523.5log1.371067862Ln17.817.8shiftln2.054123734Log23.5+ln17.823.5log+17.8shiftln3.425191596103.753.7510x5623.413252E1.81.8shiftex6.049647464261.526shiftxy1.5132.57450748shiftx1/y32六运用存储功能运算电子计算器的类型不同,寄存器的种类、功能也略有不同,就CASIOfx-3800而言,寄存器共有四种,分别是X、Y、M、K寄存器,X,Y寄存器主要用于算术和函数运算。M寄存器是独立存储器,用于累加累减的运算;K寄存器常用于存储中间的运算结果。例1.M寄存器的累加运算3+8+15+233shiftmin消除原数据存入38M+815M+1523M+23MR4935-17-6ACSHIFTMIN035M+3517SHIFTM-176SHIFTM-6MR1225×13+35÷12ACSHIFTMIN025×13M+32535÷12M+2.916666667MR327.9166667例2.K寄存器的使用如果在计算过程中有临时的数据当前计算并不需要,而在后边的计算才需用到时,可以将这些数据临时寄存在K寄存器上。fx-3800共用6个K寄存器,分别对应着数字键1~6,Kin和Kout键可用来存储和提取数据。例计算得到的数值38.695,当前计算并不需要,则可先存储在K寄存器上,操作如下:38.695Kin1(将数字38.695存储在1号K寄存器上)如果要提取这个数值,操作如下:Kout1使用中注意,同一个K寄存器只能存储一个数值,当有新的数值存储进去时,则原有数据会被清除。七统计运算1小样本直接计算均数、标准差等有9名健康成人的空腹胆固醇测定值(mmol/L)为5.613.963.674.994.245.065.204.795.93分别计算其均数和标准差(第4版预防医学例8.2)MODE3SHIFTKACSD5.61DATA5.613.96DATA3.963.67DATA3.674.99DATA4.994.24DATA4.245.06DATA5.065.20DATA5.24.79DATA4.795.93DATA5.93SHIFT4.827777778SHIFTXσn-10.748828715Kout∑x43.45Kout∑x2214.25292频数表法计算均数、标准差等指标观察值3.6~3.8~4.0~4.2~4.4~4.6~4.8~5.0~5.2~5.4~5.6组中值3.73.94.14.34.54.74.95.15.35.5频数3382324252012104(第4版预防医学例8.1)MODE3SHIFTKACSD3.7×3DATA3.73.9×3DATA3.94.1×8DATA4.14.3×23DATA4.34.5×24DATA4.54.7×25DATA4.74.9×20DATA4.95.1×12DATA5.15.3×10DATA5.35.5×4DATA5.5SHIFT4.653030303SHIFTXσn-10.400655835KOUTn132Kout∑x614.2Kout∑x22878.923几何均数和标准差的计算抗体滴度倒数248163264128MODE3SHIFTKACSD2LOGDATA0.3010299954LOGDATA0.6020599918LOGDATA0.90308998716LOGDATA1.20411998332LOGDATA1.50514997864LOGDATA1.806179974128LOGDATA2.10720997SHIFT10X16SHIFTXσn-110X4.469913457(第4版预防医学例8.3)七相关与回归计算患者号12345678910血清IL-6(x)22.451.658.125.165.979.775.332.496.485.7脑脊液IL-6(y)134.0167.0132.380.2100.0139.1187.297.2192.3199.4(第4版预防医学例13.1)血清IL-6脑脊液IL-6按键显示MODE2SHIFTKACLR22.4134.022.4XD,YD134.0DATA13451.6167.051.6XD,YD167.0DATA16758.1132.358.1XD,YD132.3DATA132.325.180.225.1XD,YD80.2DATA80.265.9100.065.9XD,YD100.0DATA10079.7139.179.7XD,YD139.1DATA139.175.3187.275.3XD,YD187.2DATA187.232.497.232.4XD,YD97.2DATA97.296.4192.396.4XD,YD192.3DATA192.385.7199.485.7XD,YD199.4DATA199.4SHIFTr0.72324SHIFTB1.17970SHIFTA72.960731.某工厂附属医院2003年随机调查了该厂120名健康职工餐后两小时的血糖值(mmol/L),结果如下:4.95.44.83.04.74.35.45.64.75.45.45.85.14.13.73.14.95.35.35.14.14.93.84.93.42.44.65.14.44.15.55.34.65.14.44.45.13.93.65.65.23.63.64.64.93.43.95.75.64.85.75.35.35.35.03.15.44.45.43.75.44.65.35.74.84.65.65.63.84.34.72.85.35.05.74.04.75.85.13.75.33.64.85.34.75.25.25.55.53.25.13.05.75.34.74.25.75.14.85.44.43.45.45.24.54.74.02.94.83.44.25.34.23.64.94.14.15.35.34.8(1)请编制频数表,并简述其分布特征。(2)请计算算术均数、标准差、中位数、四分位数间距和变异系数。(3)试用双侧正态法和百分位数法估计双侧95%参考值范围。(4)试估计血糖值在4.2~5.2mmol/L范围的健康职工所占的比例。2.将31名麻疹易感儿童随机分组,分别接种新、旧两种减毒活疫苗,接种1个月测得血清血凝抑制效价如下。血清稀释度1:81:161:321:641:1281:256新疫苗(22人)594220旧疫苗(25人)355732请分别计算两组血清血凝抑制的平均效价。1.某一研究组测量了某年上海市区100名男婴的出生体重,其平均体重为3.29kg,标准差为0.44kg,已知以前上海市区男婴出生体重为3.00kg,请判断现在出生的男婴出生体重和以前是否不同?2.某学校某次体检中随机抽取了同年级男生12人,女生15人测定其体重指数(BMI),结果如下,试分析男女生体重指数有无差异?男生(12人)20.722.419.620.120.823.118.219.619.921.722.522.0女生(15人)18.517.619.518.721.320.517.521.922.120.819.719.020.520.73.某新药治疗贫血患者12名,治疗前和治疗后的血红蛋白(g/L)含量:治疗前123110130142133129100110125128117107治疗后128135128147150140125127130150127110问:治疗前后患者的血红蛋白含量有无变化?实习四统计图与统计表一目的要求1.掌握统计表的制作要求。2.掌握统计图图形的的选择以及不同图形说明的意义。二实习内容1指出下表的缺陷并改正。表4-1119例宫颈糜烂冷冻治疗结果轻度糜烂中度糜烂重度糜烂总计例数%例数%例数%例数%治愈3932.77119.2421.685243.70好转21.681915.971411.763529.41无效86.7275.881714.293226.89合计4937331192根据以下各表的资料选择合适的图形。表4-2亚洲国家承认HIV感染情况国家成人感染率(%)柬埔寨2.40泰国2.23缅甸1.79印度0.82中国0.06表4-3某市某年男女生不同年龄的身高均数(cm)年龄组(岁)男女7~115.41115.518~118.33117.539~122.16121.6610~129.48125.9411~129.64131.7612~135.50138.2613~138.36141.1714~145.14147.2115~150.84150.0316~154.70153.0617~18161.90156.63表4-4我国1998年性病传播途径分布情况传播途径病例数比例(%)非婚姻性接触41330372.1配偶传播10306418.0其他传播571749.9表4-5某年某地按月发病人数月份123456789101112发病人数9814263243454540181210实习五分类变量资料的统计分析一目的要求1.掌握常用的相对数以及使用中的注意事项。2.熟悉率的标准化法的意义及计算步骤。3.熟悉率的抽样误差与可信区间的计算。4.熟悉率的u检验。5.了解χ2检验的基本思想。6.掌握四个表χ2检验的类型和应用条件。7.掌握R×C表χ2检验及应用中的注意事项.二实习内容1.某化工厂慢性气管炎患病与专业工龄的关系如下表表5-1某化工厂慢性气管炎患病与专业工龄的关系工龄(年)检查人数患者数构成比(%)患病率(%)1~340175~2543010~4327315~13627合计1162147试计算构成比和患病率并填充在表中?简要分析哪个工龄组气管炎患病最严重?2.欲比较甲、乙两地某病发病率,应如何平衡年龄因素的影响,并解释标准化发病率与实际发病率有何不同?表5-2两地某病患病情况年龄甲地乙地检查人数发病人数检查人数发病人数40岁以下7000315300015040岁及以上3000307000140合计10000345100002903.某地1990年6月30日有男性人口13697600,男性人口中因心血管疾病死亡183114.某医生观察某新药对小儿支气管哮喘的治疗效果,同时以传统疗法作对照,资料见下表。试问该新药的治疗效果是否与传统疗法不同?表5-3某新药治疗小儿支气管哮喘的疗效比较分组观察例数有效数有效率(%)试验组393794.9对照组403280.05.某劳动防护研究所将200名确诊的职业肺癌患者分别用痰细胞学检查和X线胸片检查进行诊断,两种方法诊断为肺癌的病例数占全部病例的比例分别为:痰细胞学检查80%,X线胸片检查70%,两种方法均诊断为肺癌的病例占全部病例的60%。现欲了解两种方法的诊断结果有无差别,该资料应如何分析?请列出分析表格,并写出分析方法。6.某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以西米替丁作对照组,结果见下表。问两种方法治疗效果是否有差别(两组性别、年龄、病程、病情等方面均衡可比)?表5-4两种药物治疗十二指肠球部溃疡效果处理愈合合计愈合率(%)呋喃硝胺组546287.10西米替丁446468.75合计9812677.787.某医师研究物理疗法、药物疗法和外用膏药三种疗法治疗周围性面神经麻痹的疗效,问应该选用什么统计分析方法比较三种疗法的有效率是否有差别?表5-5三种疗法有效率的比较疗法病例数有效例数有效率(%)物理疗法组20619996.60药物疗法组18216490.11外用膏药组14411881.948某医师欲研究重点高中近视发生率,调查了400名中学生,近视人数为98人,若大量调查普通高中近视发生率为18%,问重点高中与普通高中近视发生率有无不同?实习六直线回归与相关分析一目的要求1直线回归与相关系数的意义与计算。2相关系数假设检验的原理和方法。3相关与回归分析的区别和联系。4直线回归分析中应注意哪些问题、二实习内容某医师随机抽取两组观察对象,测量指标X与正态随机变量Y得结果如下表,进行变量Y对X的直线回归分析,请回答:(1)各组散点是否有直线趋势存在?表16-1随机抽取的两组观察对象对照组患者组编号XY编号XY123611810922372181103338319111445641910055645201056669620103720108满足回归分析条件时,试建立直线回归方程。应用相关系数的假设检验,推论回归方程是否成立。统计学易错点第一章统计学研究对象的重要特点是数量性某高校在校学生数为13000人,若要研究该校在校学生规模是否适度,这里的"在校学生数为13000人"是指标数量标志才有标志值国内生产总值是价值指标(以货币作为价值尺度来度量社会财富或劳动成果多少的一种总量指标)标志变异指标又称标志变动度,是综合反映总体各单位标志值之间差异程度的一种统计指标。标志变异指标可以反映变量值的离中趋势,说明总体各单位标志值之间的差异大小或变异程度。不可以说明变量值分布的集中趋势,可以测定集中趋势指标的代表性流量具有时间量纲,而存量不具有时间量纲。第二章观测单位:样本中具体观测到的单项数列是总体按单项式分组而形成的变量数列,每个变量值是一个组,按变量值大小顺序排列。在变量值不多,且变量值变动幅度不大时采用。各组的频数或频率不能直接比较要看组距是否一样最常见的变量分布类型是钟型分布说明。。。的分布特征:(描述),点出是什么分布(钟型分布)经常调查与一时调查是按()来划分的。登记事物连续性某市工商企业2014年生产经营成果的年报呈报时间规定在2015年1月31日,则调查期限为

一个月重点调查中重点单位是指标志总量在总体中有很大比重的单位制定统计调查方案,首先要明确 统计调查项目不是统计调查项目概率抽样可分为重复抽样和不重复抽样两种,个体被抽中的概率都可计算对同一总体选择两个或两个以上的标志分别进行简单分组,形成平行分组体系第六次全国人口普查登记的标准时间是2010年11月1日零时下列指标中属于相对指标的是某地区按人口平均的粮食产量调查时间的含义是调查资料所属的时间

分配数列是按数量标志和品质标志分组所形成的数列

某市零售商店销售情况调查调查单位和填报单位一致抽样调查和重点调查两者都属于专门调查统计报表

属于统计调查的方法普查是一种专门调查、一次性调查统计分组的关键是正确选择分组标志如果箱线图中中位数的位置在箱体的上半部,则数据的分布为右偏分布。一次性调查是指间隔一定时期,对事物在某一时点上的状况进行登记的调查方式。一次性调查的目的是反映事物在某一时点存在的状况非概率抽样里面有个流动总体抽样!第三章对于定性数据,可以确定平均数位置平均数(众数、中位数)平均数包括位置平均数和数值平均数在实际应用中,调和平均数和算术平均数的计算形式虽然不同,但计算结果及其意义是一样的由相对数计算平均数时,如果已知该相对数的(如果所掌握的权数资料是相对数或平均数的)子项数值,则应该采用加权调和平均数,如果已知该相对数的(如果所掌握的权数资料是相对数或平均数的)母项数值,则应该采用加权算数平均数调和平均数应用:不知道变量值个数(总体总频数),只知道各组变量值与各组标志总量(各组变量总值)几何平均数G调和平均数HH<=G<=算术平均数high若两个变量数列的标准差相等且计算单位相同,但平均数不相等,则平均数大的代表性强离散系数Vs=s/平均数越大,离散程度越强,平均数的代表性越差四分位数算法Ql=L+(所在位置-S(m-1))/Fm*i类比中位数某商店在制定女式衬衫进货计划时,需了解已售衬衫的平均尺寸,则应计算众数次数分布的类型主要取决于社会经济现象的性质而不是统计总体所处的条件/分组标志的选择/变量是连续还是离散从内容上看,统计表的构成包括主词和宾词权数对于算术平均数的影响作用,实质上取决于各组单位数占总体单位总数比重的大小而不是各组标志值占总体标志总量比重的大小对于不同水平的总体,往往是用()来测定其平均指标的代表性。离散系数方差和标准差是变量分布离散程度最重要的指标分析社会经济现象一般水平和典型特征的最基本的指标以及统计中计算平均数最常用的方法是算术平均数环比发展速度的连乘积等于相应的定基发展速度环比增长速度的连乘积不等于相应的定基增长速度环比增长速度=环比发展速度-1定基增长速度=定基发展速度-1某企业计划规定单位成本降低2%,实际降低7%,则超额完成计划的5.1%(93/98=0.9489,1-0.9589=5.1%)当变量数列中各变量值的频数相等时该数列无众数人口密度指标属于强度相对指标,不属于算数平均指标组距数列中,总体单位数的多少,不影响各组次数分布,影响各组次数分布的要素有组距组限组数在组距数列中,组中值可用来代表各组标志值的平均水平下列有关众数的陈述,错误的有当各组次数分布均匀时为零下列指标中不属于时点指标国内生产总值、出生人数、投资额人口数是指点坐标,而出生人数是时期指标.因为出生人数不可能是某一时间的数字,这需要一个过程,而人口数时时在变,如果是某一时期,只能说是平均人口数!一般而言时时在变的为点指标,而需要过程的则为段指标若甲、乙两总体某变量的标准差

存在,则乙总体变量的差异性较小。错不能比不论总体分布如何,只要样本单位数足够大,样本平均数趋近于正态分布。某地区2014年人均粮食产量1600千克,这是一个平均指标。 错是强度相对指标这是一个相对指标,你看看单位就知道了,这个单位是千克/人,公式是总产量/总人数,是两个不相同但有联系的而又性质不同的指标第四章对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的非抽样误差不会随着样本容量的扩大而下降,属于非一致性一致性:随样本容量增加而减少抽样标准误大小与概率保证程度无关,与估计量有关影响样本容量的因素有概率保证程度、总体标志变异程度、样本平均指标大小、允许误差范围等条件下,重复抽样和不重复抽样相比较,其抽样平均误差前者大于后者设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本均值的分布都服从或近似服从正态分布,其期望和方差分别为

100,从2000名学生中按不重复抽样方法抽取了100名进行调查,其中有女生45名,则样本成数的抽样平均误差为P=45%,n=100,N=2000.V=根号下P*(1-P)/n*(1-n/N)在简单重复随机抽样条件下,欲使误差范围缩小一半,其他要求不变,则样本容量必须

增加3倍其它条件不变情况下,采用重复抽样,将允许误差扩大为原来的2倍,则样本容量缩小为原来的1/4倍在其他条件保持不变的情况下,抽样平均误差随着总体标志变动程度的增加而加大抽样推断中的概率保证程度表达了区间估计的可靠性重置抽样和不重置抽样两种抽样方法的差别不包括标准差不同,抽样标准误才不一样抽样平均误差是反映样本指标与总体指标的平均误差程度、样本指标的标准差抽样平均误差是衡量抽样极限误差的一个尺度。当时,是非标志的标准差达到最大值第七章1、如果估计标准误差,则表明全部观测值都落在回归直线上2、在用一个回归方程进行估计推算时只能用自变量推算因变量3、判断两个变量间相关关系的密切程度时,“显著相关”通常是指4、相关分析是回归分析的基础5、若现象大体上以相同的二级增长量增(减)变动,则适合拟合一条抛物线6、r和

b同方向!!!b=r*Sy/Sx7、相关分析两变量是对等的,回归分析两变量不是对等的8、某高校主修统计学专业并获得学士学位的学生,毕业后月薪(y元)和在校学习总评分(x分)的回归方程是,判定系数为0.802,则以下正确的有月薪总变差中80.2%能被线性回归方程解释。错误:任一学生在校学习总评分增加1分,毕业后月薪会提升562.2元9、若,则与不相关。错10、在进行相关和回归分析时,必须以定性分析为前提,判定现象之间有无关系及其作用范围。11、相关系数r与回归系数b同号,相关系数与回归系数均为无量纲系数。12、如果两个变量的协方差小于0,则两变量之间的相关关系是负相关。第八章时间序列构成要素有四种,它们是趋势(T)、季节变动(S)、周期性或循环波动(C)和不规则波动(I)序时平均数是指动态数列中各时期或时点的发展水平的平均数。平均发展速度等开n次方根,根号内An/A0当时期数列分析的目的侧重于研究某现象在各时期发展水平的累计总和时,应采用方程式法计算平均发展速度若无季节变动,季节指数应该等于1第九章加权算术/调和平均数指数是一种总指数,不是平均指标指按指数化指标性质分为数量指标指数和质量指标指数加权算术平均指数要成为综合之后的变形,必须在基期总值q0p0这个特定的权数条件下,加权调和平均数指数要成为综合指数的变形必

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论