医学统计学课件--第三章 总体均数的估计与假设检验(第3章).ppt_第1页
医学统计学课件--第三章 总体均数的估计与假设检验(第3章).ppt_第2页
医学统计学课件--第三章 总体均数的估计与假设检验(第3章).ppt_第3页
医学统计学课件--第三章 总体均数的估计与假设检验(第3章).ppt_第4页
医学统计学课件--第三章 总体均数的估计与假设检验(第3章).ppt_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/7/23,医学统计学,第1,3章对全部平均数的估计和假设检验,第二军医大学卫生统计学系主任,2020/7/23,医学统计学,2,对平均数的取样误差和标准误差T分布的全部平均数的估计T检验假设检验的注意事项正规性医学统计学无限的总体上不能一一观察所有的个体,有限的整体仅限于人力、财力、物力、时间、个人过多等,也不必一一研究所有的个体(例如罐头质量检查)。利用抽样研究。2020/7/23,医学统计学,5,如果想知道某个地方18岁男人身高值的平均水平,就随机抽取该地区10名男子身高的样本。由于受单个变异和采样的影响,提取的样本数不等于总体平均值,因此采样系统测量和整个参数之间的差异(由同一

2、整体的多个样本统计数据之间的差异表示)称为采样误差。取样误差是不可避免的。取样误差有规律。2020/7/23,医学统计学,6,1999年1点18岁男孩身高Xin(,2)=167.7厘米=5.3厘米,2020/7/23,医学统计学,各种平均数之间存在差异。采样平均数量=167.69厘米左右。正态分布样本平均变异()比原来的总个人值变异(=5.3厘米)大幅度减少。2020/7/23,医学统计,8,2020/平均数,具有标准偏差的总体中独立随机样本,样本含量N牙齿大时样本平均分布倾向于牙齿分布的平均值正态分布。标准偏差为2020/7/23,医学统计,10,中心极限定理。如果X I服从正态分布,则服从

3、正态分布。如果X I不服从正态分布,则n对(n60):近似服从正态分布。n次(n60):非正态分布,2020/7/23,医学统计,11,样本统计的标准偏差称为标准误差(stans),SE样本平均的标准偏差为平均的标准误差(SEM),2020/,2020/7/23,医学统计学,15,威廉塞利戈斯塞(18761937,英国),2020/7/23,医学统计学,16,T分布的概念左右对称分布为相关,越小,T,点估计是通过采样统计量直接估计总体参数值。例如估计、S估计等。方法很简单,但没有考虑样本误差大小。区间估计是根据预先指定的概率(1)确定包含整个参数的范围。牙齿范围包括参数的置信区间(CI)、20

4、20/7/23、医学统计、25、预先给定的概率(1)称为可靠度(confidence level),全局参数未知,是固定值。(因此,必须说明为包含。)样本统计信息是随机变量。2020/7/23,医学统计,26,2,计算总体平均置信区间,1。单个整体平均的置信区间(1)未知的电视分布原理(2)已知或未知,但N牙齿足够大(例如n60) U分布原理2日侧性,2020/7/23,医学统计学,28,据此,18岁男生身高平均的95=167.7厘米双尾,从示例3-1中提取示例15=166.95(cm),S=3.64(cm),以获得总体平均值的95%可信度。166.952.2621.1511=164.3516

5、9.55(厘米),2020/7/23,医学统计,29,1。单个总体平均值的1个置信区间,2020/7/23,医学统计,31,2。针对两个整体平均数的差异,从1置信区间、双面、单方面、2020/7/23、医学统计学、32、3、置信区间=5.3厘米中随机抽取100个样本,计算了100个估计的95%CI。其中95个CI包含5个。=167.7厘米20号161.00165.57 31号161.17167.33 54号168.05171 N(0,1)的100个样本计算的95%置信区间示意图,2020/7/23,医学统计,34,重复,形成可靠的间隙时,包括整个参数,或不包括整个参数。必须是两者之一。没有概率

6、。可靠性是字典的概率。可靠区间的确切含义,2020/7/23,医学统计,35,准确性:可靠度1,即区间包含整体参数的理论概率的大小,越接近1越好。准确度:间距的宽度,间距越小越好。样品含量固定时,两种牙齿徐璐矛盾。只要提高可信度,可信度就会扩大。可信区间估计的优劣评价:2020/7/23,医学统计,36,4,可信区间和参考值范围的差异,可信区间用于估计整体参数,只有一个整体参数。参考值范围用于估计各个值的分布范围,各个值非常多。95%的置信区间中,95%是可信度。也就是说,置信区间包含整体参数的可信度为95%。95%参考值范围的95%是百分比。也就是说,参考值范围包含95%的正常人。2020/

7、7/23,医学统计学,37,4节T检验,2020/7/23,医学统计学,38,一位医生测量扁平的男性工人的血红蛋白含量,结果均为130.83g/L,从事铅工人的血红蛋白正常的成年男性,样品平均值与整体平均值的差异原因:1。总体平均值不同吗?2.整体平均值相同,差异是由取样误差引起的吗?统计推断方法假设测试(hypothesis test),2020/7/23,医学统计,39,1。检验假设样品具体总体2。检查级别决定最大误差范围3。选定的检验方法计算检验统计计算样例和总偏差程度4。计算与统计量相对应的P值5。根据小概率反证法思想得出结论,假设检验一般阶段,2020/7/23,医学统计学,T检验(Students t-test)设计完全随机设计单个样品完全随机设计两个样品对设计要求1.n小(单套60或两套合计60) 2。样本随机正规整体3。比较两个样本平均值时,两个对应的总体方差相同(homogeneity of varianns) 41。一位医生测量了从事扁业的36名男性工人的血红蛋白含量,共计算为130.83g/L,标准偏差为25.74g/L。从事铅作业的血红蛋白与正常成年男性的平均140g/L不同吗?1,单一样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论