2017级专硕四大共享医学统计学01绪论_第1页
2017级专硕四大共享医学统计学01绪论_第2页
2017级专硕四大共享医学统计学01绪论_第3页
2017级专硕四大共享医学统计学01绪论_第4页
2017级专硕四大共享医学统计学01绪论_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 绪论A班150人男生80人女生70人B班170人男生90人女生80人两个班男生的身高是否不同175cm170cm两个班男生的身高是不同的A班(1500人)男生800,女生700B班(1700人)男生900,女生800两个班男生的身高是否不同176cm172cm两个班男生的身高是不同的男生120男生155统计学概念Statistics——A

science

dealing

withthe

collection,

analysis,

interpretation,

andpresentation

of

masses

of

numerical

data”(Webster’sInternationalDictionary-韦式国际字典)“The

science

and

art

of

dealing

withvariation

in

data

through

collection,classification,

and

analysis

in

such

a

wayas

to

obtain

reliable

results”

(A

Dictionaryof

Epidemiology-流行病学字典)统计学概念统计学:处理数据中变异性的科学与艺术内容:收集、分析、解释和表达数据目的:求得可靠结果医学统计学(medicalstatistics):是一门应用概率论和数理统计学的原理和方法研究医药卫生领域中数据的收集、分析、解释和表达的学科。1.概率论和数理统计学研究对象:随机现象:具有不确定结果的现象(投硬币)随机事件:随机现象中每一种可能出现的结果为什么可以用在医学中:变异现象-随机现象(药物的疗效)2.要以医学理论为指导父子身高(cm)的相关性分析父亲

树儿苗子175

180180

178…

…165

1703.研究的对象:数据(资料)收集,整理,分析,解释,表达第二节统计学的若干概念总体一、总体与样本总体(population):根据研究目的确定的同质的研究对象,其某项变量值的全体。河北省2000年14岁男孩的身高有限总体时间和空间无限总体(某药治疗糖尿病的疗效)总体(有限、无限)部分个体推断(概率论)抽样(sampling):从研究总体中随机抽取一部分有代表性的个体的方法。样本(sample):从研究总体随机抽取中随机抽取的一部分有代表性的个体(其某项变量值的全体)。统计推断(inference):利用样本信息推断总体特征。抽样的方法样本的代表性推断的技术统计学的核心内容二、同质与变异同质(homogeneity):一个总体中有许多个体大同小异,存在共性,这些个体处于同一总体。河北省2000年14岁男孩的身高变异(variation):在同质基础上个体间的差异。变异性是统计学的根本需要三、抽样误差(samplingerror)总体175cm样本1176cm样本3173cm样本2174cm定义:由个体变异产生,由抽样引起的总体指标(参数)与样本指标(统计量)以及样本指标之间的差异特点:不可避免目的:减小抽样误差方法:减小个体间的差异;增大样本含量四、参数与统计量参数(parameter):是描述总体特征的指标,其大小是客观存在的,然而往往是未知的。统计量(statistic):由观察资料计算出来的量,描述样本特征的指标。统计学关心的常常是总体参数的大小,其依据却是统计量及其性质。五、概率(Probability)币值朝上的概率是50%随机事件可能性数值定义:描述随机事件发生可能性大小的数值(P)随机事件取值范围:不可能事件估计方法:当n足够大时,用频率估计概率小概率事件:某随机事件发生可能性很小含义:在一次试验或观察中某随机事件发生可能性很小必然事件六、变量的类型变量:根据研究目的,对研究对象的某个或某些特征(研究指标或项目)实施观测,这些特征(指标或项目)称为变量(variable)资料(数据):变量的取值(变量值)分成定性(qualitative)与定量(quantitative)两种类型。1.定性变量(分类变量(categoricalvariable)或名义变量(nominative

variable)。例如,职业是一个分类变量;其可能的“取值”不是数字,而是(工、农、商、学、兵等-分类变量的水平)。为便于输入计算机可以采用代码(code)1、2、3、4、5等来表示各个水平。代码不能用于计算二分类变量(binaryvariable),称为0-1变量例如,性别(男、女)、疾病(有、无)和结局(生、死)等。二分类变

量常用0和1来编码,0-1变量常称为假变量(dummyvariable)或哑变量,可以和真变量一样参与计算。一个普通的分类变量也可用几个哑变量来取代用4个哑变量表示5个水平的职业变量X1

=1---"工"X1

=0

---"非工"X

3

=1---"商"X

3

=0

---"非商"X

2

=1---"农"X

2

=0

---"非农"X

4

=1---"学"X

4

=0

---"非学"{X1

,X

2

,X

3

,X

4

}={1,0,0,0}---"工"{X1

,X

2

,X

3

,X

4

}={0,1,0,0}---"农"{X1

,X

2

,X

3

,X

4

}={0,0,1,0}---"商"{X1

,X

2

,X

3

,X

4

}={0,0,0,1}---"学"{X1

,X

2

,X

3

,X

4

}={0,0,0,0}---"兵"有序变量(ordinal

variable)或等级变量。分类变量的“取值”中自然地存在着次序。例如,问卷调查常问对某件事情的满意程度:极不满意、有点满意、中度满意、很满意、极满意。有些临床体检或实验室检验常用–、±、+、++和+++来表示测量结果。2.定量变量离散型变量(discretevariable):离散型变量只能取整数值。例如,一月中的手术病人数,一年里的新生儿数。连续型变量(continuousvariable):连续型变量可以取实数轴上的任何数值。“连续”是指该变量可以在实数轴上连续变动,由测量而得到。例如,血压、身高、体重等。变量类型定性变量离散型变量定量变量连续型变量分类变量(无序)分类变量(有序)二分类多分类资料类型计数资料(无序)等级资料

(有序)二分类多分类计量资料资料类型分类变量资料无序有序数值变量资料二分类多分类变量转化:变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论