




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社会统计学重点章节讲义2013年考前辅导,2.1变量的类型,定类变量,定序变量,定距/比变量,2.1变量的类型,高测量级别的变量可当作低测量级别的变量来分析,反之不可。不同变量适合不同的统计方法(离散型、连续型)。,2.2样本分布,描述样本分布:概括而非具体描述图表:频数表条形图直方图统计量:分布的中心分布的形状,2.2样本分布,原始数据,2.2样本分布,频数表,2.2样本分布,条形图(离散型变量),2.2样本分布,折线图(离散型变量),2.2样本分布,直方图(连续型变量),2.2样本分布,曲线图(连续型变量),2.2样本分布,频数/相对频率,全面直观描述,概括抽象描述,调查中最常用的统计量是均值和标准差均值和标准差分别是样本的一阶矩和二阶矩,2.2样本分布,计算百分位数(中位数/四分位数)原始数据:观测变量奇数个例:一个n=9的身高样本163,170,176,150,168,171,170,181,179按大小顺序重新排列:150,163,168,170,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。观测变量偶数个(去掉一个170)n=8150,163,168,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。,2.2样本分布,分组数据:组中值估算精确计算,20%,2.2样本分布,计算均值、标准差原始数据分组数据注意分母n为样本数而非分组数自由度信息的个数,2.3概率分布,概率的定义和性质概率是随着样本量n越来越大时相对频率的(统计意义下的)极限。所有概率之和等于10P(A)1概率分布/总体分布总体矩:总体均值、总体标准差离散型变量:二项分布连续型变量:正态分布(大样本时离散变量近似适用),2.3概率分布标准正态分布,Pr(Z1.64)=0.05Pr(Z1.96)=0.025,学习重点,抽样调查的原理和方法描述性统计推断性统计抽样分布参数估计假设检验群体间的差异性检验变量间的关联性分析,3.1抽样分布,蒙特卡罗法,3.1抽样分布连续型变量,样本分布,概率/总体分布,抽样分布,直方图条形图,正态分布,正态近似定理,标准正态分布,n越大,波动越小,3.1抽样分布离散型、连续型变量,样本比例分布,总体比例分布,抽样比例分布,条形图,二项分布,正态近似定理,标准正态分布,n越大,波动越小,3.1抽样分布,示例:总体12345678910抽取2个样本:1.5均值9.5抽取3个样本:2均值9抽取4个样本:2.5均值8.5抽取5个样本:3均值8正态近似定理:在容量为n的非常简单随机样本中,样本均值以的标准误差(为总体标准差)围绕着总体均值波动。随着n的增大,的分布也就围绕其目标波动得越来越小,它也就越来越接近于正态(铃状)。总体数的大小N对的波动没有影响无论总体是否呈正态分布,样本的均值分布都接近正态,随着样本增大,波动越来越小。,3.2参数估计,点估计:均值、比例区间估计:置信区间,3.2参数估计置信区间,注意:此处为抽样分布而非样本分布。,案例估计当前市场容量,B1在过去的三个月里,您家是否使用了纯水?1是,使用了2没有,没有使用B1:过去三个月里使用纯水的家庭比例P,据此估计总体比例的95%置信区间:,案例估计当前市场容量,B2在过去的三个月里,您家使用了多少桶纯水?B2:月平均用水量,并据此估计总体平均用水量的95%置信区间:,大样本时,t值与Z值近似,故用此公式。,案例估计当前市场容量,估算总量:纯水家庭用户数量(户)总户数家庭用户总体比例家庭月用水总量(桶)=家庭用户总体平均月用水量(桶)纯水家庭用户数量(户)已知:4个城区总户数:327,314户,案例估计当前市场容量,统计结果:,3.3假设检验,假设检验是定量研究的基本思想原假设(H0):0假设,无差异,不相关等备选假设(H1):大于、小于、不等于、有差异、有相关性等思想依据小概率事件原理:小概率事件在一次试验中是几乎不可能发生的,3.3假设检验,假设检验的几种方法置信区间:设定计算置信区间检验参数检验:Z检验、t检验、F检验、卡方检验计算概值检验经典假设检验:设定计算临界域检验第一类错误、第二类错误,3.3假设检验,利用置信区间进行假设检验两个总体均值之差的置信区间估算公式:总体方差已知但不相等时:总体方差已知且相等时:,3.3假设检验,两个总体比例之差的置信区间估算公式(大样本公式):,3.3假设检验,概值,学习重点,抽样调查的原理和方法描述性统计推断性统计群体间的差异性检验差异性检验的基本方法方差分析变量间的关联性分析,4.1差异性检验的基本方法,单一样本检验:置信区间t检验概值两个独立/配对样本检验:置信区间t检验概值多个样本:方差分析:F检验概值t、F越大,概值越小,H0越不可信。,4.2方差分析,统计量:F比值F的取值情况:如果为真,则F比值将围绕1波动;如果不真,则F比值将倾向于大于1,而且F比值越大,原假设就越不可信。,4.2方差分析,案例:过去三月平均每户用水量,单一样本t检验H0:6桶;H1:9.08桶,概值小于0.05,可以在95%置信度下拒绝原假设。,案例:过去三月平均每户用水量,两个独立样本t检验全家平均月收入2000以下者:9.49桶全家平均月收入2000以上者:8.19桶假设:H0:低收入家庭高收入家庭=0H1:低收入家庭高收入家庭=1.3检验:置信区间:-3.8066.403t=0.508;双侧概值=0.6130.05结论:无法在95%置信度下拒绝原假设,低收入家庭与高收入家庭用水量无显著差异,案例:方差分析,学习重点,抽样调查的原理和方法描述性统计推断性统计群体间的差异性检验变量间的关联性分析回归分析相关分析两个定类变量交互分析两个定距变量简单积距相关,5.1回归分析,在回归分析中,斜率b的意义是X有一个单位的变化时Y伴随着发生的变化量。要使的估计更加准确,研究者可以控制的方法主要有:-减小总体标准差-增加样本量-增加样本的标准差Sx,即加大X的变化范围哑变量当自变量为定类变量时,需要引入哑变量(0-1变量)将数据转化为数量型变量,进一步分析,哑变量的个数为(变量类型-1),5.1回归分析,估计总体回归直线总体斜率的估计与检验:置信区间t检验:F检验:,5.1回归分析,回归模型拟合效果评价:决定系数:,r2=0回归的效果等于零或Y的变差中可被回归解释的比例为0;r2=1拟合的回归模型解释了Y中100%的变差。,5.2简单积距相关,皮尔逊相关系数r=1:两个变量有完全正向的线性联系r=-1:两个变量有完全负向的线性联系r=0:两个变量没有线性联系总体相关系数的检验置信区间(图解法)t检验,案例:过去用水量与今后用水量,回归与相关,相关与回归:,5.3交互分析,适用情形:两个定类变量的关联性检验方法:卡方检验卡方检验的局限性以及可能的补救办法,案例:使用纯水
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 搪瓷瓷釉制作工三级安全教育(公司级)考核试卷及答案
- 活动3 输入文字并插入图片说课稿-2023-2024学年小学信息技术(信息科技)四年级上册黔科版
- 塔盘制炼工成本控制考核试卷及答案
- 汽车维修工特殊工艺考核试卷及答案
- 押题宝典教师招聘之《幼儿教师招聘》题库及答案详解【历年真题】
- 九年级上册语文第一单元基础知识清单
- 安徽省长丰县第二中学2017-2018学年高二上学期第二次月考物理试题
- 2025年教师招聘之《小学教师招聘》题库必刷100题及答案详解(必刷)
- 教师招聘之《小学教师招聘》复习试题附参考答案详解(典型题)
- 025年江西省南昌市中考二模数学试题
- 中医诊所药品名录表
- 人音版小学四年级音乐上电子全册教案
- 第八版口腔肿瘤TNM分期更新解读
- 网络安全检查表
- 《财税高薪就业陪跑训练营介绍》序-朱海明(中国最励志的讲师之一)著 - 2稿
- 高考语文复习:古诗鉴赏之人物形象
- DL∕T 1100.1-2018 电力系统的时间同步系统 第1部分:技术规范
- AQ/T 9009-2015 生产安全事故应急演练评估规范(正式版)
- 2024年大学试题(宗教学)-道教文化笔试考试历年典型考题及考点含含答案
- DZ∕T 0211-2020 矿产地质勘查规范 重晶石、毒重石、萤石、硼(正式版)
- 《电力建设施工技术规范 第3部分:汽轮发电机组》DLT 5190.3
评论
0/150
提交评论