统计模型基本方法.ppt_第1页
统计模型基本方法.ppt_第2页
统计模型基本方法.ppt_第3页
统计模型基本方法.ppt_第4页
统计模型基本方法.ppt_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、a,1,统计模型一般构造方法,屈文建 wjqu11,a,2,目录,一、构建步骤 1.假设(创新点) 2.变量设计(属性、尺度) 3.数据收集(问卷、访谈、实验) 4.数据分析(变量之间的关系) 5.建立模型(模型检验) 6.研究评估(信度与效度) 二、变量关系分析 1.变量之间的关联性检验 2.变量之间的变化关系的模型,a,3,研究过程的要点(创新点),研究中最重要的是创新点,所研究问题的假设是研究过程中的关键,所有这一切都必须抓住研究过程中两大环节。 (1)问题辨析 辨识问题、提炼主题 (2)论证和验证主题 (即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法),a,4,1假

2、设(创新点),(1)问题辨析 辨识问题、提炼主题 (2)论证和验证主题 (即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法),a,5,1假设(创新点),(1)问题辨析 辨识问题、提炼主题 (2)论证和验证主题 (即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法),a,6,1假设(创新点),(1)问题辨析 辨识问题、提炼主题 (2)论证和验证主题 (即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法),a,7,找好研究问题(创新)的要点:(1)大量理论阅读,并思考,(2)从实践和理论中观察和归纳。 因此,按趣向选择研究领域,集中阅读问题域有关的

3、文献,了解前人的研究成果,同时收集实际问题需要的资料 领域细化为研究问题,如领域问题分类、问题定位和变量筛选,确定问题领域的研究视角,切入层面,然后才可能找到研究主题 问题导向还是方法导向:有的同学问题还没搞清楚,就说要用某种理论或方法,企图让问题来适应方法。,a,8,问题辨析要素 (1)分析单位,个人、群体、组织、项目、社会产品 (2)研究侧重点,门类、特性、行为。 (3)时间维度,横剖研究、纵贯研究 研究单位,对象不一致,例如: 缺勤率与单身职工比率 政策支持率与青年老年比例,a,9,门类-个人可按性别、年龄、婚姻、高度 特性个人的态度、价值观念、信仰、个性、动机、偏好、倾向、思维方式 行

4、为个人的消费投资行为,企业的产品定价、兼并、招聘,分析单位之间的互动行为如寻租行为、谈判行为、委托代理行为。 门类、特性、行为组合构成研究的主要内容。 (3)时间维度,横剖研究、纵贯研究 趋势研究、同期群研究、追踪研究,a,10,a,11,2变量之间的关系,(1)单变量(统计特征数字) (2)双变量(相关关系,关联分析) (3)多变量(轮廓分析,因子分析,聚类分析,判别分析,对应分析,典型相关分析,路径分析,结构方程模型,多维标度分析,回归分析),a,12,1 积差相关系数,一、概念及适用条件 (一)概念 积差相关,又称积矩相关(或皮尔逊(英国)相关)。公式为,(5.1),a,13,(二)适用

5、条件 1、两变量均应由测量得到的连续变量。 2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。 3、变量必须是成对的数据。 4、两变量间为线性关系。,a,14,二、计算方法 (一)基本公式计算法 步骤:,a,15,例1 某学校为调查学生学习各科目之间的能力迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程度。,a,16,解:依表5-1的资料,计算结果为,即 10名学生的政治与语文成绩的相关程度为0.475。,a,17,(二)原始数据计算法,课后练习:用原始数据计算法计算例5-1。,a,18,2 其他相关系数,一、等级相关系数 (一)斯皮尔曼等级相关 1、概念及

6、适用条件 (1)概念 两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为等级相关(斯皮尔曼相关),a,19,(2)适用条件 两变量的资料为等级测量数据,且具有线性关系。 连续变量的测量数据,按其大小排成等级,亦可用等级相关计算。 不要求总体呈正态分布。 2、计算方法,式中:D为两变量每对数据的等级之差;N表示样本容量。,(5.4),a,20,计算步骤: (1)计算两变量等级之差D; (2)计算D2; (3)计算 D2; (4)代入公式(5.4),求得rR,例3 求10名学生的语文成绩与阅读能力成绩之间的等级相关系数。,a,21,表5-3 10名学生的

7、语文成绩与阅读能力成绩相关计算表,a,22,解:将有关数据代入公式(5.4)得,如果求相关的是连续变量,计算时先把两组数据分别按大小排成等级,最大值取为1等,其它类推。若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。,a,23,例4 某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学生的自学能力和学科成绩,见表5-4,求其相关系数。,表5-4 10名学生的自学能力和学科成绩相关计算表,a,24,解:,即学生的自学能力与学习成绩的相关程度为0.85。,a,25,(二)肯德尔和谐系数 1、概念及适用条件 (1)概念 当多个变量值以等级顺序表示时,这几个变量之间的一致

8、性程度,称为肯德尔和谐系数或肯德尔W系数。 (2)适用条件 适用于两列以上等级变量。如了解几个评定者对同一组学生成绩等级评定的一致性程度等。,a,26,2、计算方法 它以符号W表示,公式为,a,27,计算步骤:略 例5 某评价小组7人依据已确定的4项内容对某教师打分,将分数转换为等级后的结果见表5-5,求这7人对该教师评价意见的一致性程度。,表5-5 7人评价某教师意见资料表,a,28,解:将上述数据代入公式(5.5)中得,实际上,当出现相同等级时,应校正W系数,其校正公式为,a,29,例5中第一个人评的有2个等级相同,第二个人评的有2个3.5和2个1.5等级所以C为,a,30,a,31,二、

9、点二列相关 (一)概念及适用条件 1、概念 两列变量一列是正态连续变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。 2、适用条件 一列是正态连续变量,另一列是二分变量(如男与女,对与错等)。,a,32,(二)计算方法 点二列相关系数以表示rpb,公式为,式中:p为二分变量中某一项所占比例;q为二分变量中另一项所占比例,p+q=1; 为二分变量中比例为p部分所对应的连续变量的平均数; 为二分变量中比例为q部分所对应的连续变量的平均数.x为连续变量的标准差。,a,33,例6 随机抽取某区初二数学期末考试卷15份,试计算第二题的得分与总分相一致的程度(即试题的区分度,它是衡量试题鉴

10、别能力的指标值)。数据见表5-6。,表5-6 数据表,a,34,解:(1)求答对第二题的比率p和答错的比率q: p=10/15=0.67 q=1-p=0.33 (2)求 和 ,分别为答对和答错第二题学生成绩的平均数: (3) 求x,所有考生的总分的标准差: x=7.597(分) 将上述数据代入公式(5.7),可得,a,35,即该试卷第二题的区分度为0.297。,a,36,三、相关 (一)概念及适用条件 1、概念 当两变量均为二分变量时,描述这两个变量之间的相关,称为相关。 2、适用条件 两变量均为二分变量;或资料整理为22列联表一形式。,a,37,(二)计算方法 相关以符号r表示,其计算公式为

11、,式中:a、b、c、d分别表示四格表中的实际次数,如表5-7所示。,表5-7 22列联表,a,38,例7 某区为研究性别与学习数学的关系,随机抽取100名学生,以数学成绩85分为线进行分类,求性别与数学成绩间的相关系数。,表5-8 100名学生成绩分布表,a,39,即性别与数学成绩间的相关系数为0.065。,a,40,第四节 解释与应用相关系数时应注意的问题,略: 见第一节 四,作业: 1、某小组10名学生物理期中与期末考试成绩如下,请用相关散点图分析其成绩动态变化情况并提出指导意见。,a,41,2、某校为研究高中模拟考试与高考之间的相关程度,随机抽取为20名学生模拟考试与高考的数学成绩如下,

12、请计算其相关系数。,3、4位教师对5名学生的论文水平按等级评定,结果如下表,求评定结果的一致性程度。,a,42,a,43,a,44,1.趋势模型的选择方法,(1)观察散点图 (2)根据观察数据本身,按以下标准选择趋势线 一次差大体相同,配合直线 二次差大体相同,配合二次曲线 对数的一次差大体相同,配合指数曲线 一次差的环比值大体相同,配合修正指数曲线 对数一次差的环比值大体相同,配合 Gompertz 曲线 倒数一次差的环比值大体相同,配合Logistic曲线 (3)比较估计标准误差,a,45,线性模型法 (概念要点与基本形式),现象的发展按线性趋势变化时,可用线性模型表示 线性模型的形式为,

13、 时间序列的趋势值 t 时间标号 a趋势线在Y 轴上的截距 b趋势线的斜率,表示时间 t 变动一个单位时观察值的平均变动数量,a,46,线性模型法 (a 和 b 的最小二乘估计),趋势方程中的两个未知常数 a 和 b 按最小二乘法(Least-square Method)求得 根据回归分析中的最小二乘法原理 使各实际观察值与趋势值的离差平方和为最小 最小二乘法既可以配合趋势直线,也可用于配合趋势曲线 根据趋势线计算出各个时期的趋势值,a,47,线性模型法 (a和b的最小二乘估计),1. 根据最小二乘法得到求解 a 和 b 的标准方程为,取时间序列的中间时期为原点时有 t=0,上式可化简为,解得

14、:,解得:,a,48,二次曲线 (Second Degree Curve),现象的发展趋势为抛物线形态 一般形式为,a、b、c 为未知常数 根据最小二乘法求得,a,49,二次曲线 (Second Degree Curve),根据最小二乘法得到求解 a、b、c 的标准方程为,取时间序列的中间时期为原点时有,a,50,指数曲线 (Exponential curve),用于描述以几何级数递增或递减的现象 一般形式为,a、b为未知常数 若b1,增长率随着时间t的增加而增加 若b0,b 0,a 0,0 0,0 0,0 b 1,1838年比利时数学家 Verhulst所确定的名称 该曲线所描述的现象的特征与Gompertz曲线类似 3. 其曲线方程为,a,57,一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论