已阅读5页,还剩64页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 统计模型一般构造方法 屈文建wjqu11 2 目录 一 构建步骤1 假设 创新点 2 变量设计 属性 尺度 3 数据收集 问卷 访谈 实验 4 数据分析 变量之间的关系 5 建立模型 模型检验 6 研究评估 信度与效度 二 变量关系分析1 变量之间的关联性检验2 变量之间的变化关系的模型 3 研究过程的要点 创新点 研究中最重要的是创新点 所研究问题的假设是研究过程中的关键 所有这一切都必须抓住研究过程中两大环节 1 问题辨析辨识问题 提炼主题 2 论证和验证主题 即回答解决什么问题 预期取得什么结果 选择论证该预期结果的技术方法 4 1假设 创新点 1 问题辨析辨识问题 提炼主题 2 论证和验证主题 即回答解决什么问题 预期取得什么结果 选择论证该预期结果的技术方法 5 1假设 创新点 1 问题辨析辨识问题 提炼主题 2 论证和验证主题 即回答解决什么问题 预期取得什么结果 选择论证该预期结果的技术方法 6 1假设 创新点 1 问题辨析辨识问题 提炼主题 2 论证和验证主题 即回答解决什么问题 预期取得什么结果 选择论证该预期结果的技术方法 7 找好研究问题 创新 的要点 1 大量理论阅读 并思考 2 从实践和理论中观察和归纳 因此 按趣向选择研究领域 集中阅读问题域有关的文献 了解前人的研究成果 同时收集实际问题需要的资料领域细化为研究问题 如领域问题分类 问题定位和变量筛选 确定问题领域的研究视角 切入层面 然后才可能找到研究主题问题导向还是方法导向 有的同学问题还没搞清楚 就说要用某种理论或方法 企图让问题来适应方法 8 问题辨析要素 1 分析单位 个人 群体 组织 项目 社会产品 2 研究侧重点 门类 特性 行为 3 时间维度 横剖研究 纵贯研究研究单位 对象不一致 例如 缺勤率与单身职工比率政策支持率与青年老年比例 9 门类 个人可按性别 年龄 婚姻 高度特性 个人的态度 价值观念 信仰 个性 动机 偏好 倾向 思维方式行为 个人的消费投资行为 企业的产品定价 兼并 招聘 分析单位之间的互动行为如寻租行为 谈判行为 委托代理行为 门类 特性 行为组合构成研究的主要内容 3 时间维度 横剖研究 纵贯研究趋势研究 同期群研究 追踪研究 10 11 2变量之间的关系 1 单变量 统计特征数字 2 双变量 相关关系 关联分析 3 多变量 轮廓分析 因子分析 聚类分析 判别分析 对应分析 典型相关分析 路径分析 结构方程模型 多维标度分析 回归分析 1积差相关系数 一 概念及适用条件 一 概念积差相关 又称积矩相关 或皮尔逊 英国 相关 公式为 5 1 二 适用条件1 两变量均应由测量得到的连续变量 2 两变量所来自的总体都应是正态分布 或接近正态的单峰对称分布 3 变量必须是成对的数据 4 两变量间为线性关系 二 计算方法 一 基本公式计算法步骤 例1某学校为调查学生学习各科目之间的能力迁移问题 随机抽取10名学生的政治与语文成绩见表5 1 请计算其相关程度 解 依表5 1的资料 计算结果为 即10名学生的政治与语文成绩的相关程度为0 475 二 原始数据计算法 课后练习 用原始数据计算法计算例5 1 2其他相关系数 一 等级相关系数 一 斯皮尔曼等级相关1 概念及适用条件 1 概念两变量是等级测量数据 且总体不一定呈正态分布 样本容量也不一定大于30 这样两变量的相关 称为等级相关 斯皮尔曼相关 2 适用条件 两变量的资料为等级测量数据 且具有线性关系 连续变量的测量数据 按其大小排成等级 亦可用等级相关计算 不要求总体呈正态分布 2 计算方法 式中 D为两变量每对数据的等级之差 N表示样本容量 5 4 计算步骤 1 计算两变量等级之差D 2 计算D2 3 计算 D2 4 代入公式 5 4 求得rR 例3求10名学生的语文成绩与阅读能力成绩之间的等级相关系数 表5 310名学生的语文成绩与阅读能力成绩相关计算表 解 将有关数据代入公式 5 4 得 如果求相关的是连续变量 计算时先把两组数据分别按大小排成等级 最大值取为1等 其它类推 若出现相同的等级分数时 可用它们所占等级位置的平均数作为它们的等级 例4某校为了研究学生自学能力与学业成绩之间的关系 随机抽取10名学生的自学能力和学科成绩 见表5 4 求其相关系数 表5 410名学生的自学能力和学科成绩相关计算表 解 即学生的自学能力与学习成绩的相关程度为0 85 二 肯德尔和谐系数1 概念及适用条件 1 概念当多个变量值以等级顺序表示时 这几个变量之间的一致性程度 称为肯德尔和谐系数或肯德尔W系数 2 适用条件适用于两列以上等级变量 如了解几个评定者对同一组学生成绩等级评定的一致性程度等 2 计算方法它以符号W表示 公式为 计算步骤 略例5某评价小组7人依据已确定的4项内容对某教师打分 将分数转换为等级后的结果见表5 5 求这7人对该教师评价意见的一致性程度 表5 57人评价某教师意见资料表 解 将上述数据代入公式 5 5 中得 实际上 当出现相同等级时 应校正W系数 其校正公式为 例5中第一个人评的有2个等级相同 第二个人评的有2个3 5和2个1 5等级 所以 C为 二 点二列相关 一 概念及适用条件1 概念两列变量一列是正态连续变量 另一列是二分变量 描述这两个变量之间的相关 称为点二列相关 2 适用条件一列是正态连续变量 另一列是二分变量 如男与女 对与错等 二 计算方法点二列相关系数以表示rpb 公式为 式中 p为二分变量中某一项所占比例 q为二分变量中另一项所占比例 p q 1 为二分变量中比例为p部分所对应的连续变量的平均数 为二分变量中比例为q部分所对应的连续变量的平均数 x为连续变量的标准差 例6随机抽取某区初二数学期末考试卷15份 试计算第二题的得分与总分相一致的程度 即试题的区分度 它是衡量试题鉴别能力的指标值 数据见表5 6 表5 6数据表 解 1 求答对第二题的比率p和答错的比率q p 10 15 0 67q 1 p 0 33 2 求和 分别为答对和答错第二题学生成绩的平均数 3 求 x 所有考生的总分的标准差 x 7 597 分 将上述数据代入公式 5 7 可得 即该试卷第二题的区分度为0 297 三 相关 一 概念及适用条件1 概念当两变量均为二分变量时 描述这两个变量之间的相关 称为 相关 2 适用条件两变量均为二分变量 或资料整理为2 2列联表一形式 二 计算方法 相关以符号r 表示 其计算公式为 式中 a b c d分别表示四格表中的实际次数 如表5 7所示 表5 72 2列联表 例7某区为研究性别与学习数学的关系 随机抽取100名学生 以数学成绩85分为线进行分类 求性别与数学成绩间的相关系数 表5 8100名学生成绩分布表 即性别与数学成绩间的相关系数为0 065 第四节解释与应用相关系数时应注意的问题 略 见第一节四 作业 1 某小组10名学生物理期中与期末考试成绩如下 请用相关散点图分析其成绩动态变化情况并提出指导意见 2 某校为研究高中模拟考试与高考之间的相关程度 随机抽取为20名学生模拟考试与高考的数学成绩如下 请计算其相关系数 3 4位教师对5名学生的论文水平按等级评定 结果如下表 求评定结果的一致性程度 1 趋势模型的选择方法 1 观察散点图 2 根据观察数据本身 按以下标准选择趋势线一次差大体相同 配合直线二次差大体相同 配合二次曲线对数的一次差大体相同 配合指数曲线一次差的环比值大体相同 配合修正指数曲线对数一次差的环比值大体相同 配合Gompertz曲线倒数一次差的环比值大体相同 配合Logistic曲线 3 比较估计标准误差 线性模型法 概念要点与基本形式 现象的发展按线性趋势变化时 可用线性模型表示线性模型的形式为 时间序列的趋势值t 时间标号a 趋势线在Y轴上的截距b 趋势线的斜率 表示时间t变动一个单位时观察值的平均变动数量 线性模型法 a和b的最小二乘估计 趋势方程中的两个未知常数a和b按最小二乘法 Least squareMethod 求得根据回归分析中的最小二乘法原理使各实际观察值与趋势值的离差平方和为最小最小二乘法既可以配合趋势直线 也可用于配合趋势曲线根据趋势线计算出各个时期的趋势值 线性模型法 a和b的最小二乘估计 1 根据最小二乘法得到求解a和b的标准方程为 取时间序列的中间时期为原点时有 t 0 上式可化简为 解得 解得 二次曲线 SecondDegreeCurve 现象的发展趋势为抛物线形态一般形式为 a b c为未知常数根据最小二乘法求得 二次曲线 SecondDegreeCurve 根据最小二乘法得到求解a b c的标准方程为 取时间序列的中间时期为原点时有 指数曲线 Exponentialcurve 用于描述以几何级数递增或递减的现象一般形式为 a b为未知常数若b 1 增长率随着时间t的增加而增加若b0 b 1 趋势值逐渐降低到以0为极限 指数曲线 a b的求解方法 采取 线性化 手段将其化为对数直线形式根据最小二乘法 得到求解lga lgb的标准方程为 取时间序列的中间时期为原点 上式可化简为 修正指数曲线 Modifiedexponentialcurve 在一般指数曲线的基础上增加一个常数K一般形式为 K a b为未知常数K 0 a 0 0 b 1 修正指数曲线用于描述的现象 初期增长迅速 随后增长率逐渐降低 最终则以K为增长极限 修正指数曲线 求解k a b的三和法 趋势值K无法事先确定时采用将时间序列观察值等分为三个部分 每部分有m个时期令趋势值的三个局部总和分别等于原序列观察值的三个局部总和 修正指数曲线 求解k a b的三和法 根据三和法求得 设观察值的三个局部总和分别为S1 S2 S3 龚铂茨曲线 Gompertzcurve 以英国统计学家和数学家B Gompertz而命名一般形式为 K a b为未知常数K 0 0 a 1 0 b 1 所描述的现象 初期增长缓慢 以后逐渐加快 当达到一定程度后 增长率又逐渐下降 最后接近一条水平线两端都有渐近线 上渐近线为Y K 下渐近线为Y 0 罗吉斯蒂曲线 LogisticCurve K a b为未知常数K 0 a 0 0 b 1 1838年比利时数学家Verhulst所确定的名称该曲线所描述的现象
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电路分析基础
- 人教版(2024)七年级下册英语 Unit 6 Section A (教学设计)(表格式)
- 山东省济宁市兖州区2025-2026学年高二下学期期中考试生物试卷
- 交通工程施工现场安全围挡设置标准化规范
- 2025年陕西省二级建造师考试法规与知识真题及答案
- 隧道通风施工方案(专家论证版)
- 建筑门窗工程技术标准
- 2026年丽江政府采购评审专家考试考试真题
- 学校学生成忘我素养培养办法
- 新闻记者职业资格考试(新闻基础知识)复习题库含答案(内蒙古自治区阿拉善盟2025年)
- 2026年人力资源服务合同协议范本
- 学生成长记录册
- (2026年)GINA全球哮喘处理和预防策略(更新版)解读课件
- 项目投资的风险分析课件
- 伍德密封强度计算
- 幼儿园一日常规安全培训
- 01K403 风机盘管安装
- 流行病学试题-流行病学题库及答案
- YS/T 967-2014电池级磷酸二氢锂
- LY/T 2372-2014活动地板基材用石膏纤维板
- GB/T 12586-2003橡胶或塑料涂覆织物耐屈挠破坏性的测定
评论
0/150
提交评论