




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
素质量化的方法 本章内容 量化的必要性数据的收集数据的分析 一 量化的必要性 二 数据收集 2 1定义变量2 2变量的测量层次2 3观察数据 抽样调查 问题和可能性2 4问卷设计中常出现的问题2 5数据文件的格式 2 1定义变量数据收集的第一个工作 就是要清楚测量和收集什么 你要将你的研究问题转化为用变量的语言来描述 并且要对变量进行清楚的定义 例如 思考一下 假设你已经为人父母 当要求你回答这个问题的时候 你有什么困惑 在你家庭中有多少个孩子 2 1定义变量至少存在以下问题 1 孩子是否应该小于18周岁 2 孩子是仅仅指亲生子女 还是包括养子养女 过继的算不算 对于不和亲生父母生活在一起的孩子算不算 父母离了婚而共同抚养的孩子怎么算 所以要对 孩子 这个变量做清楚的界定 思考 这个调查问题存在什么问题 请问贵企业的销售收入是多少 2 2变量的测量层次思考题 以下收集到的数据 可以进行 中的哪些运算 五个人的性别 1 0 0 1 1 1 男性 0 女性 五个人的身高 170 173 165 180 161 单位 厘米 七天的气温 摄氏温度 15 24 27 18 34 30 19 五个人对一项政策满意程度的评分 5 3 3 4 2 1 十分不满意 2 不满意 3 一般或中立 4 满意 5 十分满意 2 2变量的测量层次按照数据适合的运算规则 统计学将数据 或变量 划分为四个层次 定类数据 变量 它仅仅是一种标志 取数值仅仅是用以区分变量中的类型名称 不适合任何四则运算和大小运算 定序数据 定序数据值能够比较大小 不能够做加减乘除运算 它表示一种次序 定距数据 这类数据可以做大小比较以及加减运算 不能做乘除运算 数据之间的距离是相等的 其根本特征是 数据中的0不是物理客观存在的 而是人为设定的 例如 温度测量值就是定距 定比数据 定比数据是数据中最高层次的测度等级 这类数据可以做大小比较和加减运算外 还可以做乘除运算 这时的0值不是人为确定的 而是物理客观存在的 例如 人的身高数据 体重数据 2 2变量的测量层次思考题 1 我们用一个量表测量人们对一项法律的态度 如果1表示不赞成 2表示无所谓 3表示赞成 对于3个人我们测得的值分别为 3 1 2 这些数据为 定序 数据 2 测量10个大学生所在的年级 如果用1表示大一 2表示大二 3表示大三 4表示大四 5表示其他 测量的值为 1 3 4 1 2 3 2 1 1 4 这些数据为 定序 数据 3 测得5个人的第一次结婚年龄 单位 周岁 为 20 22 24 30和26 这些数据为 定序 数据 2 2变量的测量层次注意三点 SPSS中将定距数据和定比数据合并为一类 叫刻度级数据 所以SPSS的数据测量层次只有三种 一项统计方法适合低级别的数据 也适用于高级别的数据 但反过来不存立 例如我们可以计算身高数据的均值 但不能计算五个人性别的均值 在社会科学研究对定序数据的处理有两种方式 一是将其作为定类数据看待 另一是将其作为刻度级数据看待 2 3观察数据 抽样调查定义 凡是在获得数据的过程中 不对被调查对象数据产生的条件施加任何控制所得到的数据 称为观察数据 两种方式 普查与抽样调查 普查 Census 就是收集总体中的所有个体的数据 抽样调查 Sampling 是在总体中选择出一个样本 然后对样本中的个体进行调查 从所了解的样本数据来推断总体情况 抽样调查的优点 经济性 时效性强 抽样调查可以迅速 及时地获取到所需要的信息 准确性高 抽样调查的一个原则 确信锅里的汤被搅拌均匀 样本的两种类型 随机样本 方便样本 思考题 有时候杂志要求读者回答某些问题并寄回答案 从而构成一个样本 请问这个样本能不能代表读者群总体 为什么 抽样调查的方法 1 简单随机样本 2 分层抽样 3 等距离抽样 4 整群抽样思考题 假如你要调查广州市市区内的居民月收入 假设抽样容量为1000 你如何展开抽样 2 4问卷设计中常出现的问题问卷长度不能太长 一般来说不要超过3页A4纸 问卷能够让被调查人在15 20分钟完成是最好的 用词要通俗易懂 如果涉及到专业词语尽量转化为普通人能理解的词语 如果实在没办法 你要对其进行解释 用词要确切 就是说要让填问卷的人读到你的问题和答案没有偏差 这可以通过6W准则来保证 Who Where When Why What How 避免诱导性提问 也就是提问的问题不能带有倾向性 应该保持中立 例如大多数人认为北京大学是中国最好的高校 你觉得怎样 您觉得北京大学在全国高校综合排名中可以排第几 避免双重否定形式的提问 1992 在你看来 纳粹对犹太人的灭绝从未发生过 是可能的还是不可能的 22 怀疑 1994 在你看来 纳粹对犹太人的灭绝从未发生过 可能吗 还是你确信它发生过 1 注意问题所在的位置 不要将敏感性问题放在问卷的前面 要结束调查时的问题要短且简单 注意调查员的影响 调查设计者要尽量让调查员和被调查者在人口统计特征 如 年龄 性别 种族等 相近 特别是一些敏感问题 例如你要调查女性对化妆品的看法 找男性去就不合适 2 5数据文件的格式 三 数据分析 初步整理离散分析相关性分析差异性检验回归分析 3 1初步整理 统计表频数分布表 累积频数 累积百分比统计图频数分布图 频次和频率 所谓频次就是一个特定数据值在整个数据集合中出现的次数 频率就是某个特定数据值出现的频次与数据集合的数据总数之比 一个延伸的概念是累积频率 当数据的测量层次在定序级以上时 设x1 x2 xm 是样本数据集合中的不重复的样本值 m n样本个数 若把样本值小于等于某个样本数据xi的频率值 都累加起来 就得到 小于等于xi 的累积频率 饼型图 条形图 茎叶图和直方图 直方图与茎叶图的区别 直方图和茎叶图都用来展示刻度级的数据 茎叶图类似于横放的直方图 但是直方图主要用于对原始数据进行分组后的展示 当然 分组这个过程可以有SPSS自动完成 而茎叶图主要对于原始数据的展示 同时 茎叶图既能给出数据的分布 又能给出每一个原始数据值 即保留了原始数据的信息 而直方图不能给出原始的数值 茎叶图 茎叶图 3 2离散分析 中位数 众数 平均数极差方差 标准差 变异系数 中位数 众数 样本均值中位数 就是将资料排序 从大到小 从小到大都可 后 居于中间位置的那个数称为中位数 用表示 当n为奇数的时候 当n为偶数的时候 区别 一般来说 众数适合于定类数据 中位数适合于定序数据及其以上的数据 均值适合于样本均值但是对于刻度级数据 如果存在异常值的时候 要用中位数来代表数据集的集中趋势 思考题1 最适合代表定类数据的集中趋势的是 A 中位数 B 众数 C 平均数 D 方差 6个人的身高数据为 173cm 173cm 178cm 176cm 171cm和226cm 请你选择代表这个数据集集中趋势 最适合的是 A 中位数 B 众数 C 平均数 D
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 抖音商户场控设备定期维护保养制度
- 全球铀矿资源分布与核能产业市场前景预测研究报告
- 公交优先战略2025年城市交通拥堵治理的公共交通与体育赛事协同报告
- c-Kit-IN-9-生命科学试剂-MCE
- 山东胜利职业学院《企业经营统计学》2023-2024学年第一学期期末试卷
- 长治学院《艺术社会学》2023-2024学年第一学期期末试卷
- 湖北省荆门市2024年九上化学期末复习检测试题含解析
- 江苏省沛县2024-2025学年七年级数学第一学期期末质量检测模拟试题含解析
- 湖北第二师范学院《数据处理与分析实验》2023-2024学年第一学期期末试卷
- 公路货运行业数字化转型与智能物流系统优化报告
- 资产评估收费管理办法(2023)2914
- 孤独症康复教育人员上岗培训练习题库及答案
- 机械设备投入计划及保证措施
- 东南大学附属中大医院ECMO操作记录单
- 每月防火检查及记录表(每月一次)
- DFMEA编制作业指导书新版
- 工程项目成本预算表
- GB∕T 3639-2021 冷拔或冷轧精密无缝钢管
- DB51∕T 2628-2019 司法所外观及室内标识规范
- 一般自我效能感量表(GSES)
- 2022版义务教育语文课程标准(2022版含新增和修订部分)
评论
0/150
提交评论