




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学原理与SPSS软件应用专题讲座 杨 端 和 2015年10月 定性分析和定量分析 定性分析:用文字语言进行相关描述。它是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。 定量分析:用数学语言进行描述。它是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。 相比而言,定量分析方法更加精确,但需要较高的数学,统计学知识。 定量分析就是通过比较对照来分析问题和说明问题的。正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、发展速度的快慢等,
2、才能作出判断、得出可靠的结论。 我们文科出身的语言教师一般数学基础都相对薄弱,对于数据与统计都比较生疏,还由于统计学理论本身复杂难懂,以语言研究为目的,专门探讨怎样用统计学原理来处理评估语言数据的专著也很少。因而,统计学这门重要的 应用学科在我们的语言教学,科研中并没有得到广泛,充分应用。 现在有了像SPSS这样强有力的统计研究与数据分析工具,我们广大语言教师只要经过一段时间的学习,就可掌握这一研究工具,在我们的语言教学,科研中熟练掌握,使用它来对科研项目,学术论文的大量数据进行定量分析,得出令人信服的结论就不再是不可企及的梦想。统计学(statistics)的基本概念统计学是高等数学的一个分
3、支,是利用量化数据作出客观判断的科学,是进行任何科学研究必不可少的一个重要工具。描述统计学与推导统计学描述统计学(Descriptive Statistics):用不同的方式来描述所获得的数据,例如分数的高低,内部差异的大小等。 推导统计学(Inferential Statistics):从某一部分群体的特征推导出整体的特征,例如从某一个学校学生的英语水平推导出这个地区所有学生的水平。总体和样本总体(population),具有相同性质的研究对象的总和。例如可以说海明威老人与海“所有限定动词的总体”,等。总体还可再分为有限总体与无限总体有限总体(Finite Population): 老人与海
4、中“所有限定动词”是有限的,可数的,这就是有限总体的例子。无限总体(Infinite Population):有些总体从理论上讲可能是无限的,例如英语句子的长度可以是无限的: This is the cat that ran after the mouse that came out from the house that the old man built .样本(Sample): 从某一总体中取出的代表总体特征的一个部分。参数及统计值参数(Parameter):代表总体的一般特点的数据就称为参数。例如,一篇英语文本共有60,5320个词,这个数字就是这篇文本的长度参数。统计值(Statis
5、tical value):从总体中获得的样本的特点。例如,从刚才提到的那篇 6万多词的文本中随机抽出1,200个词,统计出这些词的平均长度是3.8个字母,这个数字就是样本的统计值。统计学研究的主要内容之一就是变量。独立变量(Independent Variable):变更一个或一组条件,然后观察这种变更对我们感兴趣的另外一些特点的影响,这些我们能够变更的变量就称为独立变量。应变量(Dependent Variable):受这种变更影响的变量就是应变量。 语言教学方法,句子的复杂程度,社会阶层等都是独立变量;而语言考试成绩,受试者正确复述句子的数量,发卷舌r音的人在美国某一 社会阶层中所占的比例
6、则都是应变量。连续变量及离散变量连续变量(Continuous Variable):可在特定范围内任取一个值,相邻两值可取无数数值。例如。发一个英语元音所用的时间就是一个连续变量。离散变量(Discrete Variable):只能取某些值的变量。例如,任何一个英语词只能是由1,2,3,4.个字母组成,语言研究受试者只能是20,500,或1,000人等。离散变量只能按整数计算,不能有小数。 当然,词的平均长度或受试者的平均人数是连续变量,可以取3.15或55.4这样的值。定性变量(Qualitative Variable):这种变量就是要为某些量“定性”。说明“是”还是“不是”,而不说明是“多
7、” 还是“少”。例如,一个词在一个特定的句子中只能属于某一词类,我们只能说“这是个形容词”,或“这不是个形容词”,不能说“这个词或多或少是形容词”。序列变量(Ranking Variable):与定性变量恰恰相反,序列变量可划分为等级或程度。汉语发音的正确程度可用等级来表达。可以说, 学生A的发音比学生B正确,而学生B又比学生C正确。掌握一门语言的熟练程度也是一种序列变量。 在序列变量中,等级与程度的差异是连续,渐次变化的,中间没有明确的间隔。说学生A的发音比学生B的好,而学生B的又比学生C的更正确,但学生A与学生B的发音差异是否与学生B与学生C的差异完全一样就很难说了。比例变量(Ratio
8、Variable):以零为起点来计算比例。例如,某人发一个汉语韵母的时间是12秒,而另一个人只用了06秒,所以,这个人的发音时间就比那个人长了一倍。可以看出,时间就是一个比例变量。描述统计学(Descriptive Statistics)简 介摘自语言统计学: 用不同的方式来描述所获得的数据,就是描述统计学,包括集中趋势与差异性计算,主要内容有平均值,中数,众数,全距,方差及标准差的计算。集中趋势(Central Tendency)与差异性(Discrepancy)计算 测量数据的排列状态就是研究它们的集中趋势,包括计算平均数,中数及众数。 平均数(mean): 中数(median):把一组数
9、据由高到低排列,中间的那个数就是中数。它上面和下面都有同样多的数。但如果这一组数是偶数,就要将中间的这两个数相加,再取它们的平均数,这个平均数就是这组偶数的中数。 众数(mode):众数就是一组数据中出现频数最高的那个数。 差异性计算包括计算全距,方差和标准差: 1全距(Range):全距就是一组数据的最大数与最小数之差。 两组分数:A组:42 46 49 50 58 66 68 70 75 78 80 85B组:31 38 45 49 51 52 55 68 71 75 85 90A组的全距:85 42 = 43B组的全距:90 31 = 592方差(Variance,V)和标准差(Stan
10、dard Deviation,SD,S.td) 计算一组数据之间内部差异最常用的方法就是计算方差和标准差。方差和标准差是密切相关的两个概念,方差就是标准差的平方,标准差就是方差的平方根。 3 计算标准差的公式: 这两组简单数据的平均分都是 50,而标准差却相差很大: 1组:48 49 50 51 52 标准差= 1.58 2组:20 30 50 60 90 标准差= 27.39 可见,第2组的内部差异要比第1组大得多。用计算机来处理这些数据非常简单。稍后我们就用SPSS软件来演示,计算这几项常用的描述统计学数据。 下面用两位学者为我的书写的书评来简要介绍这个世界知名统计软件。 SPSS软件简要
11、介绍: 摘自书评:语言研究应用SPSS软件实例大全评介 -(刊载于外语类核心期刊外语电化教学2005年第3期,作者:孟凡胜,胡加圣) 书评前言: 美国芝加哥专业软件公司设计开发的社会科学统计软件SPSS(Statistical Package for Social Sciences)是一个功能完善,不断升级换代的统计数据分析软件,有“世界优秀统计工具”的盛名。 自从其8.0版本改为Windows制式以来,数据输入,保存,操作方式都变得及为简便,即便是初学者也可以很快上手,输出的图表更加规范豪华,更易于修改,缩放,打印。因而早已超越国界,为世界各国的研究人员所喜爱。 自九十年代中期以来,SPSS
12、的10.0版本及后来的新版本在我国得到广泛的传播,成为众多研究人员必不可少的研究工具。虽然称为“社会科学统计软件”,但实际上在自然科学领域使用得更加广泛,这当然是由于自然科学工作者对统计学原理有更深地理解。 而在我们语言研究、教学领域,对这一软件的使用并不普遍,这可能应归结为很多文科出身的语言工作者对统计学数据,计算机应用有天生的恐惧,同时也是由于还没有一本专门为广大语言工作者,语言教师撰写,以语言研究为目的,全面论述这一软件综合应用的参考书。 云南师范大学杨端和教授撰写的专著语言研究应用SPSS软件实例大全(中国社会科学出版社2004年4月出版,ISBN7-5004-4300-5,71098
13、0毫米,1/16开本,287页,319千字,定价32.00元)是第一本这样的专著,填补了这一领域的空白。 该书用解析众多语言研究实例的方法,将统计学基本的阐释与软件运行步骤说明有机地结合起来,深入浅出,全面论述这一优秀统计工具的11.0版本在语言研究,语言教学各分枝领域各个层面的全方位应用。 值得一提的是作者在演示这一软件的运行过程时,已将所有的英语统计学术语,板块名称,说明与命令语句都译成了汉语,使得不懂英语的语言工作者也能应用,熟练掌握这一强有力的研究工具,并将其得心应手地应用于自己的科研实践中。 因此,该书对于语言文字,中外文学,语言学及应用语言学专业研究人员、教师、硕士、博士研究生具有
14、较高参考价值,也可作为语言研究方法论,语言测试与统计学,及语言教学评估等研究生课程的教科书或参考书。 新加坡国家大学中文系最先看到了该书的价值,已将它定为该系研究生汉语计量分析课程的主要教材,台湾,香港的几所主要大学的图书馆收藏了该书。 国内数十所大学也将该书列为语言专业研究生参考书或教材。书中的很多实例,本身就是现成的研究项目或专题,相信广大语言工作者定会从中得到借鉴与启示。(书评结束语): 政治经济学的一个基本观点就是生产工具的使用水平反映出社会生产力发展的水平。在语言研究中使用什么样的研究工具,研究手段,就体现了语言研究的发展水平。 因此,我们新世纪的语言研究要走向现代化,首先就应该实现
15、研究工具,研究手段的现代化,走应用计算机软件全方位处理语言数据之路。 所以说,该书对于提高我国的语言研究量化分析水平,对于普及计算机在语言研究信息处理方面的应用所作的贡献是显而易见的。笔者相信,该书会成为广大语言研究人员、语言教师、语言专业研究生一本常用的参考书。 作者在前言中讲述写作这本书的动机时充满企盼地说,“作者执著的追求就是要帮助我们的语言工作者拿起SPSS这一强有力的研究工具”。我们相信,作者的企盼一定为成为现实。其实这也是我们撰写这一书评的初衷。SPSS软件界面及数据录入模式简介1变量视窗(variable view) 在变量视窗建立变量,转换。2数据视窗(data view) 数
16、据录入:在数据视窗录入数据,每个空格录入一 个数。 数据集的保存与调出数据集命名:中文,英语都可以。保存:可保存在任何一个盘上。调出:点击即可调出应用。描述统计学数据示例从Analyze下拉菜单选择Descriptive Statstics 分板块,点击Frequencies栏,将文件bar-1 中的a,b,c,四个变量都从左侧源变量栏选入右侧variables (计算变量)栏内。然后点击坐下侧displaying frequency tables.点击主对话框下方Statistics(统计值)按钮,进入Frequencies: Statistics(频数:统计值)子对话框。 左下侧的Disp
17、ersion(离散趋势)栏,全选。右上侧的Central Tendency(集中趋势)栏,也是全选。 有下方的Distribution(分布特征)栏不选了。 点击Continue 按钮,返回主对话框。点击主对话框下部Charts按钮,进入Frequencies:Chart(频数:制图)子对话框。选择histogram(直方图),点击with nornal curve.添加正态分布曲线。点击Continue 按钮,再次返回主对话框。 点击主对话框 OK.常用统计图制作误差条图(Error Bar):口语评估标准实验:未参照细则与参照细则对比。文件名:error bar从graph 到 error
18、 bar 项,进入后选 Clustered,选择 Summaries for groups of cases 点击Define后,将“口语成绩”选入右边Variables 栏内;将“学生编号” 选入 Category Axis栏内; 将“评估标准” 选入Define clusters by.栏内 点击Title 按钮,输入:口语评估标准实验误差条图 字样。点击Continue返回主对话框。点击 OK(见书2122) 从该图可见,参照评估细则后,各位老师对同一学生评估的差异迅速缩小,也就是说,信度有较大的提高。证明实施细则对于保证口语考试信度具有举足轻重的作用。饼图(Pie)的制作从Graphs
19、进入 Pie。调入文件pie:英国诗人华兹华斯诗歌修辞格百分比将所列修辞格直接录入作为变量名,看变量视窗。返回数据视窗,录入百分比转换的小数。选择summary of separate variables点击Define, 移入所有七个变量。立体饼图1.打开“立体饼图”文件。还是从 Graphs 下拉菜单选择“interranctive”选项。选择 pie, 点击进入,选择simple 项,点击进入。选择3-D 项。将修辞格拖入上slice 栏,将百分比拖入下slice 栏。点击顶部选项pie,进入后选择category,percent 这两项。返回。点击OK按钮即可。这个图还可旋转,改变角度
20、。 控制图(Control)绘制文件名:control从Graphs 到 control 项,进入Control chart 预定义框。选择 Individuals,Moving range(数据与移动范围)选项。选择左下角Cases are units(以个案为单位) 选项。点击右上角 Define 按钮,进入Individuals and Moving Range(数据与移动范围)主对话框。将左边源变量栏中的case变量选入右上方 Process Measurement(过程测量)条栏内。将group 选入Subgroups Labeled by(分组限 定)条栏内。在该框中部的Charts(制图)围栏内选择 Individuals and moving range 项,现在点击该框 OK 按钮。系统绘制出一张平均分控
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤炭基础知识试题及答案
- 室内设计中家具选择的影响因素分析试题及答案
- 教育科学试题及答案
- 大学物理考前心理建设方法试题及答案
- 注册土木工程师考试考试期间心态调整试题及答案
- 聚焦2025:职业培训学校建设方案初步设计评估与建议报告
- 屋面防水考试题及答案
- 2025护士考试题及答案
- 2025国企会计岗位面试题目及答案
- 家居产品的功能与审美考试题及答案
- (四调)武汉市2025届高中毕业生四月调研考试 地理试卷(含答案)
- 2024年探放水工技能大赛理论考试题库500题(供参考)
- XX道路危险运输企业安全管理台账标准化表格
- 坚持以人民为中心发展思想
- 球形网架屋面板安装专项施工方案
- 三新背景下高中化学高效课堂构建策略研究
- 新高考高中物理竞赛专题1力学50题竞赛真题强化训练解析版
- GB/T 6184-20001型全金属六角锁紧螺母
- GB/T 13025.7-2012制盐工业通用试验方法碘的测定
- 全文《中国式现代化》PPT
- 行政执法讲座课件
评论
0/150
提交评论