版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、魚首内習F检验法在检验学生成绩中的应用摘要在对学生成绩分析时,采用数理统计中的才检验法可以方便有效地 得出相关数据。以某初中全体学生的数学成绩为总体,采用卡方拟合检 验法来检验初三学生的数学成绩近似的服从正态分布,以及检验其相应 的方差是否正确,完成对考试成绩客观准确的分析,充分了解学生的学 习情况。利用卡方分布检验中重要应用列联表独立检验对学生数学成绩 与学校对其所培养的重视程度的关系进行研究,这可以帮助我们去发现 教育教学中所要发生的问题,为教育质量的认定与评价提供有效的保 障。关键词:才检验法;假设检验;卡方分布212The application of /-test in test s
2、cores of studentsAbstractIn the analysis of student achievement, using the test statistics can be conveniently and effectively get the relevant data A junior high school student with math scores for overall, using the chi-squared fit to test the students mathematical results approximately obey the n
3、ormal distribution, and test the corresponding variance is correct, complete analysis of test scores of objective and accurate, the full understanding of students learning. Using the card application distribution test of contingency table test for students to study mathematics achievement and school
4、 emphasis on its culture, which can help us to discover what happens in education and teaching, to provide an effective guarantee for the monitoring and evaluation of the quality of educationKeywords: /2-test, hypothesis testing, /2 distribution魚首内習The application of X test in test scores of student
5、s I引言01值差 值均准域式 中平标区模1.11.21.31.41.52. 假设检验的基本概念32.1问题的提法32. 2假设检验的基本思想32. 3假设检验的定义与步骤43. 才检验法在检验学生成绩中的应用63.1参数F检验63.2非参数力检验93.3列联表独立性检验164结语19参考文献2021贝51内嘗引言在现实生活中,我们经常遇到一些现象可以利用数学知识进行解释与解决的。 面对一堆数据我们可以应用数理统讣的知识去进行分析,然后找到它们的规律,这 对我们生活工作有着理论指导作用。现实中有很多数据可以建立数据模型进行分析 利用,如学生成绩、股票收益、人的身高体重等等。在教学过程中考试是必
6、不可少,它能够检验与反映学生所掌握的知识水平,也 是检验教师所实施的教学方式所达到的效果的一种重要方法。通过考试,我们可以 将学生的成绩看成数据资源,然后运用所学数理统讣中知识,进行利用分析这些数 据。在分析这些数据之前我们是不知道它们的总体是如何分布的,所以我们就需要 利用样本对总体进行假设检验,而这种假设检验称为非参数检验。非参数检验方 法有很多,如*拟合检验法、t检验、柯尔莫哥洛夫检验、符号检验、秩检验等。 这里采用*检验法来检验初三学生的数学成绩近似的服从正态分布。通过理统计分 析之后,我们能够对教育教学中效果得到一定了解,这对今后教育教学工作有一定 的借鉴作用。211. 常用统计量为
7、了方便对数据分析的说明以及建立模型的需要,我们将成绩视为总体随机变 量,记作而学生成绩里的数据就可视为总体的一组样本,那么利用统计学中经 常用的统计量对样本作出数据分析,就能够得出一些相关的教育教学的结论。在平 时教育教学工作中,我们经常运用以下儿个统计量进行数据分析:1.1中值中值是表示对总学主成绩按照高低进行排序之后,处于在总成绩中间位置的分 数。它是用来反映全体学生考试成绩的具有代表性的数值,在一定程度上可以反映 学生成绩整体水平,且不受到学生成绩两极分化的影响。它的主要不足之处是不具 有很强的可靠性,不能客观的说明学生成绩的水平。1.2平均值平均值用来反映学生学习成果的平均水平,运用它
8、的主要的意义在于方便学生 知道自己在班级的地位,教师也可以利用在各个班级间作比较。它的不足之处是易 受到个别数据的影响,使其不具有客观的代表性,从而无法客观的反映学生的成绩 情况。1.3标准差标准差是在数理统讣中经常使用并作为统讣分布程度上的测量。标准差定义是 总体各单位标志值与其平均数离差平方的算术平均数的平方根,它反映组内个体间 的离散程度。而标准差运用在教育教学中就是用来反映了学生成绩的分布相对于 总体的均值的离散程度。如果标准差越大,则说明学生成绩的高低相差越大,山此可 看出学生间学习成绩相距较大。1.4区域区域是指一段数据的分布范围,而运用到学生成绩中是指学生成绩的最高分与 最低分之
9、差,它是用来反映总体学生的学习成绩上的所分布的范围,运用它可以让 我们对学生成绩的有一个大体的了解。1.5模式模式运用到学生成绩中去,主要是指总体成绩中出现次数最多的一个分数,它 是用来反映学生成绩主要分布在什么地方。利用它我们能够大体知道学生水平在什 么位置,它的不足之处在于不具有客观的可靠性。2. 假设检验的基本概念2.1问题的提法在数学学习中,我们常常遇到“假设x正确”、“假设函数/单调递增” 之类的语句。而在数理统计假设中的“假设”与这些的意义是不同的。它不是一个 正确的命题出现的,而是作为一个陈述,其是否正确,我们是否愿意认可它,这些 都是需要依据样本分析才能做出最后的决定。而这做出
10、决定的过程,我们称作对该 假设进行检验“:。在统汁学中,我们把需要根据样本去推断命题是否正确的称为一 个假设,通过样本对一个假设做岀“是”或“不是”的一个判断的过程,称这为检 验这个假设,具体的判断规则称为该假设的一个检验,检验的结果若是肯定该命题, 则称为接受该假设,反之则是否定或拒绝该假设。利用统计假设检验处理实际问题时,我们一般可以分为四条:(1)明确所需处理的问题,其答案只能是“不是”或“是”。(2)取得样本并知道样本的分布。(3)把回答是“是”的转化到样本分布上所得命题称为假设。(4)根据样本数据,进行分析计算,得到“拒绝”、“接受”的假设的决定。2. 2假设检验的基本思想为了方便理
11、解假设检验的基本思想,我们先说明相应的问题。例 假设小明说他的袋子里装了 10个大小相同的球,其中5个白球,5个黑球。 现在我们进行有放回的摸球试验,每次摸一个球后记录颜色,试验结果是全部是黑 色的球,那么我们对小明的说法两种看法:一种是他的说的是对的,我们的试验只 是运气好而已;另一种看法是认为他是说谎,我们运气哪有这么好,而这只是我们 自己的想法,这还需要一个科学客观的分析论证。现在我们对上面问题进行分析论证:现在我们假设“一半为黑球”是真命题,那么在有放回的试验中,我们可以知道其概率分布为心05(/ = 123,4,5)得出这次试验中黑球总数为X = X1+-+X5根据以前所学知识我们随
12、机变量(2. 2. 1)X OF =0.0312贝乳内容显然这是一个小概率的事件,也就是说100人中大约只有3个人才会出现这样的 结果。然而我们就是三人中的一个人,而现实主活经验告诉我们这个可能性太低。 当然我们也不能否认这种事件可能出现的,所以我们得出一个比较科学结论:冒着 0.0312的错误来不赞成他的说法。以上的分析论证就是数理统计学中假设检验的基本思想,它有点像中学数学证 明中的反证法,首先需要假设一个命题H为真的,然后根据这命题和已知的条件进 行推理,最后得到一个矛盾的结果,这就可以说该命题H不成立,从而确定反命题 戸成立。而在统计学中这种“矛盾”跟我们以前学习的“矛盾”不同,这里我
13、们指 小概率事件,还有一点需要说明的是在以前数学证明中一旦命题H不成立时,我们 就认为其反命题帀成立,而我们在数理统计中否定一个假设H是指“冒多大”的 风险。2. 3假设检验的定义与步骤1. 零假设与对立假设在检验假设中,常把一个被检验的假设称作为零假设(原假设),记为 未知的总体参数&等于某个特殊的常数值,记作而与零假设的对立面叫 作对立假设(备择假设)叭2. 检验统计量在检验一个假设时所要使用的统讣量称为检验统计量,使原假设得到接受的那 些样本所在的区域,称为该假设检验的接受域,而使原假设被否定的那些样本所成 德区域W,则称为该检验的否定域3. 假设检验的步骤(1)根据相关的问题做出相应的
14、零假设0),同时也给出它的对立假设(2)在的前提下,选择相应的统计量,而统计量需要包含检验的参数,并 且总体分布已知;(3)根据相应问题定出显著性水平a ,然后根据对立假设耳和总体统计量的 分布,计算出其小概率事件及其概率表达式。(4)按照样本值计算出需要的数值;(5)判断小概率事件是否发生,需要综合(3) (4)就可以看出。根据实际推动原理:若小概率事件在一次实验中发生就认为原假设不合理,于是就拒绝 若小概率事件不发生,就认为原假设合理,即接受耳)巴21贝51内嘗3. 才检验法在检验学生成绩中的应用3.1参数才检验我们这里仅介绍母体纟的分布为正态时的检验方法,正态分布N阳)含有两 个参数“和
15、bS因此,这里的假设都是对这两个参数的假设,现在我们讨论有关方 差假设的显著性检验问题何。设鼻鼻気是取自正态分布的母体M/rd)的子样。现在需要检验假设Ho : cr2 = b(j,:工 bj 下面分别对已知和未知两种情况说明与论证。1. “=从是已知的常量。由于样本的方差丄ffe-z/o)是母体方差比的无偏 “ /=!估计,那么统计量为“篙当是真命题时,那么统计量应该在1的附近随机的分布,那么当假设0)成立 时,统计量($ - (J八一.(3.1.1)%服从自由度为“的才分布。而现在对于给定的显著性水平那么怎么去确 定临界域C?因为统讣量才的值是在一个闭区间内,设存在勺与心,使得/九 Z &
16、2)=1 Q上述可知,临界域C的结构形式是z2z2A:2o定出心和的方法有 很多。这是由于我们把a分成任意两个血,a2O+a2=a;分别由k,)= a,确定匕和灯。通常4和E的选取:都是看犯貳二类错误的发生概率来确定的。 这就需要选定5和叫使得出现第二类错误的可能性尽量小。可是在实际中计 算最优的5和5很麻烦。通常就选取a,=a2=-o那么这时人和為分别是自由度为”的才分布的冬和1-2分位点,即=加何,焜=乙何2 2 7这样我们就得到临界域Ch 八z;OoK|z2 n W) 当样本观测值(“2,&)c时,読诂绝假设用,末然就接受零假设血。 或者通过样本观测值馆,七,兀)算出的统计量*的值,若它
17、小于或大于 石(“)时,就拒绝原假设H。,否则就接受原假设H0C12:o72 2. “为未知常数。这时(3.1.1)式所表示的已经不是一个统计量。因为它含 有的未知数“。运用前面的方法,利用样本的均值旨来替代未知的总体均值“。零假设成立时,根据定理可以知道统计量(3.1.2)宀(翌IX225)%服从自由度为(“-1)的*分布。确定相应的Q后,可以跟前面一样,通过 彳力*么(-1) =y 彳八乙(”一1)=号确定出两个临界值。不过此时的和加(幵-1)都是通过查自由度为 H2 2(n-l)的才分布表得出的。上这种通过统计量(3.1.1)和(3.1.2)给出的检验法 则称作*检验。例 某班级学生进入
18、高中前的中考成绩X服从正态分布。现在随机从中抽取10 个学生的参加中考的成绩,具体抽样分数如下:568, 570, 578, 570, 572, 572, 570, 596, 572,584在检测水平为a = OO5情况下,我们能不能相信该班学生成绩方差为64呢?解:根据题LI的意思,可以知道是要进行检验假设:= 64 vs H : 工 64山于未知,所以检验统讣量是2 (”-1/而=10Q = 0。5,加/2(- 1)=Zo.)25=19.02, X-an =加/9)= 2.70 ,然后计 算得 x = 575.7,(“ _ 1)? = 260.1。由此可知21贝乳内容H叫。664应该接受A
19、7即认为这个班级的学因为2.70 v 4.06 v 19.02,根据才检验法, 生成绩的方差为64。21贝51内嘗3.2非参数才检验在前面一节中,介绍了总体分布形式是在已知的条件下来进行假设检验相应问 题,但是在很多地方,我们常常事先并不知道总体的分布类型,而这时我们就需要 根据样本的分布对总体的分布类型提出相应假设并进行相应检验,而这种检验得方 法一般被称为分布拟合检验或非参数检验。例如,我们需要考察一个产品的可琳性 从而打算运用指数分布的模型,在此之前可能有些理论或检验上的依据,但是这可 不可行呢?通常我们就需要根据样本对总体进行检验。那么现在我们说明其中一种分布拟合检验的方法一一非参数*
20、检验。现设离散型总体X只能选取mrm2.mr个数值,现在需要进行检验H : P(X =叫)=人(/ = 1,2,/)(3. 2. 1)其中,卩广1且“已知。可令事件A =(X=“)(21,2, r),则式可以写 /-I成H): P(Ar) = (/ = 1,2,/) vs 耳:P(4)工 p (i = l,2,/*)(3. 2. 2)设X】,X?,X”为取自总体X的样本,记山为样本中取值为叫的个数(1/ r)且竹/“为4生的频率。由于频率的稳定性,故当较大时,两者应比较接近, 所以在成立时,叩n应与门非常接近。曲此可知,叩n与门的差异的大小就可 以反映的真伪。皮尔逊提出用(3. 2. 3)伺
21、Pi作为检验的统计量,*利用可以均衡两者的差异的程度,当矶不真时,才 的值应较大,这时拒绝域可取为W=g,2,宀)|zc其中,c为某正数,为了 得到水平为Q的检验,还需要检验统计量才在下的分布。下面我们介绍下皮尔逊定理中指出了才的渐近分布。(皮尔逊定理)若总体的真实分布必已知。那么可以令P(X =ni,)=必(i = 1,2,)则(3. 2. 3)式所定义的统计量z2近似地服从自由度为一1的Z2分布叫有时把(3. 2. 3)式中的和弘和”门分别称为(心或第i组的,因也的具体值不起 作用,它只是起一个标识的作用)经验频数和理论频数。而有上述定理可知,假设检验(3. 2. 2)的一个水平为的拒绝域
22、为注意到事件群4卩/满足:(1)人互不相容,即A/.=0(/y);(2)U 4 = Q o(=1则称做为有限完备事件群,所以上述检验也可以叫作为有限完备事件群的检验。由于定理的结论为近似结果,应用时一般要求”550,且每个曲5,否则相 邻组要进行合并。而皮尔逊才拟合检验法大体是根据检验各个小组服从的实测频数与理论频数 之间的相距多少来判断经验分布是否服从任何一个预先给定的分布。它就是通过用 各个小组的实测数据与理论频数之间的差异构成了一个符合才分布的统计量,并且 利用这个统讣量来进行相应的假设检验.使用这种方法时要求选取的样本容量比较 大,并在进行分组中,每组的理论频数至少不小于5。设总体分布
23、为F(x),选取总 体中的样本为那么现在我们就利用这组样本的数据来进行检验假 设:H:F(x)=佗,其中几(X)是一个给定的分布函数刖。具体的操作方法可以分为以下几条:(1)数据分组:把样本值出现的范围划为&组.仏,勺,(绚,心,(“,其中 _oo = /()v q v ar 为真命题时,只要充分大那么才统计量就 近似的服从自由度为厂-1的才分布.对于给定的显著检验水平a ,可查得才分布 的l a分位数加a(1)。(5)具体进行相应计算:根据样本的数据进行分析讣算出统讣量*的具体值.(6)作出相应的判断:当Z2 时,则拒绝假设命题;不然就接受假设不 过需要注意的地方是,在进行计算门=仇()-仇
24、仏J时,仇(X)的分布必须全部知 道。如果仇(x)中还有k个参数不能完全确定,那么可以利用这些参数的极大似然估 计量来替代它,以此来使得分布函数仇(尢)能够完全确定下来,然后再根据上述方法 进行检验,不过这时才的自由度为r-lCls3o例1本文选定某个中学初三学生的数学成绩为进行研究,运用抽样调查法从该 学校的学生中随机地抽取200名学生作为样本,对这200名学生的数学成绩进行调查 收取,通过对数据进行分析计算,观察其是否服从某种分布,从而来预测整个初三 学生的数学成绩。调查数据表如下:图表3. 2. 4805661596563289056735768698865555833735087678
25、657687258674563316543635869378578287549645272476986452351356354456930636148786453522596774776835737665573565475496558506659407898635365965870487562936536618558296456643564676556687957545136927158453353524555524153576748644364575212581758356257435237534664636462685357436237435364543663446446666453685
26、2624673576553766845637342634565746575638575647683857253那么我们现在对学生数学成绩进行假设检验:根据图表3. 2. 4中所列的数据为初三学生数学成绩的容量为“ = 200的样本调 查值,记X为初三学生的数学成绩,那么我们现在对这些数据进行分析整理:(1) 首先需要找出这些数据的最大值与最小值,以此来确定成绩的分布区域: 根据图表3. 2. 4我们得岀:min xl,x2,- -,x120=23; maxxrx2,-,x120=96,从而定出区间上=20,100,区间的长度为:b-a=S0.(2) 然后确定需要分组的分组数I我们把区间肚闰分成
27、r个小的区间,使得每 个小的区间上有不少于5个样本值,为了方便进行计算,可以选取/二8.(3) 确定组距: = ,则D=1()()2(),则把心分成8个小区间,即r820,30, (30,40,,(90,100o(4) 根据上述数据做出相应的直方图,然后再根据图像来进行假设概率分布, 从而进行验证.将X的取值离散化,这里将X的取值分成8组,如图表325所示。图表32. 5组限20,30(30,40(40,50(50,60频数6142951组限(60,70(70,80(80,90(90,100频数602111521贝51内嘗图表3.2.6频数(5)进行估计分布:我们通过观察样本的直方图可以得到,
28、学生成绩的直方图 基本上是单峰对称的,根据外轮廓线可以佔讣总体可能服从正态分布.(6)进行假设检验:假设初三学生的数学成绩的分布近似的服从正态分布,即 X 叫心).首先,我们需要给出确定的显著水平& = 0.05,然后假设 H. : F(x) N(“&),其中F(x)为初三学生数学成绩的分布函数。现在我们对上述结论进行才检验:在给出的显著水平下& = 0.05的情况下进行 检验假设因为乩)中含有未知的参数,所以需要先进行参数的估计。然而我们可以知道“ 和b:的极大似然估计值分别为样本的均值”与样本的方差&丄那么现在需要计算和&2。二丄二乂二59. 48, &2二丄土化一对二 fl J-!戸 /
29、=!216.56,则&二 14.72所以原假设可写成尸 (59.48,14.722).现在算每一个区间的理论概率值,随后计算出相应的理论频数,卩与统计量* 的数值.pl=P(20X30)=(巴工卜(辽百;I b 丿 (7 JA = P(0 x 艸号-屮壬牛心1,2,38);通过进行计算我们得到的结果如图表32. 7中所列.图表32. 7编 VlHJ号仏-|“APinPi3 -尬(n,.-np.)2/(np.)120,3060.0193.82.21.2736842(30,40140. 07114.2-0.20. 0028173(40,50290. 16733.4-4.40. 5796414(50
30、,60510. 25150.20.80. 0127495(60,70600. 24949.810.22. 0891576(70,80240. 15731.4-7.41. 7439497(80,90110. 06312.6-1.60. 2031758(90,10050.0163.21.81.01256.917671根据上面的表中讣算得出的观测值为6.917671.然而在显著水平0=0.05情况下,通过查阅r = 8,/7 = r-l=8-2-l=5的才分 布表,我们很容易得到相应的临界值:(5)= 11.070因为才=6.917671 力:(尸 -1)(s T)上述检验通常称为联立表的独立性检验
31、,它在实际应用中非常广泛。例2某研究机构欲对学生数学成绩与所在班级关系进行研究。为此将学生数学 成绩分成了三个水平阶段:优秀、良好与合格,并且相应的将所在班级依学校培养 重视程度分成了三个层次:普通班、重点班和实验班。现在有一个有500人的样本 资料,见表3.3.2,请在a = 0.01的情况下检验学生数学成绩与其所在的班级是否有 关系。贝乳内容表3. 3. 2调查资料表数学成绩所在班级合计普通班虫点班实验班优秀25211056良好828830200合格223165244合计33012515500解:本例要检验学生数学成绩与所在班级的关系,也即检验独立性问题,根据 题意建立假设成绩与所在班级无
32、关系(独立)拓成绩与所在班级有关系(不独立)本例中行与列相等,r = 5 = 3所涉及的一个3x3的列联表,所以需要计算9个期望 频数值。表3.33经计算的调査资料数学成绩所在班级合计普通班重点班实验班优秀25 (36. 96)21 (14)10 (5. 04)56良好82 (132)88 (50)30 (18)200合格223 (161.04)16 (61)5 (21.96)244合计33012515500其中括号中的数字为“的值计算才统计量.(2536.96)2(21一14)2(10-5.04)2(82 一 132)2(88-50)27 =+ +36.96145.0413250(30-18)2(223161.04)2(16-61)2(5-21.96)218161.046121.96= 3.87 + 3.5+4.88+18.94+28.88 + 8 + 23.84+33.2 + 13.1 = 138.21在给定6? = 0.01的情况下,通过査阅才的分布表,我们可以得到加】(4) = 13.277。 由于才=138
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年香肠制造行业分析报告及未来发展趋势报告
- 2026年葡萄糖酸钠行业分析报告及未来发展趋势报告
- 2026年光伏组件用压敏胶粘带行业分析报告及未来发展趋势报告
- 2026年PEX管道行业分析报告及未来发展趋势报告
- 2026年贝壳粉壁材行业分析报告及未来发展趋势报告
- 2026陕西西安航天乾元科技有限公司招聘2人备考题库含答案详解(完整版)
- 2026浙江大学“一带一路”国际医学院行政部门招聘2人备考题库(2026年第6批)附答案详解(培优)
- 2026四川遂宁市应急和安全生产信息中心招聘编外人员1人备考题库及答案详解(全优)
- 2026湖北襄阳市市直事业单位“智汇襄阳·才赢未来”专项招聘108人备考题库(成都站)含答案详解(突破训练)
- 2026重庆广播电视传媒集团股份公司所属企业招聘20人备考题库及答案详解(考点梳理)
- 地基桩基公司管理制度
- 郁南县2023年低效油茶林改造项目作业设计
- 《危重症患儿管饲喂养护理》中华护理学会团体标准解读
- 《国家综合性消防救援队伍队列条令(试行)》课件
- 2024年贵州省高考化学试题含答案解析
- 2025-2030年中国核桃种植深加工行业竞争格局与前景发展策略分析报告
- 《冻鲅鱼、冻鲐鱼》标准及编制说明
- 古诗鉴赏(简答题各题型答题技巧与答题规范)-2025年北京高考语文一轮复习(原卷版)
- 加油站施工施工组织设计方案
- 2024年西藏自治区中考语文试题卷
- 汽车配件物流运输服务方案
评论
0/150
提交评论