研究生面试问题2.doc_第1页
研究生面试问题2.doc_第2页
研究生面试问题2.doc_第3页
研究生面试问题2.doc_第4页
研究生面试问题2.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

研究生面试问题摘要随着我国高等教育由精英化向大众化的转变,研究生招生进入发展的快车道。在研究生招生的改革中,研究生面试的重要性凸现出来。在本文中,我们解决了以下问题:(1) 通过SPSS软件,采用多重插补法对缺失的数据进行处理,得出缺失的三个数值:70 , 83 , 80。(2) 在排序问题和二次面试问题上,我们对平均值和专家的认同度进行了综合分析,合理的给出了录取排序,并对平均值较高而认同度较低者及认同度较高且分数满足一定条件的考生进行了提取,遴选出参加二次面试的考生。(3) 在宽松和严格的判别上,我们利用专家的打分波动程度即离差平方和均值来比较区分,判定出甲专家打分宽松,戊专家打分严格。(4) 在第五问上,我们引进了新的统计指标,即离差绝对值之和,离差代数和和二者之比绝代比,通过计算出的绝代比值,分析选出专家甲、专家丙和专家戊组成第二次面试的专家组。在问题的求解中,综合的利用了Excel、SPSS、MATLAB对数据进行处理,并通过简单的模型进行求解。关键字:多重插补 标准差系数 绝代比 离差平方和均值 一、 问题重述我国研究生的考试通常包括初试和面试两个阶段。初试由国家或招生单位组织,考生选择指定的考试科目参加笔试,取得的成绩为笔试成绩。通过初试的考生可参加由招生单位组织的面试,面试时考生需要回答专家组的提问,专家组根据考生的综合表现给考生打分,考生所得成绩为面试成绩。最终招生单位一般根据考生的笔试成绩和面试成绩来决定是否录取该考生。设某招生单位组成了一个五人专家小组,对101名应试者进行了面试,各位专家对每位考生进行了打分(见附表),请你运用数学建模方法解决下列问题:(1)补齐表中缺失的数据,给出补缺的方法及理由。(2)依据面试成绩,给出101名考生的录取顺序。(3)五位专家中哪位专家打分比较严格,哪位专家打分比较宽松。(4)你认为哪些考生应给予第二次面试的机会。(5)如果第二次面试的专家小组只由其中的3位专家组成,你认为这个专家组应由哪3位专家组成。二、 模型假设 1.将各专家对考生打分的平均值作为考生的实际成绩2.根据往年数据显示,研究生录取比例在1/3左右,我们在此将录取人数定为30人。3.录取方式为按照录取顺序确定录取前30名中除争议较大者外其他考生,争议较大者与30-40名中认同率较高者进行第二次面试。三、 相关定义与符号说明严格:指专家所打分数相对于平均分的离散程度较小,所打分数与考生的真实水平较接近。宽松:指专家所打分数相对于平均分的离散程度较大,所打分数与考生的真实水平差异较大。 考生的编号,取值为1101 取1、2、3、4、5分别表示专家甲、乙、丙、丁、戊 专家对第号考生的打分 各专家对第号考生打分的标准差 各专家对第号考生打分的平均值 标准差系数 :考虑到多组数据的可比性,采用标准差系数,用相对值表示。 专家的离差绝对值之和 专家的离差代数和 专家的绝代比 专家的离差平方和均值四、 模型的建立与求解4.1问题一 题中要求将数据表中缺失值补齐。我们需要进行的工作是通过分析表中数据,建立模数学型,找到不同评委所打分数的联系,进而确定缺失值。 我们首先利用多元线性回归模型对表中数据进行分析(matlab程序见附录一),Matlab程序运行结果如下:stats =0.0586 5.7858 0.0011 180.7764其中相关系数=0.0528 (远小于1),不符合显著性要求。 通过查阅资料,发现对缺失值的处理,主要是以可能值对缺失值进行插补。常用的方法有:均值插补、利用同类均值插补、极大似然估计和多重插补。以上四种插补方法,对于缺失值的类型为随机缺失的插补有很好的效果。两种均值插补方法是最容易实现的,也是以前人们经常使用的,但是本题采用此方法进行插补,当插补后的值作为解释变量进行回归时,参数的估计值与真实值的偏差很大。相比较而言,极大似然估计和多重插补是两种比较好的插补方法,与多重插补对比,极大似然估计缺少不确定成分。所以,通过比较筛选,最后我们选定多重插补法对缺失数据进行处理。 多重插补的思想来源于贝叶斯估计,认为待插补的值是随机的,它的值来自于已观测到的值。具体实施上通常是估计出待插补的值,然后再加上不同的噪声,形成多组可选插补值。根据某种选择依据,选取最合适的插补值。 多重插补方法分为三个步骤:(1)为每个空值产生一套可能的插补值,这些值反映了无响应模型的不确定性;每个值都可以被用来插补数据集中的缺失值,产生若干个完整数据集合。(2)每个插补数据集合都用针对完整数据集的统计方法进行统计分析。(3)对来自各个插补数据集的结果,根据评分函数进行选择,产生最终的插补值。 通过SPSS软件实现多重插补,取归因次数为100。各专家部分数据如下(详细数据见附录二):表1 专家甲部分数据归因12345678910均值86.3363.8479.4463.2149.0674.6070.4282.3372.5069.30表2 专家乙部分数据归因12345678910均值82.7485.1097.1392.8492.4863.6469.5984.3788.6395.93表3 专家丙部分数据归因12345678910均值88.6069.3367.9583.6078.9463.6578.1983.2874.2889.00我们取专家甲、专家乙、专家丙100次归因结果的均值作为最终缺失值,分别为70分、83分、80分。4.2问题二 4.2.1 问题分析 要对考生进行排序,必须选定排序的依据。已知条件中,只有考生的面试得分。但是,我们要知道,在评分体系规则(如评分项目和要素、标准、程序、方法等)确定之后,影响评分主要是评委的因素。评委的知识能力水平的高低、动机态度是否端正公平、有无心理偏见、身心状态是否疲劳等等,都会十分微妙而顽强地影响着评分结果。概要地说,评委打分主要受自己的能力和动机的影响,也就是“德”和“才”的影响,因此,评委打分有很强的主观性,特别是测评指标本身具有很强的模糊性和主观性更是如此。 因此,单纯的考虑面试的分数,并不能客观的反映考生的水平。所以,我们应以考生面试平均分为主要参考的基础上,尽量抑制专家评委主客观因素的影响。我们可选择和设计有关统计指标,从评分结果中寻找值得研究的问题。4.2.2问题二的求解标准差系数考察样本平均数的代表性。与样本数据的离散程度成正相关,与样本数据的集中趋势成负相关。也就是说,越大,说明样本分布的离散程度越大,平均数反映样本的集中趋势则越不明显。具体来说,当一组评委给两个测评对象的平均分相同时,但是,二者的不同,评委对大的测评对象的看法差异更大,小的评测对象的各方面表现更稳定,因此录取排名是就应靠前。比较每个测评对象的标准差系数。即以全体评委对每一个测评对象给出的分数为基础,计算每一个测评对象的平均数和标准差,再据以计算。这里,每个测评对象的平均数,我们可以假定认为是评委们确定的“最后得分”。如果考生A比考生B的大,说明专家对考生A的意见差异更大,即使考生A和考生B的平均分相同,该分数反映的考生B的表现更平稳,应给予较高排名。这里需要把握的是在一个合适的分数区间内,才能够依据标准差系数来排名。毕竟各高校更加看重的事考生的成绩,因此我们以平均值和标准差系数两个因素来评定考生的排名,其中以平均分为主,标准差系数为辅。通过分析考生平均分以及各区间考生集中程度,最终选定15个分数区间:89-87、86-85、85-84、84-83、83-82、82-81、81-80、80-79、79-78、78-77、77-76、76-74、74-73、73-71、60-71。通过EXCEL求出各分数区间排名(见附录三),最终排名见下表4。 表4 考生录取顺序表名次序号平均分标准差标准差系数名次序号平均分标准差标准差系数14787.85.6745040.06462989524179.813.535140.16961323989.27.3959450.08291418533679.614.328290.1800043587.68.3546390.095372654357914.4048606890740.0987394755317914.949920813.881640.1563248567378.66.5038450.08274669185.27.5960520.08915554573786.633250.08504274085.87.6941540.08967545583778.29.9849890.12768588785.88.0436310.09374861592478.611.216060.142698948610.074720.11714792607878.811.627550.147558106685.810.207840.1189725614278.612.259690.15597611698510.416330.122545162978.813.255190.168213126485.212.735780.14948094633078.815.610890.198108131884.44.3358970.05137318645678.817.711580.2247661410084.86.6105980.07795516652577.410.114350.1306761522847.9686890.09486534663477.611.193750.144249165384.29.6540150.1146557667757711.202680.14548917828410.770330.12821821689977.612.11610.156135188684.410.968140.12995421695577.614.909730.192136191684.213.442470.15964929704877.816.976450.218206204583.89.5760120.11427222714676.410.163660.1330322110183.69.7108190.1161581272276.610.922450.142591229783.810.034940.11974867738976.211.79830.154833237783.814.060580.1677873974747612.389510.16302244982.47.6354440.09266315751776.414.08190.184318259882.68.7635610.106096387693746.7453690.091154261482.48.9888820.10908837779475.88.1670070.107744271182.29.3380940.11360212782874.48.4439330.113494281582.611.216060.13578765797748.4852810.114666298482.212.029130.1463398802775.29.3648280.124532307681.48.6197450.10589367815474.413.145340.176685314381.610.573550.12957784829674.415.19210.204195325081.610.922450.1338536836074.216.021860.21592833678112.708270.1568921684237310.51190.143999347981.412.778890.15698881856573.810.986360.148867356381.213.71860.16894828869273.411.148990.151894367281.815.578830.19045027872673.412.660960.172493371808.9162770.11145347885273.415.946790.217259387180.29.4180680.11743227896273.616.288030.22130539708010.074720.12593401902073.419.449940.264986402980.811.166920.1382044912171.87.8549350.1094411080.411.326960.14088257928572.28.4083290.116459429580.412.340990.15349488939072.29.7570490.135139433280.213.349160.1664483594137211.76860.163453441280.813.590440.16819849956872.211.882760.16458145338016.355430.2044428496671.812.814050.178469463880.416.486360.2050542975772.213.103430620.181670.250392999844697.5828750.109897488179.49.7621720.1229492799837110.198040.143634498079.89.8590060.123546441005966.410.139030.152696508879.410.945320.13785036101617012.786710.18266751587911.180340.141523294.3问题三 根据宽松与严格的定义,我们要考察的是专家对考生打分的波动程度。我们可以用离差平方和均值来度量该波动程度。将各个专家对每一考生的评分,分别减去该考生的平均分,即得到该专家对各考生的离差,将全部离差的平方和求均值,得出该专家的。 按照这个方法,用EXCEL对数据进行处理,求得各专家的离差平方和均值如下表5(详细列表见附录四):表5 各专家离差平方和均值专家甲乙丙丁戊126.47112.55899.2863111.43197.6646由上表可知,专家甲打分的波动最大,认为打分宽松;专家戊打分波动最小,认为打分严格。4.4问题四 标准差系数的意义表明,专家对大的考生的评分问题上存在较大争议,因此,对于那些排名较高分数较高但专家认同率较低的考生应当慎重考虑,再做研究同时,分数在可接受范围内且认同率较高者应给予二次面试的机会。 我们取为认同率分界线,由表一分析可得,给予第二次面试机会的考生如下表6:表6 二次面试考生表考生类型名次序号平均分标准差标准差系数争议较大 者51988.813.881640.156325126485.212.735780.149481191684.213.442470.159649237783.814.060580.167787281582.611.216060.135788298482.212.029130.14634认同率高者314381.610.573550.129578371808.9162770.111453387180.29.4180680.11743239708010.074720.125934上述10人通过第二次面试从中录取6人。4.5问题五 第二次面试要剔除两名专家评委,不能仅根据严格与否。在此引入新的统计指标。 1专家的离差绝对值之和将各个专家对每一考生的评分,分别减去该考生的平均分,即得到该专家对该考生的离差,将全部离差的绝对值累加求和,得出该专家的离差绝对值之和。离差绝对值之和的大小反映各个专家对考生整体水平的看法,离差绝对值之和与考生整体水平成负相关,离差绝对值之和越大,考生整体水平越不整齐,内部差异即离散程度则越大。2. 专家的离差代数和将各个专家对每一考生的评分,分别减去该考生的平均分,即得到该专家对该考生的离差,将全部离差累加求和,即得到该专家的离差代数和。离差代数和没有直接意义,必须与离差绝对值之和结合起来考察,才有实际意义。3. 离差绝对值之和与离差代数和之比将每个专家的离差绝对值之和与其离差代数和进行比较,可以计算二者的比值,简称为“绝代比”。绝代比的比值,有以下几种情况。一种情况是“绝代比”等于1,这是因为每一离差均取正值或负值,其代数和不存在正负抵消现象,正好与离差绝对值之和一致,这种情况只有该专家的评分全部低于或高于平均分时才出现。另一种情况则是“绝代比”的比值很高,也就是说,离差绝对值之和远远大于离差代数和的绝对值,这种情况,往往因为该专家的评分往往远离总体平均分,同时,具体评分由围绕平均分上下波动,因此,离差正负相抵后所得的代数和,其数值较小,两相比较,“绝代比”的数值较大。按照上述相关定义,可以得到各专家相应统计指标如下表7:表7 各专家离差绝对值之和、离差代数和与绝代比专家甲乙丙丁戊离差绝对值之和958.8901.6833.6893847.8离差代数和-268.475.695.612.684.6绝代比-3.5722811.925938.7196770.8730210.02128分析上表可得,专家甲绝代比的绝对值过小(接近1),反映其对考生评分大部分低于平均分。这种评委是一种带有主观色彩的 “公正”评委,他自己有一个稳定的主观倾向在理解和掌握评分标准。因而第二次面试,专家甲必须参与评分。 专家丁绝代比的绝对值过大,反映其对考生评分围绕平均分频繁波动,与平均分之间没有明显规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论