




已阅读5页,还剩58页未读, 继续免费阅读
(运筹学与控制论专业论文)城市择校生问题的logistic回归分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 城市择校生问题的l o g is t i c 回归分析 谢经汤 ( 山东大学数学学院济南2 5 0 1 0 0 ) 中文摘要 目前,国家正在进行基础教育的改革,大力推进素质教育,但影响素质教育 一种现象是存在与基础教育过程中的择校现象,这种现象下至小学上到高中都普 遍存在着。择校现象是一种普遍的社会现象,在中国“择校生”、“择校费”成 为世界罕见、中国特有的现象。造成择校现象的原因是多方面的,是教育发展中 的深层次矛盾逐渐暴露出来结果。 由于政府教育经费投入不足和不平衡,使得地区与地区之间、学校与学校之 间在办学条件上存在硬件和软件的差距,在师质队伍的质量方面也存在相当的距 离,进而在教学质量上存在一定的差距,使学校之间的发展处于不均衡的状态; 其后又人为地进行等级排序,分重点学校和重点班,政府为了当地的升学率,对 重点学校进行了政策上的倾斜,加大教育经费的投入力度,改善教学环境,配备 较好的师质力量,使得名校的声誉越来越高。家长在为孩子选择学校的时候对“学 校的办学理念、教学环境( 如学校风气等) 、硬件条件、师资教学水平、学校声誉 文化底蕴、学校升学率”等因素要求越来越高,因此一窝蜂争着挤进重点学校, 因而,“择校现象就应运而生,造成恶性循环。 “择校 问题影响了政府的威信,严重地损害了国家政策、法规的严肃性, 影响了教育的均衡发展。同时,“择校”现象的盛行阻碍了素质教育的全面推进,学 生选择升学率高者而上,学校面对社会的压力不得不在提高升学率上挖空心思, 在比升学率上暗暗较劲,加重了学生的课业负担。还有,“择校”现象的存在,让学 生从小体会到了现实中金钱、权力、关系的重要性,这种潜移默化的影响,常常 山东大学硕士学位论文 会使学校教育置于非常尴尬的境地。这种教育中的“反教育”现象应引起我们高度重 视。 产生择校这种社会现象的原因是多方面的,本文及对影响择校的因素进行了 定性的分析,又利用l o g i s t i c 回归模型对影响择校的因素:学校的办学理念、教学 环境( 如学校风气等) 、硬件条件、师资教学水平、学校收费水平、家庭收入水平、 学校声誉文化底蕴、学校升学率、交通安全等做了定量的分析。文章第一章对“择 校生”这种现象的普遍性,以及这种现象为社会带来的种种弊端进行了深入的分 析,由此提出研究形象择校的因素的必要性,并对国内目前的研究现状做了简单 的介绍。第二章介绍了l o g i s t i c 回归模型的基本理论。第三章利用调查问卷得到的 信息,分析了“学校的办学理念、教学环境( 如学校风气等) 、硬件条件、师资教 学水平、学校收费水平、家庭收入水平、学校声誉文化底蕴、学校升学率、交通 安全等 因素在进行学校选择时对选择者的影响。本文的第四章在简单总结的基 础上对解决“择校现象 提出了几点建议。 关键词:择校l o g i s t i c 回归模型 拟合优度影响因素 山东大学硕十学位论文 l o g is ticr e g r e s sio na n aiy siso f citia s s c h o o is eie c tin gp r o bia m x i e j i n g t a n g s c h o o l o fm a t h e m a t i c s ,s h a n g d o n gu n i v e r s i t i j i n a n ,2 5 0 1 0 0 a b s t r a c t c u r r e n t l y ,c h i n ai sd o i n gi n n o v a t i o nf o rb a s i ce d u c a t i o nt oi m p r o v e q u a n t i t ye d u c a t i o n ,w h i l es c h o o ls e l e c t i n gi sap h e n o m e n o ni nt h eb a s i c e d u c a t i o np r o c e s s ,w h i c ha f f e c t st h eq u a n t i t ye d u c a t i o na n de x i s t sf r o m p r i m a r ys c h o o l st oh i g hs c h o o l s s c h o o ls e l e c t i n g ,a sac o m m o ns o c i a l p h e n o m e n o n i t sr e l a t e d 。s c h o o l s e l e c t i n g s t u d e n t s a n d 1s c h o o l s e l e c t i n gf e e s ”a r er a r ei nt h ew o r l db u tu n i q u ei nc h i n a r e a s o n sf o r s c h o o ls e l e c t i n ga r ev a r i o u s i ti sr e s u l t e df r o mt h ee x p o s u r eo fd e e p e r c o n f li c ti ne d u c a t i o ni m p r o v e m e n tp r o c e s s g i v e nt h ei n s u f f i c i e n c ya n di m b a l a n c eo fg o v e r n m e n te d u c a t i o no u t l a y , t h e r ei sl a r g ed i f f e r e n c ea m o n gs c h o o l s ,a m o n gr e g i o n s ,a n da m o n gq u a l i t i e s o ft e a c h e r s ,l e a d i n gt ot h ed i f f e r e n c ei nt e a c h i n gq u a li t ya n di m b a l a n c e o fi m p r o v e m e n to fs c h o o l s t h e n ,s o m es c h o o l sa n dc l a s s e sa r er a n k e da s “k e ys c h o o l s ”a n d “k e yc l a s s e s 。f u r t h e r m o r e 。g o v e r n m e n tg i v e sp o l i c y b i a st ot h ek e ys c h o o l s :m o r ee d u c a t i o n o u t l a y ,i m p r o v i n gt e a c h i n g e n v i r o n m e n t s ,p r o v i d i n gw i t hb e t t e rt e a c h e r s t h u s ,k e ys c h o o l sh a v ee v e n b e t t e rr e p u t a t i o n p a r e n t sp a ym o r ea t t e n t i o no ns c h o o l s t e a c h i n gi d e a s , t e a c h i n ge n v i r o n m e n t ,l e v e lo fe q u i p m e n t ,t e a c h e r s q u a l i t i e s ,r e p u t a t i o n a n dt h er a t i o so fe n t e r i n gh i g h e rs c h o o l sw h e nt h e ys e l e c ts c h o o lf o rk i d s , 山东大学硕士学位论文 t h e r e f o r e ,t h e ya l lw a n tt os e l e c tk e ys c h o o l s ,t h e r e f o r es c h o o ls e l e c t i n g p h e n o m e n o na p p e a r sa n dr e s u l t si nav i c i o u ss p i r a l t h i s “s c h o o ls e l e c t i n g p r o b l e ma f f e c t st h eg o v e r n m e n t sa u t h o r i t y , h u r t st h es e r i o u s n e s so fc o u n t r y sp o l i c i e sa n dl a w s ,a n da l s oa f f e c t s b a l a n c e di m p r o v e m e n to fe d u c a t i o n m e a n w h il e ,i tb l o c k st h ed e e p e no f q u a n t i t ye d u c a t i o n s t u d e n t ss e l e c ts c h o o l sw i t hb e t t e rr a t i oo fe n t e r i n g h i g h e rs c h o o l s ,w h i c hi st h es o c i a lp r e s s u r et h a tm a k e ss c h o o l sf i g h tf o r h i g h e rr a t i ob yb u r d e n i n gs t u d e n t s m o r e o v e r ,t h ee x i s t e n c eo f s c h o o l s e l e c t i n gm a k e ss t u d e n t sf e e lt h ei m p o r t a n c eo fm o n e y ,p o w e ra n dh u m a n r e l a t i o n s h i p ,t h i sg r a d u a li n f l u e n c el e a d ss c h o o le d u c a t i o nt oaa w k w a r d s t a t e m e n t t h i s “a n t i e d u c a t i o n ”p h e n o m e n o nn e e do u rh i g ha t t e n t i o n r e a s o n s f o rt h i ss o c i a l p h e n o m e n o n i sv a r i o u s ,t h ep a p e r g i v e s q u a l i t a t i v ea n a l y s i sf o rr e a s o n sa f f e c t i n gs c h o o ls e l e c t i n g 。t h e n ,u s i n g l o g i s t i cr e g r e s s i o nm o d e lt og i v eq u a n t i t a t i v ea n a l y s i sf o rr e a s o n so f s c h o o ls e l e c t i n g :s c h o o l s t e a c h i n gi d e a s ,t e a c h i n ge n v i r o n m e n t ( s u c ha s s c h o o l s p i r i t ) ,l e v e lo fe q u i p m e n t ,t e a c h e r s t e a c h i n gq u a l i t i e s , c h a r g i n gf e e s ,h o u s e h o l di n c o m e ,r e p u t a t i o n ,r a t i o so fe n t e r i n gh i g h e r s c h o o l s a n dt r a f f i c s a f e t y s e c t i o n1g i v e sd e e p a n a l y s i so ft h i s p h e n o m e n o n sc a t h o l i c i t ya n dt h eh a r mt os o c i e t y ,t h e r e f o r ec o m e so u tt h e n e c e s s i t yo fr e a s o n so fs c h o o ls e l e c t i n g ,t h e nb r i e f l yo u t l i n e st h i sk i n d o fr e s e a r c hi nc h i n a s e c t i o n2i l l u s t r a t e st h eb a s i ct h e o r yo fl o g i s t i c r e g r e s s i o nm o d e l s e c t i o n3u s e si n f o r m a t i o nf r o mq u e s t i o n n a i r e st oa n a l y z e t h ee f f e c to fs c h o o l s t e a c h i n gi d e a s ,t e a c h i n ge n v i r o n m e n t ( s u c ha ss c h o o l s p i r i t ) ,l e v e lo fe q u i p m e n t ,t e a c h e r s t e a c h i n gq u a li t i e s ,c h a r g i n gf e e s , h o u s e h o l di n c o m e ,r e p u t a t i o n ,r a t i o so fe n t e r i n gh i g h e rs c h o o l sa n dt r a f f i c s a f e t y ,t os c h o o ls e l e c t i n g s e c t i o n4g i v e sb r i e fc o n c l u s i o na n ds o m e a d v i c eo ft h es o l u t i o nt os c h o o l i n gs e l e c t i n gp h e n o m e n o n 山东大学硕上学位论文 k e yw o r d s :s c h o o ls e l e c t i n gs t u d e n t s ,l o g i s t i cr e g r e s s i o nm o d e l ,g o o d n e s s o ff it ,a f f e c ti n gf a c t o r s v 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名:委缝窭兰垄日,期: v ;暮、, 6 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:粒导师签名:龃日 期:壁垄:匕譬 山东大学硕士学位论文 一、“择校生刀现象 第一章问题的提出 从1 9 9 3 年国家取消小学升初中考试开始,义务教育阶段的“择校生”问题便逐 渐形成为一种“气候”,成为一个社会普遍关注的热点问题。 近些年来,“择校生”现象,一直是人们普遍关注的社会热点问题,国家有关 部门曾三令五申,制止义务教育阶段的“择校生”现象,但时至今日,这种现象非但 没有得到有效遏制,相反却愈演愈烈。择校出现了普遍化、平民化、低龄化等新 特征。我国义务教育阶段的择校现象并非是选择合适的教育,究其实质是家长凭 借社会、经济地位为子女选择优质教育资源的竞争行为。择校热的不断升温使我 国的义务教育发展面临极大的挑战。 受教育的需要是每个人在一生的成长经历中必然会产生的需要。而接受学校 教育是人们受教育的主要形式。同时,对一个国家而言,国民的受教育水平也是 影响国家实力的一个重要因素。因此,我国将中小学接受义务教育以法律的形式 规定下来。对每一个处于中小学学龄阶段的孩子,既有受教育的权利,也有受教 育的义务。对于每一个孩子的家长而言,送孩子去上学通常都是最好也是唯一合 法的选择。但对于个学生的家长来说,当某一个区域中有两所以上的中学时, 选择送孩子去哪一所中学就读,便成了一个需要考虑并作出决策的问题。在我国, 由于国家对于中小学学生接受义务教育有着多种多样的政策与规定来加以限制。 例如划分学区就近入学的规定,对学校招生条件的规定,包括对学生及家长户籍 所在地的限制以及借读生就读与升学的种种规定。这些规定使家长在学校选择问 题上的选择自由度大大降低。但由于在具体的某个时间和地点,这些政策的执行 力度与具体内容又不完全相同,这会又使家长在学校的选择上又存在一定的可能 性。因此,家长们如何在政策法规的限制范围内,尽可能地为子女选择满意的学 校,就成为一个较复杂的问题。 山东人学硕士学位论文 作为家长,其决策的目标是明确而单一的,就是在有限的条件下尽可能让孩 子接受高质量的教育。尽管家长们对教育质量的标准的认识可能不尽相同,对选 择权的认识也不相同,但大多数家长是趋向于自由选择的。只有当他们已经明确 地受到政策限制,不再有选择权时,他们才会趋向于支持“就近入学 。其目的 已不再是为了孩子,而是为了使自己受到的失去选择权的待遇看起来更公正一些。 二、择校屡禁不止的原因 政府政策明确禁止择校,并一直将择校和乱收费捆绑起来进行治理:不准公 办小学和初中招收择校生,严禁把捐资助学与录取学生挂钩。而在实践中, “治 理成果 不容乐观,择校生现象并没有得到遏制,反而有愈演愈烈之势,择校费一 路上扬而家长乐此不疲。择校何以“禁而不止 ? ( 一) 差异导致选择择校问题背后隐藏着两大“不公正 1 、长期以来义务教育阶段教育资源的配置不均衡、重点校制度、学校人事 管理制度等一系列“锦上添花 的教育政策使得我国义务教育资源配置已然不均 衡。义务教育资源配置严重不均衡,根本无法保证每个学生就近接受优质教育。 2 、家长享有社会资源的差异性,择校能力的差异性 社会分层理论认为从事不同职业的人,在收入、声望、教育、权力等方面存 在着显著差异。由于学生家长职业分工的不同,自然形成强势人群与弱势人群。 强势群体势必近水楼台先得月,利用自己所占有的社会资本优势为子女择校,抢 占优质教育资源。而弱势群体希望通过接受优质教育以改变孩子的命运,也热衷 于择校。 ( 二) 教育资源配置中的竞争性与选择性加剧差异 根据经济学的理性人假设,学校与学生都试图在教育资源的争夺中实现自身 利益最大化。学校希望凭借出类拔萃的生源优势,最大限度地赢得良好的社会声 2 山东大学硕+ 学位论文 誉,吸引滚滚财源,形成品牌效益,良性循环。学生认为优质的教育资源无疑为 其提供广阔的竞争平台,使之如虎添翼。在双方互惠互利的选择中,势必展开激 烈的竞争。优胜劣汰,竞争不可能消除差异,反而可能扩大差异。 ( 三) 教育的人力资本功能突显与公众教育需求 高额的“择校费”是激发择校的内在动力,教育在理论和实践上都具有调节 收入分配,促进社会分层的功能。长久以来通过教育消费购买教育产品“学历 , 从而累积择业的资本成为不褪色的真理。受教育程度、接受教育的质量代表着一 个人的人力资本,而人力资本的大小与职位高低、收入多少基本成正比。在2 0 世 纪9 0 年代,我国实际上正是在运用教育分流作为各类职业选拔的工具。职业与受 教育程度的关系不可置疑,如果希望从事较为满意的职业,就必须争取接受优质 的较高程度的教育。 因此,家长为孩子谋取优质教育资源蔚然成风并不难理解。择校归根结底是 在选择优势职业与优质社会资源。学生可能在普通学校中得不到所期望的高质量、 个性化的教育,导致在同后的择业竞争中处于劣势。于是择校成为追求优质教育 资源的直接途径。家长深信:在“知本社会 中,今天占有多少教育资源,就意 味着明天享有多少社会资源。诚如联合国科教文组织国际教育发展委员会学会 生存所言:“家长们一般希望他们的子女得到比他们自己更高程度的教育。即 使教育所开辟的广阔前景实际上是虚幻的,人们仍是把教育视为促进社会变动的 基本手段。 ( 四) 公众选择能力增强 学生及家长逐渐认识到孩子不仅有接受教育的权利,还应有选择接受何种教 育的权利。同时,由择校群体的平民化可以窥见居民收入的普遍提高增强了家长 的择校能力,大中城市越来越多的家庭具有支付择校费的能力,这使择校成为可 能。 山东大学硕士学位论文 综上所述,择校存在深厚的社会历史文化土壤,其症结在于优质教育资源供 不应求:优质教育需求旺盛与优质教育资源短缺之间的激烈矛盾必然存在。择校 的禁而不止充分证实了简单化否定无济于事,必须深入思考择校存在的合理性。 三、“择校生一现象的弊端 “择校生”问题影响了政府的威信,严重地损害了国家政策、法规的严肃性, 影响了教育的均衡。同时,“择校生”现象的盛行阻碍了素质教育的全面推进,学生 选择升学率高者而上,学校面对社会的压力不得不在提高升学率上挖空心思,在 比升学率上暗暗较劲,加重了学生的课业负担。还有,“择校生”现象的存在,让学 生从小体会到了现实中金钱、权力、关系的重要性,这种潜移默化的影响,常常 会使学校教育置于非常尴尬的境地。这种教育中的“反教育”现象应引起我们高度重 视。 但由于各区块的中学在办学能力上不可能完全相同,因此必然会在提供教育 服务的质量和效率等方面有所差异。“择校生”现象会使生源会逐渐向教育质量好的 学校集中,而一些教育质量较差的学校可能会因为生源萎缩而难以为继。而不论 好学校或差学校都是由政府提供资金承办,因此政府将不得不面对“这些薄弱学 校该何去何从 的问题。如果任其关停,则随着时间的推移,本地区的学校数量 会减少,而生源将向剩余的学校集中。一方面剩余的几所学校在接纳全地区的生 源时可能会发生困难。另一方面这些学校最终将垄断本地区的教育资源。在取得 垄断地位后,将很难再通过学校间竞争使学校的教育质量得到提高。此外还会造 成一些没有公办学校的区块内的学生不得不到较远的学校上学。政府如果投资新 办学校,也很难保证新学校的竞争力能与剩下的品牌学校抗衡。如果扩大剩下的 品牌学校的规模,则不可能形成学校间的竞争。但如果不让较差的公办学校关停, 则政府必须在资源扶持上对这些学校有所倾斜。但这些薄弱学校没有了关停的可 能性,就很难有危机感,也就很难有所改进和创新。往往会保持原有的低效状态。 而政府将资源投入这样的学校来维持低效的办学和低水平的教育质量,会无形中 造成资源的浪费。 4 山东人学硕士学位论文 四、国内研究状况 国内对择校原因研究的著述颇多,学者们从不同角度论述了我国现阶段择校问 题出现的原因,主要集中在以下几个方面 1 、办学经费不足。 近年来,随着我国教育事业的发展,教育规模的扩大,人头费的增多,需要政 府增加教育投入。而国家对高等教育的重视程度超过了基础教育,将过多的教育 经费投入到了高等教育领域,在政府无法增加教育投入的情况下,学校发展只能 依靠自己的力量,择校生高收费不失为一条途径,这是造成基础教育阶段收择校 费、自主获得办学经费的一个原因。 2 、对高质量教育的迫切需求。 随着人们物质生活水平的提高。人们把需要中心转移到精神生活中来,于是 人们对教育的期望越来越高,家长“望子成龙的心理越来越热切。他们更倾向 于选择教育质量好的学校,甚至许多工薪阶层的家长不惜“高价”换取对子女“高 质量的教育 。在过去相当长的一段时间里,我国各地区在发展教育的过程中,都 曾集中一定的人力、物力、财力,重点建设和发展一批“重点学校”,客观上造 成这些“重点学校”与其他普通学校,在校舍、教育教学设施、师资、管理等方 面存在很大的差异,加之择校择优选拔、层层淘汰的考试制度,这些学校的生源 质量又高出其他学校一截,由此形成各校发展的极大不平衡,形成了校际间办学 水平的差异。 同时国内学者们对择校现象褒贬不一。针对我国义务教育阶段的择校现象, 学者们的认识也有分歧。支持者们主要从经济学的角度论述了择校的合理性。他 们分别从资源配置、教育需求分析、教育公平角度和教育成本角度分析了择校现 象,得出以下结论:( 1 ) 择校现象从某一方面反映了人们都在争取的优质教育资 源:( 2 ) 择校是在一定条件下通过教育消费对教育产品的一种选择:( 3 ) 择校反 5 山东火学硕士学位论文 映了家长追求高质量教育公平的理想:( 4 ) 许多学者认为教育成本越高,收益越 大。l i 墨d , 健认为,择校应成为我国现阶段教育事业发展的有效选择。因为择校使 学校拥有更多的办学主动权,可以实现效益最大化;有利于降低教育活动中的交 易成本,可以有效促成校间的竞争。还有学者认为,择校不但不牺牲本学区适龄 儿童的受教育权,而且扩大了学校、家长、学生的选择权;以学校差异为基础, 重视个体差异,有利于解决流动子女的就学问题;择校可以通过市场来配置基础 教育资源,有利于资源配置优化,提高公平宇效率。 但也有相当多的学者对择校问题持反对态度。他们主要从教育公平的角度、 从择校造成的教育腐败的角度来论述择校问题。有人认为,目前在我国家长择校 的形式表现为:以分择校、以权择校、以钱择校。其中以权择校、以钱择校是滋 生教育腐败的温床,是极大的不公平;而以成绩择校,则是以牺牲多数人公平的 受教育机会和整个民族素质为代价的,更不可以取。还有人认为,择校阻碍了教 育资源的优化配置,助长了学校的乱收费风气,增加了学校和家长的负担;择校 不但抑制了阶层的流动,而且凝固甚至扩大了阶层之间的差距,是引发社会不公 平、不稳定、不和谐的重要因素之一。 就目前对择校现象的研究来看,其研究成果大多涉及“择校现象 的利弊、 存在的根源及社会背景、影响择校的原因、解决“择校现象”的措施等等。而这 些文章也大多从定性的角度去研究、分析j 表达自己的意见、阐述自己的见解等 等,很少有人从定量的角度通过建立数学模型来研究、分析各种因素对做出“择 校选择的影响。本文正是通过对定量分析得出的结果的研究,做出推断、提出 建议的。 五、本文研究的内容 本文及对影响择校的因素进行了定性的分析,又利用l o g i s t i c 回归模型对影响 择校的因素:学校的办学理念、教学环境( 如学校风气等) 、硬件条件、师资教学 水平、学校收费水平、家庭收入水平、学校声誉文化底蕴、学校升学率、交通安 全等做了定量的分析。主要内如下: 6 山东大学硕+ 学位论文 l 、文章对“择校生 这种现象的普遍性,以及这种现象为社会带来的种种弊 端进行了深入的分析,由此提出研究形象择校的因素的必要性,并对国内目前的 研究现状做了简单的介绍。 2 、介绍了l o g i s t i c 回归模型的基本理论。 3 、利用调查问卷得到的信息,分析了“学校的办学理念、教学环境( 如学校 风气等) 、硬件条件、师资教学水平、学校收费水平、家庭收入水平、学校声誉文 化底蕴、学校升学率、交通安全等 因素在进行学校选择时对选择者的影响。 4 、在简单总结的基础上对解决“择校现象 提出了几点建议。 7 山东大学硕士学位论文 一、l o g i s t i c 函数 第二章理论介绍 2 1 l o g is tic 回归模型 假设有一个理论上存在的连续反应变量只幸代表事件发生的可能性,其值域为 负无穷至正无穷。当该变量的值跨越一个临界点c ( 比如c = 0 ) ,便导致事件发生。 于是有: 当只掌 0 时, 在其他情况下, 咒= 1 , y t = 0 这里,m 是实际观察到的反应变量。以= l 表示事件发生,m = 0 表示事件未发生, 如果假设在反应变量辨幸和自变量t 之间存在一种线性关系,即 y 产= 仅+ p x i + i 由公式2 1 1 ,我们得到 2 1 1 p ( 以2 1 i 薯) = p ( 口+ 蕾+ q ) 0 】 2 1 2 = p 【毛 ( - a 一一) 】 通常,假设公式2 1 1 中误差项g 有l o g i s t i c 分布,由于l o g i s t i c 分布是对称的, 因此公式2 1 2 可以改写为: p ( 乃2 1l _ ) = 尸 ( 口+ 一) 】 2 1 3 = f ( a + 誓) , 其中f 为t 的累积分布函数,当岛为l o g i s t i c 分布,就得到l o g i s t i c 回归模型。 公式2 1 3 可以改写为一个较简单的公式: 8 山东大学硕士学位论文 的,= 1 i ) = p k 烈口+ 觑) 】- 击 2 1 4 这一函数称为l o g i s t i c 函数,它具有s 型的分布。注意在这一图形的左侧,当岛趋 近于负无穷时,l o g i s t i c 函数有 p ( m = 1 = 南 1 1 + e 。 = 0 与此相对,当乞趋近于正无穷时,l o g i s t i c 函数有 p ( 够= ) = 瓦斋 l 1 + e 1 = 1 因此,无论q 取任何值,l o g i s t i c 函数p ( 乃= 1 i x , ) = 再的取值范围均在。 至1 之间。l o g i s t i c 函数的这一性质保证了由l o g i s t i c 模型估计的概率决不会大于i 或小于0 。 二、l o g i s t i c 回归模型 为了根据l o g i s t i c 函数取得l o g i s t i c 回归模型,我们将公式2 1 4 重写为: p ( y t = 1 = 南 2 1 5 其实,这就是当q 取值为位+ 薯) 时的累积分布函数,在这里,q 被定义为一 系列影响事件发生概率的因素的线性函数,即 9 山东大学硕士学位论文 q = 口+ p x , 其中薯为自变量,口和分别为回归截距和回归系数。 2 1 6 将事件发生的条件概率标注为p ( 咒= 1i 誓) = ,我们就能得到下列l o g i s t i c 回 归模型 l 胪矽2 1 7 矿 眠 = 一 1 矿陋 其中,仍为第f 个案例发生事件的概率,它是一个由解释变量葺构成的非线性 函数。然而这个非线性函数可以被转变为线性函数。 首先,定义不发生事件的条件概率为: 9 x l 1 一p 。= l - 壶鬲 2 - 1 8 l = - ,一 。 1 七矿+ 陬。 那么,事件发生概率与事件不发生概率之比为 卫:p ( 口+ 卢而) 1 一p i 2 1 9 这个比被称之为事件的发生比( t h eo d d so f e x p e r i e n c i n ga ne v e n t ) ,简标为o d d s 。 o d d s 一定为正值,因为0 仍 l ,并且没有上界,将o d d s 取自然对数就能够得到 一个线性函数。 1 0 l i l ( 尚) 钳+ 腑 2 1 1 0 山东大学硕十学位论文 公式2 1 1 0 将l o g i s t i c 函数做了自然对数转换,这称为l o g i s t i c 回归模型。 2 2 l o gis t i0 回归模型估计 假设有由n 个案例构成的总体,y l ,y n 从中随机抽取n 个案例作为样本, 观测值标注为y l ,“,y n 设只= p ( y j = l i 薯) 为给定薯的条件下得的结果只= 1 的条 件概率;而在同样条件下得到的结果为m = 0 的条件概率为p ( 只= 0ix i ) = 1 - p ;于 是,得到一个观测值的概率为: p ( y d = 见m ( 1 一b ) 1 , 2 2 1 其中咒= l 或只= 0 式中y j 或( 1 一只) 只是表示对于一个特定观测,哪一项概率是有 关的当以= l 时,尸( 乃) = 只= 尸( m = 1it ) ,否则尸( 咒) = ( 1 一只) = p ( 咒= 0i 薯) 因为 各项观测相互独立,所以它们的联合分布可以表示为各边际分布的乘积: ( 秒) = 兀p y ( 1 - p , ) 1 。刖 2 2 2 式中2 2 2 也称为n 个观测的似然函数,其中b2 i e i - 丽r 。我们的目地是 求出能够使这一似然函数的值最大的参数估计,这就是说,最大似然估计就是求 解出具有最大可能取得所给定的样本观测数据的参数估计,于是,最大似然估计 的关键是估计出参数q 和b 的值,并通过它们使式2 2 2 取得最大值,然而,使 似然函数l ( 0 ) 最大化的实际过程是非常困难的,一般是通过使用似然函数的自 然对数变换式( 即l n l ( o ) 】) 最大的方法,而不是直接对似然函数本身求最大,因 为l n l ( o ) 是l ( o ) 的单调函数,使t r i l l ( o ) 取得最大值的0 值同样使l ( o ) 取得最大 值,通过分析l n l ( o ) 】,式2 2 2 中相乘各项转变为对数项的相加,于是使得数学 运算变得较为容易,以式i n ( l ) = 口+ t 2 1 1 0 作业示范,其l o g i s t i c 回 l p i 归模型的对数似然值为: 山东人学硕士学位论文 l i l 三( 乡) 】= l n 兀b 乃( 1 - p i ) 1 。所】 = 【此h l ( 肛) + ( 1 一y , ) l n o b ) 】 2 善n 加( 尚灿( 1 - 酬i ;1j h = 枷州班蚺南】 = 和( 州咿l n ( 1 + 蔫) 】 2 2 3 式2 2 3 称为对数似然函数,为了估计能使h l 陋( 护) 】最大的总体参数q 和b 值, 先分别对q 和1 3 求偏导数,然后令它等于0 : 1 0 l n l f ( o ) = 扣一筹】, 2 2 4 百o l n l ( o ) = 轴一篙k 2 2 5 式2 2 4 和式2 2 5 称为似然方程。 由式2 2 4 和2 2 5 提供的q 和6 值估计称为l o g i s t i c 模型最大似然估计。 2 3l o gis tic 回归模型评价 2 3 1 l o g i s t i c 回归模的型的拟合优度 一、偏差 1 2 观测值与预测值的比较可以根据对数似然函数表示,以t 作为设定模型所估 山东大学硕士学位论文 计的最大似然值。饱和模型的最大似然值被标注为t ,饱和模型并不能提供比实 际观测更多的概率统计,然而,通过比较丘与i ,便可以估价所设模型代表数据 的充分程度。 通常采用2 乘以设定模型和饱和模型之间最大似数值之比的对数: 。= _ 2 l i l ( 夸2 2 ( 1 n 厶一l i l t ) 2 3 1 1 在公式2 3 1 1 的括号中的数量就是似然比( 1 i k e l i h o o dr a t i o ,记为l r ) 。 - 2 乘以似然比l r 的自然对数形成一个统计量,当样本规模足够大时,它服从z 2 分布,其自由度等于所谓模型中协变类型个数减去系数个数所得之差,d 统计量 被称为偏差( d e v i a n c e ) ,通过似然函数测量所设模型与饱和模型之间的差异程度 当三,值相对于,值较小时,就会有较大的d 值,表示所设模型拟合很差,与此相 反,当三。值近似于三,值时,d 值就会很小,表示所设模型拟合很好。由于饱和模 型的似然函数代表了完美拟合,而d 统计量,即设定模型与饱和模型的似然函数 之差,就可以视为类似于线性回归中的残差平方或误差平方和。 当在建立模型中涉及连续型自变量时,d 统计量不适合用来检验模型拟合优 度,因为这时有些协变量( 即连续型自变量) 有过多的不同值,导致大量的协变 类型存在,在样本规模固定为刀时,大量的协变类型意味着每种协变类型中只能有 少数案体。 二、h o s m e r - l e m e s h o w 拟合优度指标 当自变量数量增加时,尤其是连续自变量纳入模型之后,协变类型的数量便会 很大,于是许多协变类型只有很少的观测案例,结果,指标d 不再适用于估价拟 合优度,h o s m e r 和l e m e s h o w ( 1 9 8 9 ) 研制了一种对l o g i s t i c 回归模型拟合优度的 检验方法。这种检验根据预测概率值将数据分成大致相同规模的1 0 个组,而不管 1 3 山东大学硕士学位论文 模型中有多少协变类型,将观测数据按其预测概率做升序排列,第一组包括估计 概率最小的那些观测案例,而最后一组包括估计概率最大的那些观测案例。 h o s m e r - l e m e s h o w 指标( 记为h l ) 可以从观测频数和预测频数构成的2 xg 交 互表中求得,其统计公式如下: 舭= 符刀( g y 以g - ( 1 n g p 乓g ) 了 2 3 1 2 其中g 代表分组数,且g 耋1 0 :唿为第g 组中的案例数,为第g 组事件的观测 数量:户g 为第g 组的预测事件概率;以为事件的预测数,实际上它等于第g 组 的预测概率之和。 通过皮尔逊z 2 来概括这些分组中事件结果的观测数和预测数,然而将其与自 由度为g 2 的z 2 分布进行比较,z 2 检验不显著表示模型拟合数据,相反,z 2 值 统计显著表示拟合不好。 三、信息测量指标( i n f o r m a ti o nm e a s u r e s ) 另一种估价l o g i s t i c 回归模型的拟合优度的指标是信息测量类的指标,这些指 标也可以用来比较不同模型的优劣。其中一种著名的信息测量指标是a k a i k e 信息 标准记为a i c 。 a c = (- 2 l l s + 2 ( k + s ) ) 以 2 3 1 3 其中k 为模型中自变量的数目;s 为反应变量类别总数减l ( 对于l o g i s t i c 回 归有s = 2 1 = 1 ) :n 是观测数量;三厶是所设模型的估计最大似然值的自然对数,其 值较大表示拟合较好。- 2 l t , 的值域为0 至佃,其值越小说明拟合越好。 1 4 在其他条件不变的情况下,较小的a i c 值表示拟合模型较好,a i c 指标还常 山东大学硕士学位论文 常应用于比较不同样本的模型,或应用于比较非嵌套关系的模型,而这些模型的 比较不能采用似然比( l r ) 检验。 另一种信息指标是s c 。s c 指标是对a i c 指标的一种修正,s c 指标的定义为: s c = 2 l + ( k + s ) i n ( n ) 2 3 1 4 其中i n ( n ) 是观测数量的自然对数。尽管通过在公式2 3 4 中,加入i n ( n ) 项,在某种程序上对观测数量变化的影响进行了调整,s c 仍然不是每个观测对调 整的一2 三丘所做贡献的测量,所以,这指标也只能用于比较对同一数据所设的不 同模型( s a si n s t i t u t e ) 。 在其他条件相同时,一个模型的a i c 或s c 值越小说明模型拟合越好。 还有一种使用得越来越多的信息指标,就是贝叶斯信息标准记为b i c ,b i c 有 两种不同的类型,在假设所设模型是与饱和模型相比较时,第一种b i c 指标定义 为: b i c = - 2 三厶一d 厂,l n ( n ) , 2 3 1 5 其中,_ 2 上丘是一2 乘以所设模型的对数似然值;d f 。为模型的自由度,它等于 样本规模与模型估计系数数目之差( 即d f 。= r l - - k 一1 ) ;l n ( n ) 为样本规模总数的 自然对数。 另一种b i c 指标用来对所设模型与零假设模型( n u l lm o d e l ,即只包含常数项的 模型) 进行比较。其统计公式为: b i c t = 一g s + d f :s x i n ( n ) , 2 3 1 6 其中d f :为自变量数目( 即k ) ,而g 为一2 乘以所设模型与零假设模型之间的 最大似然比之差的对数,即: 1 5 山东大学硕士学位论文 g = - 2 l g - ( 一2 地)。2 317 = 2 l g 一2 l g 与a i c 和s c 一样,在其他条件相同时,具有最小b i c 或b c 7 值的模型最好。 2 3 2 l o g is ti c 回归模型的预测准确性 对l o g i s t i c 回归模型的另一种评价是模型的预测准确性。通常有三种不同的 方法服务于这一目的 一、类r 2 指标( a n a i o g o u s r 2 ) 线性回归中的r 2 有一种十分诱人的解释特性,即它描述因变量的变动中由模 型的自变量所“解释”的百分比。但是,在l o g i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国银行2025滨州市秋招笔试英语题专练及答案
- 交通银行2025山南市秋招笔试专业知识题专练及答案
- 工商银行2025西安市秋招笔试EPI能力测试题专练及答案
- 建设银行2025驻马店市秋招半结构化面试题库及参考答案
- 2025行业数字化转型成功案例研究
- 工商银行2025吉林市结构化面试15问及话术
- 邮储银行2025海西蒙古族藏族自治州秋招结构化面试经典题及参考答案
- 有色金属中间产品供需服务合同2篇
- 建设银行2025神农架林区秋招笔试综合模拟题库及答案
- 邮储银行2025毕节市金融科技岗笔试题及答案
- 2025中交安全考试题库及答案
- 教科版(2024)科学一年级上册教学计划(全册)
- 炉渣综合利用项目可行性研究报告立项申请报告范文
- 廉政协议合同协议
- 加油站安全生产规章制度与岗位操作规程全套
- 运动生理学知到课后答案智慧树章节测试答案2025年春湖南师范大学
- 第四代住宅白皮书-HZS
- 工业机器人操作与编程实训任务题库参考答案
- TCCTAS 162-2024 公路中央分隔带组合型波形梁护栏技术规程
- 商场全套安全生产管理制度
- 《教育系统重大事故隐患判定指南》知识培训(三)
评论
0/150
提交评论