




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
判别分析和 归在图书馆满意度方面的应用 华南农业大学 摘 要 高等学校图书馆是学校的文献信息中心, 是为教学和科研服务的学术性机构,是学校信息化和社会信息化的重要基地,是学生学习和思想交流的重要途径部分。 它的建设和发展应与学校的建设与发展相适应,其利用率直接影响学校总体水平。 本文 利用判别分析方法和多分类 研究判别分析和 较两种方法对于研究图书馆满意度的效果,分析各等级满意度人 数,结果显示持“一般满意”的人数最多,而用上述两种方法对这个类别准确判别率也最高。通过使用统计软件是 逐步回归法消除特征变量间的共线性以及剔除不显著的特征变量,再利用对满意度影响显著的变量建立类别函数,确定 372个样本的回判类别和另外 50个样本的预测检验类别并与实际类别进行比较。采用不同的临界值对图书馆平均满意度进行分类 果显示: ,而判别分析有较高的外推样本预测准确率( 54%) 五入的方法对观测数据分类,结果显示判别分析方法的回判正确率有了提高( ,而 也反映了 本文的创新之处:判别分析和 在问卷调查方面的应用较少,本文采用这两种方法分析读者对图书馆的满意度,并对这两种方法进行了比较 分析 。 数据来源:管理统计学应用与实践(李金林和马宝龙编著)中的某大学图书馆使用情况中部分 问卷 数据( 428个)。 关键字 :判别分析 多类别 图书馆满意度 目录 1 问题描述 . 1 2 数据描述 . 2 据预处理 . 2 据描述 . 2 3 多类别 归 . 2 本原理 . 2 析过程与结果 . 4 书馆满意度影响因素的方差分析 . 4 书馆满意度影响因素的回归模型 . 5 4 判别分析 . 7 别分析基本原理 . 7 型的处理 . 11 别函数的确定 . 13 测检验 . 14 5 模型比较 . 15 6 模型的改进 . 16 7 结论与建议 . 17 附录 . 18 参考文献 . 18 1 1 问题描述 在高校图书馆的读者类型中 ,大学生是一种主要类型。图书馆作为第二课堂 ,对大学生具有重要的地位和作 用。他们除了在教室接受系统的知识外 ,将更多的时间运用到利用图书馆丰富的文献资源之中 ,他们在书海中吸取知识的养料 ,在网络上驰骋信息的疆场。他们阅读范围广泛 ,对文献内容有着明确的要求 ,阅读层次和水平较高 ,同时也注重外来文化的吸收。开展大学生对图书馆评价的研究 ,对于更好地改进文献收集与管理工作 ,进一步为大学生读者创造良好阅读环境和条件 ,吸收大学生读者利用图书馆 ,使图书馆真正成为对大学生进行智力开发和人才培养的第二课堂都具有重要意义。 本文主要考查的是读者对于图书馆的满意度,从图书馆角度看,考虑的因素包括工 作人员的素质,图书馆硬件设备,图书馆资源设备,图书馆提供的便利性服务,借阅制度,由于不同的读者 对图书馆满意度有不同看法 ; 因此, 从读者本身角度看,考虑的因素包括学生年级、性别、学科、到馆访问次数、网上访问次数、到馆目的(查阅资料,使用电子阅览室,上自习,消遣)。使用逐步判别的方法对变量进行筛选,最终获得影响图书馆满意度的因素有工作人员的素质,图书馆硬件设备,图书馆资源设备,借阅制度四个因素 ,而使用 归判别得到的变量为到馆访问次数、 工作人员的素质 、 图书馆硬件设备 、 图书馆资源设备 、 图书馆提供的便利 性服务 、 借阅制度 。 图书馆满意度测评的本质是一个定量分析的过程,即用数字去反映读者对图书馆态度或看法,因此对测评指标进行量化至关重要。读者满意与不满意是针对某特定时间的特定事件而言,满意与不满意程度的区分,决定了读者满意的等级。 参照企业顾客满意度测评中常用的 5 级李克特量表,读者满意程度可划分为 非常 满意、满意、一般满意、不满意、 非常 不满意五个等级 , 从图书馆角度看, 就工作人员的素质,图书馆硬件设备,图书馆资源设备,图书馆提供的便利性服务,借阅制度对 图书馆 满意度 进行考察 , 针对每个因素,提出 5到 6个问题,得到各因素的平均满意度。 2 2 数据描述 据预处理 总的样本数据为 428 个。 训练样本数据总数是 378 组,由于有缺失值,先将各样本中缺失值较多的样本删除,再使用平均值估计法填补剩下的缺失值。最终得到训练样本数据 372 组。 预测样本数据为 50 个。 据描述 对于工作人员的素质,图书馆硬件设备,图书馆资源设备,图书馆提供的便利性服务以及整体满意度都给出的是平均满意度值, 下面先对整体满意度向上取整,得到 图书馆满意度得 5 个类别“非常不满意”、“不满意”、“一般”、“满意”、“非常满意” , 所占样本比例分别为 样本中,大一学生占 大二占 大三占 大四占 博士生占 女性占 男性占 理科生占 文科占 经济占 管理占 艺术占 到馆访问次数每月小于 1 次的占 1占 6占 大于 15 次占 网上访问每月小于 1 次占 1占 6占 大于 15 次占 去图书馆查阅资料的占 使用电子阅览室的占 在图书馆上自习的占 消遣的占 样本中还包含学生对图书馆的 工作人员素质、硬件设备、资源配置、便利性服 务 、借阅制度 几个方面的满意度平均值 。 3 多类别 归 本 原理 多类别 型对于多类别选择问题,即离散因变量 Y 有两个以上的选择类别,可建立多类别 对于非排序选择问题,通常用基准类别 设离散因变量 Y 有 r 类可能结果,令 ,2,1 代表 r 个不同的结果类别,3 各类结果之间相互独立,不存在等级排序关系,定义 代表个体 i 选择结果j ,则个体 i 的可能选择 ),2,1(),( 21 ; ),( 21 为 k 个影响因变量选择结果的自变量;定义 为个体 i 选择结果 j 的概率,即)( ,则个体 i 做出各类选择的概率 ),( 21 , 11 rj 。以 *j 作为基准类别,可定义 1r 个机会比的自然对数 ),1(lo g* ,引入自变量 X ,则可得基准类别 型如下: *lo g ),1( * ( 3 式中, ),( 21 , ,2,1 , n 为样本容量, k 为自变量个数; ,( 21 , ,2,1 , r 为离散因变量结果分类的个数。 可见,模型( 3包括 1r 个方程,有 )1()1( 待估参数。与模型( 3价的是各类结果出现的概率函数,当 j 为非基准类别,即 *时, *)()(1( 3 当 j 为基准类别,即 *时, * )(11( 3 模型( 3 ( 3等价的,同样可以用最大似然估计法进行参数估计,通过 )1,1( 的联合概率函数导出似然函数: (1 1 ( 3 其中, 1如果个体 i 选择结果 j ;反之, 0把( 3和( 34 代入( 3并取对数得对数似然函数 ( ,再通过对数 似然函数最大化的一阶条件求解模型参数。 模型( 3参数 表示当其它自变量保持不变时,自变量 变化一个单位,个体 i 的选择落入第 j 类的概率对比落入第 *j 类的概率得到的机会比对数( 化 个单位。 对于基准类别( 型而言,任可一个类别都可被选作基准类别,不会影响模型的拟合,只是式( 3参数估计值及其解释发生变化,模型的对数似然函数值和因变量各个类别的概率预测值都不会改变。 基准类别( 过式( 3以求个体 i 的选择落入任意两个类别的机会比对数( 如要求结果 j 对比结果m 的机会比对数,有 *lo )()( ),1,( * ( 3 析过程与结果 书馆满意度影响因素的方差分析 对所有变量进行卡方分析,按 p 值最大逐个剔除对图书馆满意度影响不显著的变量,结果表明年级、性别、学科、网上访问次数、是否查阅资料、是否使用电子阅览室、是否为上自习、是否为消遣对图书馆满意度的影响不显著,到馆访问次数、工作人员素质、硬件设备、资源配置、便利性服务、借阅制度对图书馆满意度的影响显 著。 最终模型的 卡方分析结果如下表所示 : 5 表 1 最终模型卡方分析结果 000 0 . 工作人员素质 件设备 源配置 利性服务 阅制度 馆访问 2 图书 馆满意度影响因素的回归模型 型的拟合结果 在 件中,选择 进入 话框,将总体满意度移入 ,将到馆访问移入 ,将 工作人员素质、硬件设备、资源配置、便利性服务、借阅制度移入 ,选择 击 到回归结果。 模型的拟合结果显示,仅有常数项的无效模型与最终模型的 著差异( p=受 原 假設, 满足 等方差协方差结构 ,符合判別分析的假定 。 12 图 1 对图书馆 非常不满意的人数分布 图 2 对图书馆不满意的人数分布 210 非 常不满意非常不满意10420 不 满意不满意 对图书馆满意度一般的人数分布 图 4对图书馆满意的人数分布 3210420 一 般一般43210210 满 意满意 图书馆 非常满意 的 人数 分布 图 6 图书馆总体满意度的分布 3210 非 常满意非常满意420420面的五幅图给出了每种满意度人数的分布情况,从图中我们可以看出, 读者 对图书馆的满意度集中在不满意、满意和一般三种情况,两个极端值的选择人数较少。最后一 幅图给出了五种类别满意度合在一起时的分布区域,从图中可以看出五种类别分布情况区分度不明显,不满意、一般、满意三种状态分别处于图中的左、中、右三个区域,但分界线不明显,有交集。 这可能会造成分类结果可靠性降低 。 别函数的确定 表 4 体满意度 非常不满意 不满意 一般 满意 非常满意 工作人员素质 件设备 源配置 阅制度 s ( 1 ) 2 . 1 4 6 * 4 . 6 9 4 * 3 . 5 9 8 * 2 . 4 5 5 1 7 . 4 4 2F 工 作 人 员 素 质 硬 件 设 备 资 源 配 置 借 阅 制 度( 2 ) 3 . 1 2 4 * 5 . 8 6 3 + 5 . 0 1 6 * + 3 . 5 1 6 * 2 6 . 7 7F 工 作 人 员 素 质 硬 件 设 备 资 源 配 置 借 阅 制 度( 3 ) 3 . 6 6 7 * + 6 . 8 6 8 * + 5 . 9 0 2 * 4 . 0 2 9 3 5 . 1 5 1F 工 作 人 员 素 质 硬 件 设 备 资 源 配 置 借 阅 制 度( 4 ) 4 . 3 1 3 * 6 . 8 7 2 * 7 . 5 4 7 * 4 . 7 4 1 * 4 6 . 2 1 8F 工 作 人 员 素 质 硬 件 设 备 资 源 配 置 借 阅 制 度( 5 ) 5 . 2 2 5 * 7 . 2 9 * 6 . 6 5 4 * 5 . 4 3 * 5 2 . 7 9 7F 工 作 人 员 素 质 硬 件 设 备 资 源 配 置 借 阅 制 度使用上述分类的 入 各 判别变量原始观测数据,计算得到判别分数,下面给出四个变量的分类 小结:14 上图表明,非常不满意的读者( 1类)共有 10个,用判别函数回带分类,与实际相符的有 5个, 1类的准确率为 50%。不满意的人数共有 78人,用判别函数回带分类,与实际相符的有 36个, 2类的准确率为 46%。一般满意 的人数共有 176人,用判别函数回带分类,与实际相符的有 130个 , 3类的准确率为 74%。 满意的人数共有 96人,用判别函数回带分类,与实际相符的有 58个, 4类的准确率为 60%。非常 满意的人数共有 12人,用判别函数回带分类,与实际相符的有 0个, 5类的准确率为 0%,正确率最低。总体准确率为 测检验 使 用分类判别函数预测分类 pi )()(0( 表 7 分类判别函数预测分类结果(预测总样品数为 50个) 类别 观测类别数 正确预测类别数 错判率 1 0 2 9 3 67% 3 20 14 30% 4 18 10 44% 5 3 0 100% 总的正确预测的概率为 54%。 15 5 模型比较 使用 外推样本预测准确率为 48%。而使用判别分析对训练样本的判别正确率为 外推样本预测准确率为 54%. 表 8 判别分析与 72次回判检验 类别 观测类别数 正确预测类别数 准确率 非常不满意 10 (3, 8) (30%, 80%) 不满意 78 (33,40) (42%, 51%) 一般 176 (140,135) (80%, 77%) 满意 96 (57,62) (60%, 65%) 非常满意 12 (0,1) (0%, 8%) 两种分析方法得到的结果中,对于类别 3(一般) 拟合程度比较准确,达到了 80%左右,而这部分人占了样本的绝大多数 ( 176人) , 而类别 1(非常不满意)只有 10人,类别 2( 78人),类别 4( 96人),类别 5( 12人),结果显示: 各 类别中,样本量越大,回判准确率越高, 说明 各 类别样本量足够大的话,是可以较准确地分辨读者对图书馆的满意度的 。 为除了 类别 3(一般)之外,回判结果都比判别分析要准确。 表 9 判别分析与 0次预测检验 类别 观测类别数 正确预测类别数 准确率 非常不满意 0 不满意 9, 9 ( 4, 1) ( 44%, 11%) 一般 20 ( 13, 14) ( 65%, 70%) 满意 18 ( 11, 10) ( 61%, 56%) 非常满意 3 ( 0, 0) ( 0%, 0%) 两种分析方法得到的结果中,对于类别 3(一般) 拟合程度比较准确,达到了 65%以上,但预测检验的准确率比回判准确率低,说明 在 读者对图书馆满 意度16 分类这个问题中,考虑的分类因素还不 够 多, 还 有一些影响 读者满意度的重要因素没有考虑进去, 对读者满意度进行 预测 分类结果显示:各类别中,样本量越大,预测 准确率越高,说明 各 类别样本量足够大的话,是可以较准确地 预测 读者对图书馆的满意度的。 从预测检验结果可以看出,用判别分析 得 到的结果整体而言更加准确,因为除了类别 3(一般)以外,预测结果都比 准确。 由于判别分析主要是通过 考虑 影响事物的因素来判别事物所属的类别,因此在外推预测方面有较好的判别分类效果。 归 与 多重线性回归 有很多相同之处,最大的区别就在于他们的因变量不同,其他的基本都差不多,归于同一个家族,即广义线性模型。这一家族中的模型形式基本上都差不多,不同的就是因变量不同,如果是连续的,就是多重线性回归,如果是二项分布,就是 归 。 因此,属于广义线性模型的 归一般都是用于内推预测,此时误差较小,当用于外推预测时,效果不理想。 6 模型的改进 对图书馆整体平均满意度进行四舍五 入得到 4 个类别为: “不满意”、“一般”、“满意”、“非常满意” ,使用判别分析分组所得结果为: 表 10 a) 总体满意度 3 4 5 2 11 16 1 0 28 3 1 119 40 0 160 4 0 33 113 6 152 5 0 1 22 15 38 % 2 0 0 00.0 a of 17 回判率提高到了 68%。而用 只是稍微改变了一下 类别的分界值,就使得判别分析结果发生了 较 大变化,而 变 , 说明 类结果更加稳定。 很多应用例子显示, 判正确率优于判别分析,而图书馆满意度分析也证明了这一现象的存在 。 在判别预测问题上,无论用哪种判别方法对样本进行分类,均不会永远做出正确的判断,因为所采用的训练样本总是有局限性的,不能完全准确地反映总体信息,所以依据训练样本得出的判别准则会有一定缺陷。判别分类准确度的提高是一个综合的过程 ,首先要保证训练样本的代表性,训练样本应最大限度的代表总体情况,才能保证判别的效果, 从各类别样本的分布情况来看,中间多,两边少,分布还是较为合 理的。 其次是指标的选择,可通过经验或其他筛选标准选出对被判对象影响较大的因素,在此基础上建立方程,增加判别函数的稳定性,提高判别效果 ,而本文所采用的数据由于考虑的重要因素还不够多,导致判别效果不尽如意 ;最后是根据资料的类型选择合适的判别方法。 如 果判别方法选择不对,则会大大降低判别的准确率 , 本文选择的判别分析和 归方法拟合效果都在 65%左右,相差不大,说明模型还可以优化。 应用 保证训练样本代表性的基 础上,用逐步回归方法对变量进行筛选,挑选出对因变量作用较大的自变量建立回归方程,通过组内回带、组外考核和拟合优度检验等方法检验判别效果。 7 结论与建议 对图书馆总体感觉 “ 一般 ” 及 “ 满意以上 ” 的同学占 说明大部分同学对图书馆比较满意。其中对工作人员素质的满意度为 硬件设备的满意度为 资源配置的满意度为 便利性服务的满意度为 借阅制度的满意度为 从结论可看出,工作人员的满意度最低,建议图书馆的工作人员应该在提高工作热情、仪表整洁、行为举止文明得 体、以正确的态度接受读者提出的批评和建议方面 等 多多加强。 18 同学们对图书馆的硬件设备最为满意,说明图书馆在提供良好读书学习环境上做得不错,希望继续保持。 在资源配置方面,同学们较为满意,建议图书馆及时更新印刷版及电子版的资源,使学生能及时获取最新的消息。 在便利性服务方面,满意度仅高于对工作人员素质的满意度,建议图书馆多开设一些有用的培训讲座或课程,加强图书馆网页的建设使之能提供更多更方便更快
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025小鸭苗买卖服务合同
- 智能手机在传染病防控中的应用指南
- 骨科亮点护理实践体系
- 青年医学教师授课比赛实施要点
- 人教版小学一年级语文上册第八单元测试题
- 造口疝气规范化护理要点
- 二手房交易方式之委托交易
- 学校下学期质量管理工作总结模版
- 2024年09月26日更新【Attest】2024年美国媒体使用报告
- 服装合作协议书
- 钢结构机电工程施工方案
- 基于计算思维培养的小学人工智能启蒙教育课程设计与实施
- 机电安装工程总承包合同
- 湘教版四年级下册科学各单元知识点复习
- 课件-2025年春季学期 形势与政策 第一讲-加快建设社会主义文化强国9
- 2025年度江西抚州高新区区属国企业公开招聘纪检监察工作人员10人高频重点模拟试卷提升(共500题附带答案详解)
- 汽车租赁挂靠协议书
- 北京市历年中考语文现代文阅读之非连续性文本阅读8篇(截至2024年)
- 公司内部文件管理规定及办法
- 公开征集招标代理机构投标方案(技术方案)
- 信息系统安全等级保护等级测评报告模板【等保2.0】
评论
0/150
提交评论