数学建模 出版社的资源配置 (二)_第1页
数学建模 出版社的资源配置 (二)_第2页
数学建模 出版社的资源配置 (二)_第3页
数学建模 出版社的资源配置 (二)_第4页
数学建模 出版社的资源配置 (二)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

A题:出版社的资源配置

摘要

本文先根据A出版社所掌握的一些数据资料进行分析,建立基于主成分分析法的综

合评价模型,对该出版社关注的各门课程的强势情况进行综合评价;然后建立整数规划

模型确定各课程的书号分配方案;再用蒙特卡罗方法对模型进行了计算机模拟检验;最

后向出版社提供了有益的建议。

首先,对附件二进行数据分析。数据分析过程包括两个步骤:1、用克朗巴哈。信

度系数法对附件二给出的五年的调查问卷进行了信度分析,通过SPSS统计软件的信度

分析得到的c值证实了所有调查问卷的信息都是可靠的;2、通过对问题和数据的分析,

先确定影响2006年A出版社对所关注的72门课程的书号分配的四个指标:各门课程每

年在市场的占有比例、A出版社每年出版的教材中各门课程所占的比例、读者对A出版

社各课程的满意度、A出版社每年各课程的销售量的计划准确度,再用Excel对附件二、

三所给的数据信息进行统计筛选、归类分析和计算,得出过去五年中各门课程每年在市

场的占有比例(见附表1)、A出版社每年出版的教材中各门课程所占的比例(见附表2

及各门课程每年的销售计划准确度(见附表3)。

接卜来,对各门课程强势情况进行评价,并确定对各门课程的单位书号分配权重。

大致分为三个步骤:1、建立模糊综合评价模型确定每年读者对A出版社各门课程的评

价分数;2、考虑到只有五年数据,规律性不强,建立经典模型对2006年各门

课程的四个指标进行预测,得到2006年的各个指标的预测值;3、建立基于主成分分析

法的综合评价模型,对这四个指标进行主成分分析,选取主成分,并把主成分按照方差

贡献率加权求和,得出A出版社各课程强势大小的综合评价指数,再将各课程的综合评

价指数归一化得到了对各门课程的单位书号大致分配权重。

然后,预测各课程单位书号的销售量。同样地,考虑到只有五年数据,波动性较大,

规律性不强,建立模型对01-06年销售量进行预测,但是通过误差分析发现数

据的预测精度不是很高,为了提高精度,建立了时序残差模型进行改进求解,

对比的预测结果发现精度大大提高(见图2),最后得到了06年各课程单位书

号的销售量(详见正文表10)。

接着,确定对各门课程的书号分配方案。首先建立以单位分配权重均值(1/72)为

限的区分强势和弱势产品的准则,将单位分配权重低于均值的作为弱势产品,其分配方

案为其申请书号数的一半°然后建立整数规划模型求解强势产品的书号分配方案,以经

济效益最大为目标函数,考虑人力资源限制、各门课程在分配了一半基础上进行,引入

强势产品的分配权重(单位分配权重乘以申请书号数再进行归一化得到的权重)作为大

致分配比例,运用Lingo求解得到A出版社06年的最大销售额为2231.9(万元),各分

社书号分配方案按照类别顺序依次为:(84,38,120,102,46,35,22,31,22),各分社的相

关课程书号分配方案(详见正文表13)。

为了检验最大销售额的合理性,用蒙特卡罗方法模拟94.3958万顾客实际选购教材

的情况,让顾客依据教材的质量和出版社的信誉度等综合因素做出选择,然后统计计算

得出其销售额。计算机模拟10次得到的平均值为2280.0(万元),相对误差为2.11%,

在允许范围内。因此计算机模拟可以进一步验证了优化模型及求解的合理性。

最后,根据对出版社所给数据的分析及建模求解的结果向出版社提供了一些有益的

建议。

关键字:模型时序残差单位书号分配权重主成分分析蒙特卡罗方法

1问题重述

出版社的资源主要包括人力资源、生产资源、资金和管理资源等,它们都捆绑在书

号上,经过各个部门的运作,形成成本(策划成本、编辑成本、生产成本、库存成本、

销售成本、财务与管理成本等)和利润。

某个以教材类出版物为主的出版社,总社领导每年需要针对分社提交的生产计划申

请书、人力资源情况以及市场信息分析,将总量一定的书号数合理地分配给各个分社,

使出版的教材产生最好的经济效益。事实上,由于各个分社提交的需求书号总量远大于

总社的书号总量,因此总社一般以增加强势产品支持力度的原则优化资源配置。资源配

置完成后,各个分社(分社以学科划分)根据分配到的书号数量,再重新对学科所属每

个课程做出出版计划,付诸实施。

资源配置是总社每年进行的重要决策,直接关系到出版社的当年经济效益和长远发

展战略。由于市场信息(主要是需求与竞争力)通常是不完全的,企业自身的数据收集

和积累也不足,这种情况下的决策问题在我国企业中是普遍存在的。

本题附录中给出了该出版社所掌握的一些数据资料,让我们根据这些数据资料,利

用数学建模的方法,考虑以下问题:

(1)在信息不足的条件下提出以量化分析为基础的资源(书号)配置方法

(2)给出一个明确的分配方案

(3)给出版社提供有益的建议。

2问题假设

(1)、所给的数据资料能够概括出近五年的高校图I弓市场规律,并且调查问卷中除了评

价教材的信息(因为是主观评价),其他信息均认为是真实可靠的。

(2)、仅考虑书号的分配,不考虑出版社的人力资源、生产资源、资金和管理资源等,

因为它们都捆绑在书号,可以直接用书号来衡量。

(3)、只考虑A出版社所关注的72门课程的书号分配

(4)、各门课程的教材的实际销售量与当年的实际分配书号具有相关性;

(5)、认为2006年各门课程的教材价格保持不变,取各自的平均值;考虑人力资源约束

时,A出版社各分社的每个部门的人数取历年均值。

3符号说明

C:表示克朗巴哈信度系数,^€[0,1];

K:表示在进行模糊综合评价的时候的模糊关系矩阵;

x⑼⑴:表示用GM(1,1)模型预测时原始数据序列;

”⑴:表示用GM(1,1)模型预测时原始数据累加得到的数据序列;

?%(/):表示用时序残差GM(1,1)模型预测时原始数据序列;

x⑴,⑴:表示用时序残差GM(1,1)模型预测时原始数据累加得到的数据序列;

V:表示主成分分析中标准化数据的协方差矩阵;

A:表示主成分分析中各个成分的特征值,i=l,2,3,4;

3”表示衡量各课程强势情况的四个指标;i=l,2,3,4o

Z:表示第i门课程第k个主成分的得分;i=l,2,3,...,72。

巴:表示第i门课程综合得分;

2,:表示第i个主成分各个指标此的线性组合:

4:表示A出版社各课程一年的申请书号数,i=l,2,3,...,72;

士:表示A出版社分配给第i门课程的书号数,i=l,2,3,...,72;

p/表示A出版社第i门课程的教材的价格,i=1,2,3,...,72;

小表示A出版社第i门课程单位书号的实际销量,i=l,2,3,...,72;

吗:表示A出版社第i门课程分配书号的权重,i=l,2,3,,72;

表示A出版社第i门课程单位书号分配的权重,i=l,2,3,...,72;

生:表示A出版社各分社一年能完成的最大书号数,i=l,2,3,...,9;

L:总销售额。

4问题分析

下面先对几个我们自定义的名词进行说明,然后对问题进行总的分析,最后具体分

析我们解题的思路。

4.1名词解释

4.1.1销售量的计划准确度

就是用每一年的实际销售量除以计划销售量,这个准确度反映了它对应的课程的教

材落实程度,准确度越大,说明该课程申请的书号数可信度越高,分配书号的时候就应

该尽量满足该课程申请的竹号数:

4.1.2单位书号分配权重

所谓单位书号分配权重,就是通过主成分分析综合评价预测出来的权重,它表示当

只有一个书号的时候,分给各门课程的权重大小。

4.2总的分析

考虑到调查表中给的信息非常复杂而且数据量特别大,所以首先应该根据附表中的

数据,分析哪些是影响资源配置(即总社如何分配书号数)重要指标,并且分析这些指

标在2001-2005年的情况;接着根据五年的历史数据,建立适当的数学模型预测2006

年各个指标的情况;然后找一个综合评价方法去分析这些指标如何综合影响资源配置,

并且给出综合得到的权重,这样就得到了哪种教材在市场上有比较强的优势(即强势产

品):最后,在人力约束、图书价格和其他一些约束条件下,按照优先支持强势产品的

原则给出明确的分配方案C

4.3具体分析

4.3.1对历史数据的分析

题中给出了五年来的对读者的问卷调查表和其他一些历史数据,我们运用Excel对

这些数据进行分析,发现里面有些数据并不是我们需要的(或者说对求解本问题的影响

不是很大),但是有一些数据很大程度上影响书号数的分配。经过筛选,我们最终提取

四个重要指标作为资源配置的依据。这四个指标分别是:a、各门课程的教材在整个市

场占有率,b、各门课程的教材在A出版社中的市场占有率,c、读者对各门课程的满

意度,d、各门课程销售量的计划准确度。下面逐条分析为什么以这些指标作为资源配

置的依据以及如何求出这些指标。

a:各门课程的教材在整个市场的占有率能够反映出它的市场需求(也隐含了销售

量的大小),同时也能够在一定程度上说明它的市场竞争力;求解的方法就是道过对历

年销售情况进行统计求比例。

b:各门课程的教材在A出版社中的占有率能够反映出它是否是A出版科的强势产

品;求解方法跟求解a的一样。

c:读者对各门课程的教材的评价得分能够反映它的市场竞争力;考虑读者对教材

的评价是具有模糊性,所以建立模糊评价方法来评价来求解这个指标。

d:这里的计划准确度是用实际销售量除以计划销售量来衡量的。准确度反映了它

对应的课程的教材落实程度,准确度越大,说明该课程申请的竹号数可信度越高,分配

书号的时候就应该尽量满足该课程申请的书号数;而且说明了各分社有没有夸大申请数

及夸大程度。求解的方法就是直接进行除法求比例。

另外,我们没有引进销售量作为指标,是因为通过我们分析,得到销售量与市场需

求这个指标是高度线性相关的,如果引入,将导致信息的重复,影响评价准确度。

4.3.2分析如何利用已知五年的市场行情预测2006年的市场情况

这里需要对四个指标都要进行预测。因为通过分析知道a、b、c三个指标几年内

变化不是很大(即看不出规律),而且拥有的数据量很小,所以采用了经典模型

来预测,因为灰色模型适用于那些数据量少,而且没有明显变化规律的预测。对于读者

对各门教材的评价得分,短时间内是不会有太大的变化的,所以我们采取求平均值的办

法。

4.3.3分析如何综合评价四个指标,并给出综合评价指数(或者得分)

现在有很多传统的系统评估方法,比如加权评估法、专家评估法、综合评分法以及

层次分析法,这些方法都不免受到主观因素不同程度的影响。据于此,我们使用的基于

主成分分析所构造的评估机制,这样可以避免主观因素对评估的影响,使得评估结果客

观的反映系统状况。

主成分分析方法是一种将多维因子纳入同一系统进行定量化研究、理论成熟的多元

统计分析方法。通过分析变量之间的相关性,使得所反映信息重叠的变量被某一主成分

替代,减少了变量数目,从而降低了系统评价的复杂性。再以方差贡献率作为每个主成

分的权重,由每个主成分的得分加权,得到的分值经过归一化处理即可以得到各门课程

的教材综合评价后的比例,这个比例综合反映了各个课程单位书号的分配权重c

4.3.4分析如何预测2006年的实际销售量

由题目的意思(附件3_各课程计划及实际销售数据表),实际销售量由分配得到的

书号数计算得到的,所以分配得到的书号数是决定销售量的一个因素;另外还有一个因

素,就是每年单位的书号数的销售量。所以我们就预测出每一门课程的教材在2006年

单位书号的销售量(根据前面五年的数据来预测),然后用这一年分配的书号数与之相

乘就是这门课程教材的预测的实际销售量。

我们分析了单位书号数随时间的变化情况,还是因为考虑到数据量太少,而且拟合

效果差,所以考虑用灰色模型来预测。但是发现求得的数据误差较大,所以引入时序残

差G(l,1)模型。

4.3.5分析如何确定分配方案

出版社主要是以经济利益为目标,当然也要在考虑一定市场需求(即文章中的保持

工作的持续性)的基础上。在本问题中,要求以强势产品支持力度的原则来优化资源分

配。为了能够得到最大的经济效益,我们建立一个整数规划模型来求解。因为题目中己

经说明了几年内人员变动不大,所以可以认为成本是基本不变的,而且附件4中说明“定

价时保持对所有教材利润率同一”,所以我们以销售额为目标函数;约束条件主要有两

个,一个是人力资源的限制;另一个是要以强势产品支持力度为原则。我们把低于平均

值的课程的教材只分配给一半;高于平均值的课程的教材根据他们的权重大小进行分配

(当然也是在满足能够分配到一半以上的基础上)。

在考虑强势产品的分配权重的时候,用单位分配权重乘以申请书号数再进行归一化

得到的权重来表示,这个就是强势产品的大致分配比例。这样做的目的是因为通过主成

分分析综合评价后得到的综合指标是单位分配权重(即如果只分配一个单位的书号,各

门课程所占的比例)。

5模型的建立和求解

按照问题分析的思路,下面首先充分利用Excel.SPSS和Matlab软件进行数据分

析,接着对各门课程的强势情况进行评价并确定对各门课程的单位书号分配权重(通过

主成分分析综合评价方法),然后建立时序残差GM(1,1)模型预测2006年A出版社各门

课程单位书号销售量,最后建立整数规划模型求解最佳资源配置。

5.1数据分析

5.1.1调查问卷中对教科书评价的信度分析

信度分析用于对于评价调查问卷这种测量工具的稳定性和可靠性,具体来说就是用

问卷对同一事物进行重复测量时,所得结果的一致性程度。因此信度是检验调查问卷有

效程度的重要指标。我们使用克朗巴哈。信度系数法来测量调查数据的信度。(仅对关

于教材评价的信息进行信度分析,读者所填的其他基本信息均认为是可靠的)

其中,K为教材评价指标总数;苏为第个测评指标满意度得分的题内方差;足为教材

评价指标总得分的方差。

通过SPSS统计软件中的信度分析,可以得到2001-2005年中每年调查问卷的信度

分析(ReliabilityAnalysis)。下图为2001年的信度分析结果。

CaseProcessingSummary

CasesValid

ExcludecP0.0

Total28702100.0

a.Listwisedeletionbasedonall

variablesintheprocedure.

ReliabilityStatistics

Cronbach's

AlphaNofItems

(图1)

在SPSS软件的信度分析中,当。值大于0.7的时候就说明该问卷是可信的,从结

果来看,得到的a=0.816满足可信条件,并且是100%可信。

同理我们可以得出02〜05年每年的信度分析结果,将01〜05年的克朗巴哈&信度

值统计得到表1:

表1:01〜05年a信度值

年份20012002200320042005

C值0.8160.7140.7420.7000.717

信度分析:根据SPSS软件计算出的克朗巴哈&信度值,我们基本可以认为所有调

查问卷对教材评价的信息都是可信的。这也与实际是相符的,调查问卷是不记名形式的,

而且出版社会为所有填写调查问卷的信息保密,因此被调查人也没有必要恶意填写,会

根据自己的实际情况进行填写.

5.1.2五年中所有调查问卷的数据分析

附件2给出了01-05年所有调查问卷的信息,这些数据量十分庞大,需要运用统计

分析的方法处理。我们充分利用了Excel强大的数据统计功能结合Matlab软件,运用

其中的自动筛选归类功能,可以快速的统计出相关信息。

我们对题目进行分析•,仔细阅读了所给的五个附件的信息,确定了四个指标去影响

2006年A出版社对所关注的72门课程的书号分配比例:各门课程每年在市场的占有比

例、A出版社出版的教材中各门课程所占的比例、读者对A出版社各课程的满意度、A

出版社每年各课程的销售量的计划准确度。

通过统计得出了2001—2005年整个市场上各门课程所占的比例(见表2),2001—

2005年A出版社中各个课程占有率(见附表1),2001—2005年单位书号的实际销售量(见

附表2)。

表2:整个市场上各门课程所占的比例(这里只列出计算机类)

科目类别科目名称2001年2002年2003年2004年2005年

C++程序设计0.547%0.548%0.549%0.549%0.547%

C程序设计1.459%1.461%1.464%1.464%1.460%

DSP技术及应用0.144%0.145%0.145%0.145%0.144%

Java0.198%0.198%0.198%0.198%0.198%

编译原理0.304%0.304%0.305%0.305%0.304%

计算计类

数据结构1.261%1.263%1.266%1.266%1.262%

软件工程0.782%0.784%0.785%0.785%0.776%

单片机0.433%0.434%0.435%0.435%0.433%

多媒体0.790%0.791%0.793%0.793%0.776%

人工智能0.273%0.274%0.274%0.274%0.274%

从表中可以看得出,对于每个课程它们每年在市场上的占日率在几年内变化不大。

5.2对各门课程的强势情况进行评价并确定对各门课程的单位书号分配权重

下面首先利用模糊综合评价模型求出A出版社关注的各课程的满意度;然后建立经

典GM(1,1)模型预测72个课程四个指标在2006年的值,并分析预测误差;最后运用

主成分分析综合评价模型确定A出版社各门课程单位书号分配权重。

5.2.1模糊综合评价模型求读者对A出版社关注的各课程的满意度

分析调查问卷中的读者对某书的满意度评价一项,发现其中的各项指标带有一定的

主观性,具有模糊性,不易量化,因此此处采用模糊综合评价的模型来确定读者对A出

版社关注的各课程的满意度。

模糊综合评价是以模糊数学为基础,应用模糊关系合成的原理,将•些边界不清,

不易定量的因素定量化、进行综合评价的一种方法。

我们知道,模糊集的运算是通过它的隶属函数的相应运算来实现,因此建立模糊集

的隶属函数是解决问题的关键,而确定隶属度函数的方法有多种(如:推理法、模糊统

计方法、模糊分布),考虑到此处数据量的巨大,这里采用模糊统计的方法,即

与隶属于A的频率=尤。£—的次数(2)

n

式中A模糊概念集,n表示作n次试验,与表示取定的某事物,A'表示一个与人所表示

的模糊概念相联系的经典集。当隶属频率稳定时,即可将其取为与对A的隶属度。对于

本题的实际,要求出读者对A出版社2001—2005年各个年份72个课程的满意度,其中

有I四个评价指标(分别为内容是否新颖、作者是否权威、教材卬刷排版质量、价格是否

合理),依次记为指标1、指标2、指标3、指标4,分别对应四个模糊集,下面分几步

求出读者对每个课程的四个评价指标分别打1、2、3、4、5分的隶属度:

Steptl:利用EXCEL软件从题目所给数据中筛选出属于A出版社关注的72个课程

的样本,然后以每个课程作为研究对象,分别统计出读者对每个指标打1、2、3、4、5

分的人数,然后进行归一化,便得到读者对每个课程的四个评价指标分别打1、2、3、4、

5分的隶属度。结果见表3(限于篇幅,这里只给出2005年课程1的结果)

表3:读者对每个课程的指标分别打1、2、3、4、5分的频数与隶属度

频数隶属度

\^旨标指标1指标2指标3指标4\^旨标指标1指标2指标3指标4

分£\分企\

10342100.150.20.1

21087620.50.40.350.3

3876830.40.350.30.4

4223440.10.10.150.2

500005000()

Stept2:由于各个评价指标的内涵不同,在综合评价中所起作用也不同,因此须考

虑各指标的权重问题,这里设各个指标的权重系数为:

W=(0.25,0.25,0.25,0.25);(3)

r00.150.20.1、

0.50.40.350.3

课程1评价的模糊关系矩阵为:R=0.40.350.30.4(4)

0.10.10.150.2

N00。J

做模糊变换得:

T

<00.150.20.1]

0.50.40.350.3

B=VV/?=(0.250.250.250.25)

0.40.350.30.4(5)

0.10.10.150.2

W00°;

=(0.11250.38750.36250.13750)

Stept3:B=(0.11250.38750.36250.13750)中各元素就表示了读者对

课程1打1,2,3,4,5分的综合隶属度。则读者对课程1的综合满意度为:

,0.1125、

0.3875

(12345)0.3625=2.525。(6)

0.1375

至此,读者对A出版社课程1的满意度的求解完毕。由同样的方法可以求出

2001-2005年读者对A出版社各个课程的满意度(见附表3):

表4:2001-2005年读者对A出版社各个课程的满意度(这里只列出“算机

类)

科目类别科目名称2001年2002年2003年2004年2005年

C++程序设计3.0002.8132.9743.0682.525

C程序设计3.2392.7002.8043.0482.574

DSP技术及应用0.0003.0001.6252.5002.250

Java4.0003.1672.7502.5832.650

编译原理1.7503.3753.0003.0002.417

计算计类

数据结构3.4822.4293.0183.1832.700

软件工程2.7042.8212.8022.7712.692

单片机3.5003.7503.0631.5002.625

多媒体3.1202.9702.6602.6902.891

人工智能3.0942.8062.7783.0002.792

5.2.2GM(1,1)模型预测2006年72个课程各指标的值

(1)模型的建立

下面分几个步骤来建立GM(1,1)模型:

步骤1:数据处理:将原始数据列x⑼⑴做一次累加,得到生成数据列据“⑴,即

X⑴(公二小⑼⑴(7)

步骤夕:构成数据矩阵B与数据列%:

--i[x(,)(l)+x(,)(2)]f

-1[X(,)(2)4-X(,)(3)J1

—••

••

_灯/)(〃—1)+/)(〃)[1](8)

匕=卜。)(2),小"3),...,”(〃)『(9)

步骤3:计算模型系数a和待辨识参数u:2=[4*]7=(/8)7必%(10)

步骤4:建立时间响应模型尤⑴⑺:2⑴(&+l)=(”(l)-〃/a)e"+u/a(11)

步骤5:将时间响应离散化:x(1)(Z:+1)=(x(0)(1)-w/a)e-ak+u!a(12)

步骤6:将k值代入禽散模型式计算预测累加值金⑴⑺o

步骤7:将预测累加值还原为预测值:力°)(Q=£⑴(幻-戈⑴伏-1)(13)

步骤8:模型检验。采用残差检验法,将预测值与原始数据序列x⑼⑴相比较,求

出两序列的差值即为残差,通过计算相对精度以确定模型精度。

(2)运用GM(L1)进行2006年72个课程各指标的预测

下面根据这一上面建立的模型,以预测A出版社2006年出版的教材中课程1所占的比

例为例说明求解的具体方法:

步骤1:原始数据:由前面做的统计工作可以得到2001-2005课程1比例x⑼⑴二(1.092

1.26481.10031.01060.90742)(百分点),累加后的生成数据列工⑴(i)=(1.0920

2.35683.45714.46775.3751)0

步骤2:构成数据矩阵B与数据列几:

'-1.72441.0000、

B:-2.90691.0000,%=(].26481.10031.01060.90742)o

-3.96241.0C00

、-4.9214LOCOO,

步骤3:计算模型系数a和待辨识参数u:a=^«r=(BTB)-^TK.=f0,1095>|

z[1.4408)

步骤4:建立时间响应模型左⑴⑺:模%)=-12.0642€0呐+13.1562

步骤5:将时间响应离散化:i(,)(Z:+1)=-12.0642e-°,095k+13.1562

步骤6:将k值代入离散模型式计算预测累加值

£⑴/)=(1.09202.34343.46504.47035.3713)

步骤7:将预测累加值还原为预测值:开°)伏)=£⑴(幻-得:

x(0)(Z:)=(1.09201.26481.10031.01060.9074)

步骤8:模型检验。将预测值与原始数据序列f°)⑴相比较,求出两序列的差值即

为残差£网伙)-工⑼⑴,残差序列为(00.0134-0.02130.00530.0064)。通过计

算相对精度以确定模型精度,求得平均误差0.85688%。这个精度已经很高了,因此模型

通过检验。

通过相同的原理,可以预测出所有课程所占比例,进而对每个指标都作相同的处理,

就可得到每个课程的四个指标的预测值。限于篇幅限制,在正文只给出预测2C06年A

出版社每年出版的教材中各门课程所占的比例及预测结果与原始数据的平均误差(其余

三个指标:各门课程的教材在整个市场占有率预测值见附表6、误差分析见附表7,读者

对各门课程的满意度预测值见附表8、误差分析见附表9,各门课程销售量的计划准确

度的情况预测值见附表10、误差分析见附表11)。

表5:2006年A出版社每年各门课程所占的比例

课比例课比例课比例课比例课比例课比例

程程程程程程

代代代代代代

码码码码码码

10.901%130.287%251.885%370.113%490.577%610.320%

21.319%140.545%263.439%380.890%500.002%620.517%

30.018%150.276%270.360%390.904%510.386%630.545%

40.087%160.575%280.047%40().157%520.777%640.677%

50.110%170.710%290.745%410.766%530.312%650.101%

60.922%181.110%302.559%422.890%540.391%660.800%

71.954%193.923%3112.967%431.715%550.001%670.350%

80.076%200.650%320.646%442.669%560.211%680.420%

91.698%210.396%330.048%453.869%570.254%690.525%

100.520%221.820%342.211%462.976%580.005%700.170%

111.382%2324.325%350.858%471.892%590.251%710.135%

121.208%240.425%361.753%480.905%600.400%720.355%

从该表可以看出代号为19、23、26、31、45的课程所占的比例较大,其中23号最

大,而31号次大,它们分别代表的是高等数学、大学英语,这是符合现状的,因为这

两门课几乎是所有高校都必须开的公共基础课,这也从一定程度上反映了该出版社生产

的重要产品为高等数学、大学英语课程教材。

表6:预测结果与原始数据的平均误差

课平均误课平均误课平均误课平均误课平均误课平均误

程差程差程差程差程差程差

代代代代代代

码码码码码码

10.857%1315.033%251.344%371.478%491.607%610.646%

25.678%144.381%260.957%386.457%502.346%620.674%

31.225%156.024%272.142%392.621%512.832%630.586%

424.295%160.774%286.065%4023.363%522.891%640.441%

58.732%175.922%292.979%411.905%532.950%657.869%

62.102%182.832%301.331%421.142%546.460%66().610%

74.149%190.230%310.481%432.414%554.786%672.075%

851.358%205.770%323.623%441.498%565.502%682.609%

91.132%212.273%333.215%452.524%571.774%691.827%

102.895%221.689%344.081%463.721%583.674%701374%

112.168%230.561%352.306%474.983%590.596%7118.335%

122.071%242.577%363.707%480.676%603.294%722.395%

分析表中数据发现除了少数几个课程的预测值与原始数据的平均误差比较大之外,

其余课程的平均误差都可以接受,这可以在一定程度上说明了采用GM(1,1)模型对

未来一年的情况进行预测的方法的正确性。

5.2.3运用主成分分析综合评价模型确定A出版社各门课程单位书号分配权重

通过上面的求解已经知道了评价各门课程综合力的指标有四个,而且已经分析出了

这四个指标对各门课程的影响情况,下面首先建立一个基于主成分分析的综合评价方法

的数学模型;然后通过求解这个模型得到各门课程的综合得分和各门课程强势产品大小

的排名;最后将综合得分进行归一化,将所得比例作为A出版社各门课程单位书号的分

配权重。

(1)模型的建立

主成分分析法是将多指标化为少数的几个综合指标的一种统计方法,它可以对多变

量数据进行最佳的综合简化。模型建立的步骤如下:

Stepl:对数据进行标准化处理。

设有n门课程,指标有P个,分别为用、B2.…、Bp,令芍为第i门课程第j个

指标值。进行变换:

z;.—z.

=—----/=1,2,...,??;j=1,2,...,p(14)

式中,Zj表示样本的均值,s’.是4的样本标准差。

标准化处理的目的是为了使样本点集合的重心与坐标原点重合,而压缩处理可以消

除量纲不同引起的虚假变异信息,使得分析结果更合理。

Step2:计算标准化数据矩阵的协方差矩阵V。

这个协方差矩阵V也就是原始数据的相关系数矩阵(见文献[6]),计算公式为:

Sjk=Cov(Zj,zQ(15)

SteP3:求出协方差矩阵V的特征值并进行排序424...24,再求出V矩阵各个特

征值对应的正则化单位特征向量则第i个主成分表示各个指标此的线

性组合:Q=。(16)

«=|

Step4:确定主成分的个数m。

常用的主成分个数的佣定方法有两个:一是特征值的累积贡献率达到一定程度,比

如70%或者80%以上;另一个是先计算p个特征值的平价值,取大于平均值的特征值的

个数。这里采取第一个方法,并且去积累贡献率大于80猊

Step5:计算综合得分。首先分别计算出第i门课程第k个主成分的得分为:

工=24£;(17)

*=1

然后再以m个主成分方差的贡献率为权重,求出第i门课程综合得分:

1-EM(18)

Step6:对每个课程的综合得分进行排序并求出各个课程占的比例。

(2)模型的求解

通过上面的求解已经预测出了2006年每门课程在4个指标中的比重,这4个指标

分别表示为:各个课程在整个市场占有率用当、各个课程在A出版社中的市场占有率B2、

读者对各个课程的评价得分笈、各个课程的销售计划准确度B,o

①将矩阵B进行标准化,为了方便,这里仍然记标准化后的矩阵为B,并求HIB对应

的协方差矩阵V;

②调用Matlab数理统计箱中的pcacov函数和princomp函数,调用格式分别为:

[pc,latent,explaned]=pcacov(V)

其中pc表示主成分,latent表示协方差矩阵V的特征值,explaned表示每个特征

值的贡献率。

[pcs,scores,latents,tsquare]=pcacov(V)

其中ingredients指标准化后的样本指标矩阵,pc是指各主成分关于指标的线

性组合的系数矩阵,score为各主成分得分,latent是方差矩阵的特征值,tsquare为

HotellingT统计量。

求得的统计结果如下:

a、四个指标标准化数据后的协方差矩阵

1.00000.77820.01980.0214

0.77821.0000-0.03910.1252

0.0198-0.03911.0000-0.0062

0.02140.1252-0.00621.0000

b、各个成分的特征值及其贡献率

表7:各个成分的特征值及其贡献率

特征值贡献率积累贡献率

第一成分1.792144.802644.803%

第二成份1.006825.170869.973%

第三成分0.988324.708494.682%

第四成份0.21275.3182100.00%

从表中的数据可以知道,前面三个成分的积累贡献率已经达到了94.682%,所以取

前面三个成分作为主成分就已经能够表示出综合评价了。

③根据V矩阵各个特征值对应的正则化单位特征向量,前三个成分关于指标的线性

组合为:

/=0.6963B1+0.7056B2-0.5676B,+0.0185B4

,=-0.12428,+0.006782-0.853963+0.5054B4(⑼

7;=-0.1099B,-0.0348B2+0.5176B3+0.8478B4

根据表达式中的系数及符号,可对各主成分的实际意义作如下解释:第一主成分中

B「4和符号相同并且修、大小差不多,人和与符号也相同并且大小也差不多,

所以可以知道4和与、与和生对第一主成分起同样的作用;第二主成分与四个都成正

相关,各个指标都正向影响笫二主成分;第三主成分只有功为正的。

④以各个主成分的方差贡献率为权重可得到各个课程的最终综合评价得分:

表8:各个课程的最终综合评价得分

课综合得分排名课综合得分排名课综合得分排名

程程程

号号号

1-0.236849250.403871749-0.282954

20.076431260.55341250-1.966371

3-0.234148270.72756851-0.084538

4-0.54606728-0.515146452-0.253150

5-0.53886629-0.2887655530.143628

6-0.18244430-0.2045946540.267621

70.97704311.0469355-2.187172

80.41391632-0.072153756-0.877370

90.7940633-0.5113763570.94675

100.74337340.0121733358-0.516665

110.348919350.106730590.177625

120.111329360.1667127600.215423

131.0611237-0.322645761-0.619369

14-0.325858380.653141062-0.376859

150.26112239-0.0907340630.414815

16-0.04253540-0.1238443640.65829

17-0.498362410.1895724650.425514

18-0.20814742-0.2717251660.038332

19-0.10694243-0.092674167-0.273253

20-0.29215644-0.069053668-0.551768

21-0.27225245-0.022923469-0.087239

220.390718460.342562070-0.401160

231.21721470.172126710.524513

240.61371148-0.447716172-0.200945

由该表可以得到:如果该出版社的强势产品可以简单地定为综合评价得分为前十名

的课程,那么该出版社的强势产品按照排名就为:23、13、31、7、57、9、10、27、64、

38;对应的课程名称分别依次为:高等数学、证券投资、大学英语、软件工程、物理化

学、多媒体、人工智能、近世代数、地质学、日语。

⑤、通过引入基数对综合得分进行归一化。基数等于综合得分中的最小负数加上最

大负数然后取绝对值(因为这样取基数,不会改变数据之间的差异性),确定基数后再

让所有的得分加上这个基数,这样所有的得分就转换为正数,就可以进行规一化处理,

得到结果如下:

表9:A出版社关注的各门课程单位书号的分配权重作)

课程12345678910

比例1.3011.4171.3021.1861.1891.3211.7521.5431.6841.665

课程11121314151617181920

比例1.5191.4301.7831.2681.4861.3731.2041.3121.3491.280

课程21222324252627282930

比例1.2881.5341.8411.6171.5391.5941.6591.1981.2821.313

课程31323334353637383940

比例1.7781.3621.1991.3931.4291.4511.2691.6321.3551.343

课程41424344454647

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论