




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、在收集和处理数据之后 , 应该采用何种预 测技术去建立什么样的预测模型 , 是常规预测 中很重 要 的一个问题 , 也是初次尝试预测的同 志经常提出的问题 。 下面介绍 的这 些方法 , 或 许会对初学者有点参数价值 。 与某些典型函数的曲线相似 , 则不宜根据这组 统计数据用上述处理时间序列的方 法 进 行预 测 。 一 、 通过分析数据点 的变化规律建立预测 模型 。 在 收集数据后画出数据点 分布图有助 于预 测人员直观地看出数据点的变化 规律 , 从 而 选择合适的预测法 建立精确度较高的预 测 模 型 。 例如 , 对经济变量进行因果分析后 , 认为 影响预测目标变化的只是一种主要
2、因素时 , 可 画出预测 目标 y 和 主要影响因素 1 的数据点 分布图 , 如果数据点呈直线分布 , 则可 用一元 线性回归法建立预测模型 : 如果数据点的分布 不 成直线 , 则应仔细分析数据点的分布是否接 近于某一函数的曲 线 (例如抛物线 、 双曲线 、 指数函数曲线 、 逻辑曲线等) . 的形状 ; 若接 近 , 则可按该函数的关系建立预测模型 。 如果预测目标 y 随时间周期 t 的变化呈线 性 , 则可用 时间回归法 、 移动平均法或二次指 数滑移法建立预测模型 。 当数据点的上下波动 较 明显时 , 即使对时间回归法的相关检验能通 过 , 也不宜用该法建模 , 最好是采用后两
3、种方 法建模 。 当数据点的时间分布线近似于抛物 线 时 , 应考虑采用三次指数滑移法建模 。 如 果 y 随 t 的变化近似于其它典型 函数 曲线 , 则可按 该函数建立预 测模型 。 对于波动很大的时间序列 , 当其后面周期 的 一次移动平均值和一次指数滑移值的数据点 没有明显的线性趋势 , 而且数据点的分布线不 二 、 建立模型时对数据 的取舍 收集数据并画出数据点分布图后 , (1 ) 如 果数据点的分布比较有规律或比较正常 , 则应 充分利 用全部原始统计数据建立 预 测模型 ; (2) 如果个别数据点过高或过低 , 在分析原因 后 , 能够肯定这是由不能反映正常情况的偶然 因素造成
4、的 , 则应将这个 (或这些) 数据点剔 除 , 用 剔除异常数据点后的数据建立 预测模 型 ; (3 ) 如果前期数据点的分布有 一 定 的 规 律 , 后期数据点的分布遵循另一规律 , 可只取 后期的数据建立某种型式的预测模型 。 例如 , 表一是全国历年电度表 产量的数 据 。 197 2 年以前 , 由于需求较少 , 电度表处 于积压滞销状态 , 使得电度表的生 产量增长 缓慢 ; 从 1 97 3年起 , 由于许多地 区逐渐取消 电费包干制度 , 再加上电度表降价和家用电器 量迅速增加 ; 电度表销售量开始猛增 , 随即出 现供不应求的局面 , 在需求 刺激下 , 电度表产 量大幅度
5、增长 , 数据点分布线近似于抛物线 。 在预 测短期内的电度表产量时 , 可只 用1 9了3一 19 80年的数据建立预测模型 。 这样所得的预测 值与用全部数据建模预测的结果相比 , 一定会 更加接近实际值 。 三 、 尽量根据因果关系 用回归法建模 分析因果关系用回归法预测 所得 的 结果 , 一般要比用时间序列法预测所得的结果更为精 确 , 因此 , 只要有可能 , 就应尽量找出预测目 标的影响因素及其数据 , 建立因果关系回归法 表一全国历 年电度 表产量 ( 万支) 年份一产量年份 产量年 份 扭” 一月 助宾的教雄点 、 z,卜299口年的取据 点 . , . x r 即然动 肠
6、0俞 荃 七令 叫喇狭 龙 寨 雾Y 毛一 附了9 ,“一了内匕心It了八 1973 19 74 19 7 5 1976 197 7 19 78 1979 1980 八 Uud 0J9 自尸0O JOJ qUQ . 八U工 aQ 。 门八减 ,二,上,二,土 , 上,上 1959 19 60 19 61 196 2 19 63 1964 196 5 39 55 18 30 40 61 9 1 19 6 6 1967 196 8 19 69 1970 19 71 1972 预测模型 。 只有当找不 到因果关系 , 或者知道 因果关系而无数据可资利用时 , 才只按时间序 列法建模 。 利 用回归法
7、时应分析预测目标与影响因素 之间是否有时间滞后关系 。 有些预测 目标与影 响 因素之间没有时 间滞后问题 , 例如钢消费量 与国民收入 、 煤消费量与工业总产值等 , 因为 影响因素和预测目标基本上都是同时期的数 值 。 但是有些预测目标与影响因素之间却有时 间滞后问题 。 例如 , 美国某地毯生产厂商某一 季度的地毯销售量与上一季度的住房建筑许可 证颁发数有密切关系 ; 我国某些城市某年的手 表销售量与上一年新增加的就业人 数密切相 关 ; 某电容器厂纸介电容器某月份的销售量与 使用该产品的洗衣机厂下一个月的洗衣机产量 有因果关系 。 四 、 研究变化规律 , 结合定性分析 建立更佳的预测
8、模型 。 在建立和确定用于预测的模型时 , 如果能 够结合近期的 和预见的未来情况 , 去研究历史 数 据点的变化规律 , 将会得到比较符合实际的 预测模型 。 例如 : 图一画出的是我 国人均钢消费是与 人均国民生产总值之间关系的数据 点 分 布 情 况 。 由图一 可以看出 , 28 年的2 8个数据点呈线性 分布 , 根据这些数据点利用 回归法可建立一直 线的方程y , 一般情况下 , 如无特殊变 化 , “ 一忿厂亩下扩瑞厂蕊月矿忘户 人均国玲生产总值元众) 图一我国人均钢消费量与人均国民生产总值关系图 即可按 y A 线进行预测 。 但是 , 由于在作 图 过 程中发现头 8 年的数
9、据点成一直线 y c, 而 后 2 0年的数据点成另一直线 y , 参 见 y , 的阱 率比 y 。 的小得多 , 也 . 比 y , 的小 一些 。 分析 其原 因 , 是由于在六十年代初困难时 期我国国 民经济进行了大的调整 , 加大 了轻工业和农业 的比重 , 减小 了重工业的比重 , 而在净产值相 同的情况下 , 重工业 的 用钢量比轻工业和农业 的大得多 , 因而 , 从 19 6 1 年起 , 我国随着人 均 国民生产总值的增加 , 人 均钢材消费量的增 长速度 (即 回归线 的斜率) 减小了 。 y : 回归比 y * 和 y。 更能代表近2 0 年来的实际变化情况 , 本可作
10、为今后的预测发展线 。 不过 , 考虑到我 国当前正在进行国民经济调整 , 而调整的方针 基本上与六十年代初的国民经济调整相同 , 在 对今后将使钢消费量增长和减少的诸因素进行 分析后 , 可以肯定今后人均钢消费量与人均国 民生产总值关系线的斜率将比调整型发展线 y B 的还小 , 因而作者以斜率比 y 。 线小一定程 度的发展 线作为预测发展 线 , 这将比按 y。 线 预测的更能接近未来的实际 。 又如 : 某省农民存款历年发展数据和变化 趋势如表二 和图二所示 : 预测人员已看出数据点的分布呈抛物线 , 但预测人员并不采用三次指数滑移预测模型 , 而是选用二次指数滑移预测模型 , 因为他
11、考虑 表二某省农民存款额 (亿元) 年份 存款额 年份 存款额 年 份 存款额 197 037 14 197 4 0 0 53 197 8 9702 19 7137281975 48071979 6 73 4 19 72 487119761 5161980882 1 1973 96811 97 7466019 819615 |四|阳 l ! 旧 肠 . 唬户 艺澎 形仲试娜 1970 2 7 祥乃 7R 8 0 图二 、 某省农民存款额变化图 到该省 1982 年在 198 1 年遭灾之后又遭灾 , 因 而农民存款额增长的幅度不会象按三次指数滑 移法所得的预测值那 么大 。 五 、 用多种预测
12、法建立多个预测模型 为使预测 结果更为可靠 , 在许多情况下 , 可用多种预测方法建立多个预测模型 , 并将按 各预测模型预测所得的预测值加以 比较 、 分 析 。 例如 , 预测某省西药销售量时 , 既用 因果 关系一元回归法 (以人均西药销售量作为因变 量 , 以人均国民收人作为 自变量)建模 , 又用 对时间回归 法 、 移动平均法 、 指数滑移法分别 建立预测模型 。 得出几组预 测值后 , 又加以分 析 , 这样做 , 有助于提高预测精确度 。 六 、 关于多元回归建模问题 影响预测目标的诸因素有时不容 易找出 来 , 有时虽能找出几个主要影响因素 , 但是没 有统计数据可资利用 ,
13、 因此 , 在我国目前的情 况下 , 要建立一个多元 回归预测模型并不是容 易的事情 。 当有条件用多元 回归法预测时 , 建 模过程中应注意以下几个 问题 : 1 ) 要分析预.m J 目标与各 自变量是否有因 果关系 , 是否强 相关 经分析可 以肯定所选定 的某个 自变量 X K 与预测目标 Y 有因果关系 , 而且 Y 与 X K 的 线性相关程度很强或较强 , 才能保留这个自变 量 , 否则应舍弃该 自变量 。 例如预测全国石油专用机械和备件总需求 量 Y 时 , 先选定投资( x : ) 、 当年开 .动 的 钻 机 数( X : ) 、 钻尺深度( x 3 ) 和石油l总产量(
14、x 、 ) 作为四个主要影响因素 。 收集和分析数据后看 出 , 近年来石油总产量基本 上 不变 , 而 Y 值 却迅速增大 , 可见这两者不存在因果关系 , 其 相关系数 也相当低 , 因此 , 应弃舍 X 4, 而 X , 、 x : 和 x : 对 Y 值有直接的影晌 , 经相关系数 检验后知 Y 分别与 x l 、 X , 和 X : 的相关系 数较大 , 因此 , 可以只保 留 X l 、 X : 和 X 3 , 建立三元回归预测模型 。 2 ) 要检 查各个自变量是否非相关 Y 与各 Xi 的相关程度是越大越好 , 而 各 i X:之间的相关程度则是 越小越 好 。 当i X与 X
15、 二 之间的相关很强或较强时 , 应消去其中一 个 自变量 。 例 如预测卫生陶瓷需求 量时 , 以卫生陶瓷 总需求量作为预测目标 Y , 以峻工的城镇住宅 面积( x : ) 、 医疗卫生机构建筑面积( x: ) 和 办 公楼建筑面积( x 。 )作为自变量 。 在检验白变 量间的相关程度时 , 知 X l 与 X : 相关强 度较 高 , 则可消掉 X Z。 3 )某个回归系数的符 号与因果 关系的分 析不相符合时 , 则相应 的变 量应舍 弃 。 如果经因果关系分析肯定 Y 将随 X : 的增 加而增加 , 随 x K 的减小而减小 , 而根据统计 数据计算所 得的 X K 的i回 归系
16、数 b二 却 为 负 值 , 则应舍弃 X 二, 相反地 , 如果经分析知道 Y 将随 x K 的增加而减小 , 随 x K 的减 小而增 加 , 而计算所得的 b二 却为正值 , 也不能 保 留 X K。 例如卫生陶瓷预测中 , 按三元 回归算得的 b : 数值为负值 , 这意味着办公楼建筑面 积增 加得越多 , 卫生陶瓷需求量越少 , 这是不合乎 道理的 , 因此 , 应舍弃 X 3。 4) 两个或几个 自变量折算为一个自 变量 当某个(或某些)自变量 X 二 因为不符合 上述三条原则而被舍弃时 , 如果它(或它们) 对预测目标的影响并不小 , 在可能 的条件下 , 最好是将它 (或它 们
17、) 折算为 i x 。 仍以卫生陶 瓷预测为例 , X 3 因与 Y 的相 关系数 较小 , b 。 又 为负值而 被舍弃 ; X : 因与 X , 相关强度高又被舍弃 , 最后只好建立 一 元 线性回归 预测模 型 Y = a+ b X I。 从 统计数据 看 , X : 和 X 3 的数值之和是比较大 的 , 它们 对 Y 的影响并不 小 , 因此 , 舍弃这 两个自变 量有点儿 可惜 。 在这种情况下采用折算法是比 较好 的 。 其作法是根 据经验或统计数据分别得 出医疗卫主机构和办公楼单位面积所用卫生陶 瓷件数与住宅单位面积所用 卫生陶 瓷件数的比 例 , 再按这两个 比例分别 将 X
18、 : 和 X : 析算为 X :, 并把两个折算值与 X l 相加 , 得出一个新 的自变量 X , 建立 一元线性回归 预测模!型 Y 二 。, bX 。 要计算预测值时 , 先分别预计今 后 某 一年的 X , 、 X : 和X 3, 将 X : 和 X : 折算为X , , 算出 X 值再代入预测模型求得卫生陶 瓷需求 量预测值 Y 。 测发展线以 Y t 为起点 , 每年的递增量为 b :。 相反地 , 如果后面周期的 Y 值增长殉度比前 面周期的小 , 甚至后一个或后几个周期还有所 下 降 , 则可根据定性分析的情况考虑将预测发 展 线 向下移动到穿进 a t 点 。 下 举 两 例
19、说明 之 。 例一 、 某省人 均中药销售量统计数据和发 展趋势图如表三和图三所示 。 用二次指数滑移 法 , 取 a= 0 . 3 0 , 得 预 测模型 Y 。,十T二 1 . 98 2 十 o 12 51T 。 1 982年人均中药销售量预测值为 2 l 0 7元 /人 , 尚达不 到 198 1 年 2 1 4 1元/人 的 水平 。 而根据对历史数据的分析 , 该省人均中 药销售量是年年增 长的 , 显然上述预 测值 偏 低 。 为使预测值准 确一些 , 可将 Y :, 、二 二 1 . 98 2 十 0 1 251T 向上移动到穿过 Y :, , 预测模型 即变为 Y :;十T=
20、2 . 1 1+o . i 2 51T 。 它表示今后 人 均中药销售量将以 2 . 1 1元 / 人为起 点 , 每年 递增 0 . 1 251 元/人 。 这样求得的 19 8 2 年预测 值为 2 . 23 5 元/人 。 表三 某省人 均 中药销售量 (元/ 人) 年 份年 份 人 销 均中 售 药一之 戛 毕 份 人 销 中均 售 曹 b一alr一nJ连b : 户 196 7 1968 1972 197 3 00 05 197 7 197 8 1969 1970 1971 橇 瞥叠 。 一 J O 7吕 1 0 9 197 41979 1 97 5 1976 18 2 2 19 80
21、 1981 86 1l 泛 长 ) 州 和奖探全 软 - 哭 城 七 、 根据近期统计数据 和对未来的分析 , 把预测模型发展线向 上移动或向 下移动 当用 平滑法进行预测时 , 如果后面周期预 测目标 Y值的增长幅度比前面周期 的大 得多 , 则今 后一两年内 (有时甚至为三 、 四年内)按 预测模型 Y :十T二a t + b : T 计算所得 的预测值将 比最后一个周期的实际值还小 , 而根据定性分 析 , 今后一两年内的实际值一定会比最后一个 周期的大 , 在这种情况下 , 可以把预测发展线 向上移动 到穿过 Y , 点 , 即以 Y T 代替 a: , 于是预 l l 模型变为 Y
22、t十: 二 Y t+ b 。 T , 它表示今后的预 塔石7 石乡7j 移 万 77 触 泞I召了窟歹 图三 、 某省人均中药销售量变化图 例二 、 某市布鞋销售量统计数据和发展趋 势如表四 和图四 。 用二次指 数滑移法 , 取 。= 0 . 30 , 得预测模型 Y 。:+T = 347+1 6 . 95 T ; 用移动平均法 , 取 N=5 , 得预测模型 Y 。:十T ”3 7 1+24 . 7 8 T 。 这两个模型 的 a t 值均 比 Y : 的实际值高 。 如果经过分析可以肯定今后几年 内布鞋销售量 总 的趋势是上升的 , 但是 由于 1980 年和 1981年两年销售量有所下
23、 降 , 即使 上升了 , 也 _上升不 到按预测模型计算所 得的数 值 , 则可将预测 发展线 向下移动 到穿过 Y :; 点 , 分别得出预测模型 Y : : 十, = 3 3 0+16 . 9 5 T 和 Y ,十T二 3 3 0+24 . 7 8 T 。 这表明今后l L J年内 的布鞋销售量将以 33 0 万双为起点 , 每年平均 增加 1 6 . 9524 . 7 8 万双 。 表四 某市布鞋销售量 (万双) 期的预测值相乘 , 即得预测 目标的预测值 。 例如某省为搞好今后应新增多少化肥生产 能力的规划 , 需要预测全省化肥总需求 量 Y 。 它等于全省耕地面积 S 乘以每亩耕地
24、施用的平 均化肥量 q , 即 Y = S q 根据历史统计数据得知 , S 是 逐年 减 少 的 , 而 q 是逐年增加的 。 预测人员先用时间序 列预测法结合定性分析预测出今后各年的耕地 面积 S 和每亩耕地化肥用量 q , 然后再将对应 年份的 S与q 相乘 , 即 得 全省化肥 总需求量 Y 。 年份 销售量 销售量 年 份销售量 1965 1966 1967 196 8 1969 19 70 140 136 164 146 169 177 年份 1971 197 2 1973 1974 19 7 5 19 76 166 170 175 208 207 22 5 1977 197 8
25、1979 1980 1981 270 320 3 44 3 4 1 330 耘= T “犷bt T 、夕 ! 夸 冷 1,:= 冷 ,+比丁 图四 、 某市布鞋销售量变化图 八 、 把预测目标分解为两个 自变量 的乘积 有时可把预测 目标分解为两个 自变量的乘 积 , 先分别预测这两个 自变量 , 再将其对应周 九 、 先预测总量 , 再按各个分量 所占份额预测 各个分量 一种产品往往是 由若干个企业生产的 , 而 且有一种或更多种的 同类产品 , 当我 们需要预 测这样的产品的总需求量以及各企业 这种产品 的产量或销售量时 , 可以先预测总量 (总需求 量 、 总销售量 、 总产量或总产值)
26、 , 再按该产 品在同类产品总量 中所占的份额或某企业所占 的份额 , 确定该产品或某企业该产品需求量 (或销售量 、 产量 、 产值)的预测值 。 例如要预测某省营养药品销售量时 , 可以 采用一元回归法或平滑法 预测全省的 药品 总销 售量 , 再 按营养药品在药品总销售量中所占的 份额确定营养药品销售量的预测值 。 在预测中 , 如果 从统计数据看出预测目标 所占的份额比较稳定 , 则可由总销售量预测值 和 这一份额直接求得营养药品销售量 : 如果所 占份额不 同年份并不相同 , 而且按一定的规律 变化 , 则应先预测所占份额的数值 , 然后再由 相应年份的总销售量 和所占份额求得预测目
27、标 的 预测值 。 再如某城市各商场欲预侧今后几年本商场 自行车的销售量 , 则可通 过组织有关单位联合 调查 、 分析 、 预测该城 市今后几年内 各年自行 车总销售量 , 然后再 按各商场历年自行车销售 量占总销售量的份额计算各商场的自行车销售 量预测值 。 同样地 , 如果某商场所占份额是变 (畜次z 州 攀 餐若 哈城精 夕砧67 一 - 一 一 一 - -一 山一一叫.目. 6 9 71 方 万 77 7 9斤I 刀3 朽 化的 , 还应 预测它所占份额的数值 。 十 、 先预测主要的分量 , 再按其所 占 份额预测总量 如果某类产品中一种 (或几种) 产品的产 量(或销售量 、 需
28、求量 、 产值)占该类产品总 产量 (或总销售量 、 总需求量 、 总产值)的绝 大部份 , 则为了简化预 测工作 , 可 以只收集这 种 (或这几种) 产品的 数据进行预测 , 然后再 按它(或它们)所占的份额计算出该类产品 的 总产量等 。 例如要 预测全国有色金属总需求量时 , 如 果将好几十种有色金属的数据都收集来进行计 算 , 工作量必定 很大 。 由于经分析得知 铜 、 铝 、 铅 、 锌 这四种金属的消费量通常占有色金 属总消费量 的9 5 9 7 纬 , 因此 , 可 只收集这 四种金属消费量 的数据 , 以它们的和 Y / 作为 有色金属总消费量的代表 , 用一元回归法和平
29、滑法预侧今后各年的 Y 值 , 然后将 Y 的 预 测值除以 。 . 9 5 一0 . 9 7 , 即 可计算出全部有 色 金属的 总需求量预测值 。 取得小一些 。 但是初学预测者和初次接触某预 测目标者在实际预测中很难甚至无法一次就取 好 N 值或 a 值 。 要取好 N 或 a 值 , 主要是靠经验或试验 。 经验丰富又熟悉该预测目标的预测人员 , 有可 能较容易地取好 N 或 a 值 。 而在一 般情况下 , 可 以采 用 试验的方法 , 现 以取 a 值为例说 明 如下 。 例如要根据某产品 1 964一198 1 年销售量 的统计数据建立二次指数滑移法预测模型 。 试 验时 , 分别取 a= 0 . 1 0 , 0 . 20 , 0 . 3 0等数值 , 并假定 198 1年的数据还没有 , 只按 1 9 64 19 80 年的数据建立预测模型 , 再分别 按三 个 预测模型计算 1 98 1年的销售量 预测 值 , 并将 其与 1 9 8 1年实际销售量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国车用仪表制造市场深度分析及投资战略咨询报告
- 健康生活课件
- 萧山区指纹门禁管理办法
- 薪酬福利管理办法中体检
- 蛋糕店冷库管理办法细则
- 衡水土地合作社管理办法
- 医疗保障管理课件
- 装修质量保证金管理办法
- 西安市公用住房管理办法
- 覃塘区留守儿童管理办法
- 社区工作者考试(选择题200题)带答案
- 2025年高校教师资格证之高等教育心理学通关题库附带答案
- 2025至2030全球及中国隔膜式氢气压缩机行业项目调研及市场前景预测评估报告
- 社区上半年安全生产工作总结
- 2025年包头包钢集团招聘笔试备考题库(带答案详解)
- 初级保育员培训课件
- 2025年辽宁、吉林、黑龙江、内蒙古四省高考物理真题(含答案)
- DB4201∕T 694-2024 押运行业安全生产标准化基本规范
- 2025至2030中国精神病医院行业发展分析及发展趋势分析与未来投资战略咨询研究报告
- 装载机司机安全培训试题及答案
- 2025年河南省中考英语试卷及答案
评论
0/150
提交评论