数据分析指南.doc_第1页
数据分析指南.doc_第2页
数据分析指南.doc_第3页
数据分析指南.doc_第4页
数据分析指南.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析指南 Page 1 1 付録 1 品質特性 数据分析指南数据分析指南 数据分析指南 Page 2 2 付録 1 品質特性 目录目录 1 1 概述概述 3 1 1 数据分析的目的 3 1 2 整体思路 3 2 2 项目组数据分析指南项目组数据分析指南 3 2 1 进度 工作量 规模 成本 3 2 1 1 进度分析 3 2 1 2 工作量分析 4 2 1 3 规模分析 4 2 1 4 成本分析 4 2 2 质量 4 2 2 1 评审分析 4 2 2 2 测试分析 5 2 2 3 故障种类分析 5 2 2 4 品质评价图表 5 2 3 其他 5 3 3 综合数据分析指南综合数据分析指南 5 3 1 过程能力的分析 5 3 2 2 8 关键问题分析 6 3 3 趋势分析 6 3 4 潜在关系分析 6 3 5 原因分析 7 附录附录 1 1 结果分析图表结果分析图表 8 趋势图 8 直方图 8 排列图 PARETO图 9 因果图 9 散点图 10 控制图 10 附录附录 2 2 12 数据定义 12 1 工作量 12 2 进度 12 3 成本 12 4 规模 12 5 质量 12 6 其他 12 代码行计算标准 12 数据分析指南 Page 3 3 付録 1 品質特性 1 1 概述概述 1 11 1 数据分析的目的数据分析的目的 对于项目组来说 数据分析的主要目的是实时了解项目状态 验证计划执行情况 并 从数据分析中发现项目潜在的问题或风险 以便尽早采取应对措施 保证项目处于有效控 制之下 对于组织层来说 数据分析的主要目的是分析统计组织过程的能力 为项目组做 估计时提供依据 并作为过程改进的基础 1 21 2 整体思路整体思路 对于项目组来说 数据分析主要从三个纬度进行分析 1 进度 工作量 规模 成本 2 质量 3 其他 其中进度 工作量 规模 成本和质量是反映项目成功的关键参数 同时 也是组织最关注的指标 而其他纬度的数据 主要作为数据分析时的参考 本文描述的项目层的分析思路或者分析角度主要有 a 比较计划和实际的数据 验证计划执行情况并发现实际执行中的偏差 b 将偏差与项目阈值或者组织能力上下限进行比较 发现偏离控制范围的点并 找出根本原因 采取应对措施 c 单一的分析并不能完全判断出过程是否稳定可控 还需要根据数据之间的相 互联系结合其他角度或维度的数据分析来辅助判断项目的状态 以便发现潜 在的可能超出控制范围的问题 另外数据还需要进行综合分析 方法主要分成以下 5 种 a 通过控制图对过程能力进行分析 b 通过分布图或排列图情况对问题的等级进行分析 c 通过趋势图分析变化趋势 d 通过散点图分析两类数据的潜在关系 e 通过因果图分析问题产生的原因 注意 各分析工具的介绍请参见附录一 2 2 项目组数据分析指南项目组数据分析指南 2 12 1 进度进度 工作量工作量 规模规模 成本成本 进度 工作量和规模这三者是相互关联的 因此在分析每个指标的同时 可以结合其 他两个指标来辅助判断项目的状态 确定项目可能存在的问题 2 1 12 1 1 进度分析进度分析 分析角度 计划与实际进度的比较 进度偏差率与进度控制阈值的比较 分析说明 进度的跟踪分为 各阶段进度的跟踪和各任务进度的跟踪 利用干特图 或其他形式的图表 跟踪各任务的进度 当计划进度和实际进度产 生偏差并超出控制界限时 需要分析原因 并及时解决问题 每个阶段结束时 比较本阶段的计划进度和实际进度 当实际与计划进度有偏差 时 计算出进度偏差率 并将进度偏差率与进度控制阈值进行比较 检查进度偏 差是否处在控制范围内 进度阈值是为项目设定的进度偏差的控制限 如果进度偏差在阈值范围内 则认 为项目进度处于统计控制之下 如果进度偏差超过了阈值 则说明进度偏离了控 制 需要对偏差进行原因分析 找出影响进度的可能原因 数据分析指南 Page 4 4 付録 1 品質特性 使用趋势图比较各阶段进度的偏差趋势 如果偏差处于逐渐增大的趋势 可能预 示着过程有失去控制的风险 因此也需要对这种逐渐增大的趋势进行原因分析 找出导致偏差逐渐增大的原因 以便提前采取措施避免可能发生的进度超出控制 范围的风险 可以使用因果图列举出造成进度偏差的可能原因 再分析这些原因影响的优先级 可以使用 Pareto 图对原因进行优先级的排序 以便确定导致问题的主要原因 并 采取应对措施 产生进度偏差的可能原因 计划有问题 人员有问题 工作有问题 沟通有问题 风险发生 由外部因素引起问题 其他原因 注 进度受到工作量投入的影响 也可以通过产品规模的完成情况来反映 同时由于 质量问题也会严重影响进度的完成 因此在进行偏差原因分析时需要注意结合这些相 关因素来进行 2 1 22 1 2 工作量分析工作量分析 分析角度一 计划与实际工作量的比较 工作量偏差率与工作量控制阈值的比较 分析说明 工作量的分析和进度分析的方法是一样的 也分为各任务工作量的分析和各阶段 工作量的分析 具体可以参见进度分析 2 1 32 1 3 规模分析规模分析 分析角度一 比较计划与实际的产品规模 比较规模偏差率和规模控制阈值比较 分析说明 当计划与实际存在偏差时 比较规模偏差率与相应的规模控制阈值 检查偏差是 否处在控制范围内 如果偏差超出了控制范围 除了进行原因分析外 要将其作为进度和工作量偏差 的可能原因输入 来辅助分析进度和工作量的偏差 考虑从控制规模上来控制进 度和工作量 2 1 42 1 4 成本分析成本分析 分析角度一 比较计划与实际的总成本 比较成本偏差率和成本控制阈值比较 分析说明 当计划与实际存在偏差时 比较成本偏差率与相应的成本控制阈值 检查偏差是 否处在控制范围内 如果偏差超出了控制范围 需要进行原因分析外 2 22 2 质量质量 质量指标通过测试 评审以及缺陷的分布情况来表示 2 2 12 2 1 评审分析评审分析 评审故障检出率反映了被评审工作成果的质量状况 而评审准备速度和评审速度从另 一个方面反映了评审过程的有效性 使用这两个参数可以辅助分析缺陷清除过程的有效性 数据分析指南 Page 5 5 付録 1 品質特性 进而帮助判断阶段质量目标的达成情况 分析角度 评审故障检出率与质量目标相比较 分析说明 当评审故障检出率在质量目标范围之内时 说明工作成果的质量水平达到了预计 的目标 另外 此时还可以考虑评审速度和评审准备速度 看是否评审的充分的 当评审故障检出率超出质量目标或未达到质量目标时 需要进行原因分析 分析 的结果有两种 第一 当前质量状况正常 符合实际情况 不需要再次评审 第 二 当前质量状况不正常 需要再次评审 2 2 22 2 2 测试分析测试分析 测试故障检出率反映的代码的质量状况 而测试密度和测试速度反映了测试过程的有 效性 分析角度 测试故障检出率与质量目标相比较 分析说明 当测试故障检出率在质量目标范围之内时 说明代码的质量水平达到了预计的目 标 另外 此时还可以考查测试速度和测试密度 以此判断测试是否充分 当测试故障检出率超出质量目标或未达到质量目标时 需要进行原因分析 分析 的结果有两种 第一 当前质量状况正常 符合实际情况 不需要再进一步测试 可以进入下一阶段 第二 当前质量状况不正常 需要进一步的测试 2 2 32 2 3 故障种类分析故障种类分析 分析角度 对故障种类的分布数据进行分析 分析说明 故障种类的区分原则有很多种 例如可以按 用例 缺陷的原因 重要程度 类 型等 计算出各类故障的分布情况后 可以使用排列图或饼图来标识出产生 80 故障的 种类 并分析其产生的原因 以作为改进项目质量的入口点 2 2 42 2 4 品质评价图表品质评价图表 分析角度 对评审和测试的结果进行分析并做出评价 分析说明 使用直方图 折线图 散点图对评审和测试的品质状况 故障趋势 测试覆盖 测试密度 故障密度 状况进行分析 2 32 3 其他其他 包括风险数据 悬案数据 变更数据 项目支持过程数据 培训数据等等 风险数据 的分析可以参见 风险管理过程 培训数据的分析定期由公司级的培训小组进行统计 3 3 综合数据分析指南综合数据分析指南 3 13 1 过程能力的分析过程能力的分析 分析目的 统计过程各项指标的能力 为项目估计提供参考 并为过程改进提供 依据 分析方法 一般般采用控制图进行分析 步骤如下 a 通过统计学方法 XmR 计算样本值的均值和上下限值 数据分析指南 Page 6 6 付録 1 品質特性 b 对均值和上下限进行合理性调整 c 画出控制图 d 观察异常模式 e 分析异常模式产生的原因 特殊原因和共同原因 f 剔除异常 形成能力指标值 作为项目估计的参考数据之一 g 根据以上分析的结果 列出需要解决的问题列表 h 从问题的普遍性 严重性 紧急性等方面给问题分等级 从中选出最需解决 的问题 作为过程改进的目标 适用范围 此分析方法适用与所有能力指标 也就是 测量集 中列出的组织级 测量项 3 2 23 2 2 8 8 关键问题分析关键问题分析 分析目的 把数据按一定准则进行分类 找出关键的类别 分析方法 一般般采用饼图和排列图进行分析 步骤如下 1 统计各项分布数据的均值 2 画出饼图和排列图 3 从图中观察比例占 80 少数数据类型 4 分析产生这 80 数据的原因 5 根据原因列出问题 6 从问题的普遍性 严重性 紧急性等方面给问题分等级 从中选出最需解决的 问题 作为过程改进的目标 适用范围 缺陷种类的分布 按用例 按试样 按功能 按类型 按阶段 按严 重程度等 工作量阶段分布 工作量过程分布 各过程裁减次数的比较 各过程 NC 次数的比较等等 3 33 3 趋势分析趋势分析 分析目的 通过与以前数据 多个 的比较 观察指标的变化趋势 分析方法 一般趋势图进行分析 步骤如下 1 统计当前指标值 并收集历史指标值 2 以时间为横轴画出趋势图 3 从图中观察指标变化的趋势 4 如果存在明显的趋势 需要进一步确定是好的趋势还是坏的趋势 5 对趋势产生的原因进行分析 6 根据产生的原因 有选择的采取措施 保持好的趋势 抑制坏的趋势 适用范围 适用于各项指标 尤其是效率类 偏差类以及客户满意度指标 3 43 4 潜在关系分析潜在关系分析 分析目的 找出两个指标间的关系 分析方法 一般采用散点图进行分析 步骤如下 1 假设两种存在关系的指标 2 以各项目数据为样本值 画出散点图 3 从图中观察两种指标的潜在关系 4 如果从图中能明显看出两者存在关系 线性和非线性 继续下一步 5 通过回归分析 线性回归和非线性回归 确定两者的函数关系 此步比较复 杂 可以采用最简单的趋势分析来代替 例如 正比增长关系 负比增长关系等 数据分析指南 Page 7 7 付録 1 品質特性 6 确定两者关系以后 可以考虑通过改变某一指标的投入情况来影响另外一个指 标 适用范围 适用于一切可能存在直接或间接关系的测量项 例如 质量成本与客 户满意度 需求变更次数与生产率 测试工作量与生产率等 3 53 5 原因分析原因分析 分析目的 分析导致特定结果的各种因素 并对各因素规类 分析方法 一般采用因果图 鱼骨图 进行分析 步骤如下 1 确定特定的结果 2 确定影响结果的大的因素 3 细化大因素 注意 确定因素时可以采用头脑风暴的方法 适用范围 适用于所有原因分析 数据分析指南 Page 8 8 付録 1 品質特性 附录附录 1 1 结果分析图表结果分析图表 当我们对收集到的数据进行分析时 需要将这些数据进行分类和整理 并使用一些特 定的工具来组织和总结数据以便寻找趋势以及相互关系 下面就对一些常用的分析工具进 行简单的介绍 趋势图趋势图 趋势图是专用于时序形式的散点图 可以快速的检查数据在整个时间出现的趋势或其 他模式 趋势图可以用来监控一个过程 看它是否有明显的趋势 或它的行为是否以其他 的方式在改变 产品生产能力 产品大小 班组规模 发现的缺陷数目 积压的工作 累 计或每天的资源消耗量 这些观测值都是趋势图处理的对象 趋势图能够清楚地显示任何 按间隔或比例来标度变量的行为 如 工作量偏差有逐渐增大的趋势 直方图直方图 直方图用于显示以经验为主的观察分布 它显示了事件在整个一系列给定的观察值上 或一段时间内发生的频率 直方图可以用于刻画几乎任何产品或过程的属性值 例如模块 大小 缺陷修复时间 每次评审发现的缺陷数等 它还有助于揭示在整个过程 项目产品 的差异 如 柱体的高度与每个单元中出现的次数成比例 0 2 4 6 8 10 12 14 16 18 20 384042444648505254 产品服务人时数 天数 数据分析指南 Page 9 9 付録 1 品質特性 排列图 排列图 ParetoPareto 图 图 是直方图一种特殊形式 该图根据问题 原因和操作数量 发生的频率或影响把它们 分为不同的等级 按级别进行排列 有助于判断行为或改进机会的优先级 它是从 大量 的无关紧要的问题 中突出 少数几个至关重要的问题 的一种有用的技术 如 工作量的分布图 0 00 10 00 20 00 30 00 40 00 50 00 60 00 制造测试需求设计其他 0 00 20 00 40 00 60 00 80 00 100 00 120 00 因果图因果图 因果图是用来探测和展示问题 后果 与它可能的原因之间的关系图 它是由 Ishikawa 在 1943 年发明的 所以也被称为 Ishikawa 图 又因为它看起来像鱼的骨骼 通 常也被称为鱼骨图 这种图通常是在持有不同观点的人一起讨论期间进行绘制 如 方法 标准不存在 没定义检查过程 人员 不存在角色培 训和如何指导 检查 决策结果不可见 成果没有交流 输入 目标不明确 没有质量改进目标 工具 不存在标准 不知道或不理解成本 利益信息 没有维护的历史信息 许多软件工作产品 没有被检查 数据分析指南 Page 10 10 付録 1 品質特性 散点图散点图 根据经验显示过程的两个特征之间的关系 绘制点的模式可能表明两个因素间有联系 例如因果关系 如果条件具备 也就是说如果存在一个偶然原因的恒定系统 散点图是回 归分析的自然预报器 它能更准确的揭示数据之间的相互联系 但是它的局限性在于通常 只能处理两个变量 如 表示了一个变量相对于另一个变量是如何表现的 工作量 人月 与规模 kstep 0 50 100 150 200 250 300 350 400 450 020406080 规模 kstep 工作量 人月 控制图控制图 典型的控制图如下所示 控制上限 UCL 中线 CL 控制下限 LCL CL CL 3 CL 3 时间 或者时序号 控制图都有一条中心线 并在中心线的两侧有控制限 中心线和界限都代表了计算的 评估 计算该评估所用到的一组观察值是在过程运行时采集的 它用于判断观察值是否处 在统计控制范围内 研究说明 处在控制上下限内的数据之间的偏差是由于过程本身的原 因 即公共原因 引起的 反映了过程的正常结果 而落在控制上下限之外的数据是由于 可预防的偶然原因引起的 它反映了过程的不稳定性 需要进行原因分析 找到这个偶然 原因并进行排除 从而保证过程的稳定性 可控性和可预测性 如 下图表示了一个稳定 的过程观察值 数据分析指南 Page 11 11 付録 1 品質特性 数据分析指南 Page 12 12 付録 1 品質特性 附录附录 2 2 数据定义数据定义 1 1 工作量工作量 工作量 用人时 人日 人周 人月表示 1 人日 7 5 人时 1 人周 5 人日 1 人月 20 人日 工作量估算偏差 估算值 实际值 实际值 2 2 进度进度 项目周期 用日历天 日历周 日历月表示 项目周期是从项目正式开始 项目开始 日期 到交付给客户 项目结束日期 的时间 日历天数 项目进行中 进度估算偏差 最新估算结束日期 最初估算结束日期 最新估算 结束日期 开始日期 1 项目结束时 进度估算偏差 项目结束日期 最初估算结束日期 项目结束日期 开始日期 1 3 3 成本成本 项目成本 这里关注的成本是项目受注书中的直接成本 成本估算偏差 估算值 实际值 实际值 4 4 规模规模 文档规模 用页数表示 代码规模 用 Kstep 表示 不同的语言需要分别收集统计 代码行 LOC 的定义以及计 算标准请参见下面的 代码行计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论