




已阅读5页,还剩99页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 苏勤 2014.112014.11 数据分析在数据分析在GMP 实施中的应用实施中的应用 2 我国药企面临的挑战 和机遇 我国药企面临的挑战 和机遇 3 我们面临我们面临“大数据大数据”时代的挑战时代的挑战 “数据,已经渗透到当今每一个行业和业务职能领域,成为重要 的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生 产率增长和消费者盈余浪潮的到来。” -麦肯锡 “数据,已经渗透到当今每一个行业和业务职能领域,成为重要 的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生 产率增长和消费者盈余浪潮的到来。” -麦肯锡 “大数据大数据”时代已经降临,在商业、经济及其他领域中,决策将日 益基于数据和分析而作出,而并非基于经验和直觉。 时代已经降临,在商业、经济及其他领域中,决策将日 益基于数据和分析而作出,而并非基于经验和直觉。 - 纽约时报纽约时报 4 数据是实施GMP管理的支持数据是实施GMP管理的支持 数据是一种观测值,是实验、测量、观察、 调查等活动中以数量的形式给出的结果。 数据分析是企业有目的地收集数据、分析数 据,使之成为信息的过程。这一过程是在产品 的整个生命周期的支持过程;是是实施GMP管理 的支持,是建立并实施高质量的药品质量体系 的支持过程。 5 10版GMP已步入到国际GMP的轨道10版GMP已步入到国际GMP的轨道 嵌入了风险管理内容最新的质量风险管理 理念 嵌入了风险管理内容最新的质量风险管理 理念,已经上升到质量管理体系的层面 质量管理体系已成为 已经上升到质量管理体系的层面 质量管理体系已成为10版版GMP的核心内容 科学地评估风险管理和质量管理体系 有效性均需要数据分析的方法 的核心内容 科学地评估风险管理和质量管理体系 有效性均需要数据分析的方法 产品质量稳定与注册标准的一致性 6 数据是信息的载体。 数据统计:是数据转为信息的加工过程,统计 技术是企业质量体系中的一个重要要素。分析数 据,控制过程中的异常,坚持不懈地持续改进, 提高产品质量,提升企业的核心竞争力。 数据统计分析 -质量管理体系的支持过程 数据统计分析 -质量管理体系的支持过程 7 分析和改进。 工序调节, 掌握现状, 工序管理, 检查和评价, 数据是企业的无形资产数据是企业的无形资产 8 数据分析的类型数据分析的类型 数据分析的有关基础知识数据分析的有关基础知识 描述性数据分析 推断性数据分析 验证性数据分析 描述性数据分析 推断性数据分析 验证性数据分析 是对一组数据的 各种特征的分析, 以便描述测量样本 的各种特征及其所 代表的总体的特 征。 也叫探索性 数据分析,是为 了形成值得假 设的检验而对 数据进行分析 的一种方法。 是对社会调查 数据进行的一种 统计分析。通过 因子间的关系是 否符合研究者所 设计的理论。 9 可以连续取值 的数据, 计数值数据计量值数据 数据的 类型 定量数据的分类定量数据的分类 不能连续取值 的数据, 当数值是百分率时,取决于给出数值的数学式分子。分子为计量值, 则求得的百分率是计量值;如分子为计数值,求得的百分率虽不是 整数但也属于计数值。 当数值是百分率时,取决于给出数值的数学式分子。分子为计量值, 则求得的百分率是计量值;如分子为计数值,求得的百分率虽不是 整数但也属于计数值。 10 值得注意的概念值得注意的概念 总体:指所要研究对象的全体; 个体:指组成总体的每一个基本单位; 样本:从总体中随机抽出的一部分样品。 样本中所包含样品数目称为样本大小, 又叫 样本量,常用n表示。 数据的特征值数据的特征值 位置特征量: 子样平均值 子样中位数 差异特征量: 极差 R=XmaxmaxXmin 标准差 相对标准差 数据的特征值计算可用Excel 一步到位。 x n 1i iX n 1 X 1 )( 2 n xx s i %100 X S RSD 12 实例11对气相层析的实验人员进行技术考 核,进样10次,每次0.5l,得色谱峰高 (mm)为: 142.1 147.0 146.2 145.2 143.8 146.2 147.3 150.3 149.9 151.8 S=3.00 RSD=2.04% 有经验的色谱工作人员很容易将RSD控制在1% 以内, 可认为该实验人员的技术还不够稳定 , 操作不够熟练。 98.146x 13 平均平均 标准误差 中值 模式 标准偏差 样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度(95.0%) 用Excel进行 描述统计的 项目 14 实例1.doc实例1.doc的统计数据的统计数据 15 实例实例1:法二三个软件法二三个软件统计计算统计计算.exe 软件软件的计算的计算 16 用带统计功能(2ndF)计算器的计算用带统计功能(2ndF)计算器的计算 17 操作: ON-2ndf-C -X1-M+-X2Xi -得、得、S 、n 或或-2ndf - 得 、 得 、 X 、 X 2 X 2ndf -第二功能健第二功能健 18 让数据分析的数据有质量 让数据分析产生价值 让数据分析的数据有质量 让数据分析产生价值 数据分析的前提是保证数据的质量数据分析的前提是保证数据的质量 19 抽取数据的方法 不好; 数据的抄写、计 算错误; 异常值取不到的 数据。 虚假的数据错误的数据虚假的数据错误的数据 原因 数据的来源: 历史的,现在的。 不要轻信数据不要轻信数据 数据与事实不符; 人为的虚假数据; 经过修改的数据; 因无知造成的错 误数据。 数据分析的基础数据分析的基础 制药生产现场的数据是分析的基础。 生产工序的稳定是收集可靠数据的前提。 抓住生产现场的六大因素是生产的关键。 21 算:特征数 比:统计值 找:相关因素看:动态变化 22 数据分析的前处理数据分析的前处理 -数值的修约( (GB/T8170-2008)GB/T8170-2008) 四舍六入五考虑, 五后非零则进一, 五后全零看五前, 五前偶舍奇进一, 不论数字多少位, 都要一次修约成。 注:英美日药典方法修约时,按四舍五入 23 试验运算中,应比规定的有效数字多保留一 位数,后根据有效数字的修约进舍至规定有 效位。 标准差一般二位有效即可,最多保留小数后二 位。 修约的位数修约的位数 一 .一 .按美国EJ鲍尔推荐的方法进行处理。步骤 如下: 1.计算这群检测值的平均值 2.计算极差R 3.计算可疑值Xi与平均值之差的绝对值,再 用极差R除,得出ti,与规定附表的临界值比较, 若ti比表上的t值大,则应弃去此可疑值。 数据的筛选方法数据的筛选方法 注:用公式t=|X-|/R计算 t,如计算值超过表上的 值时,则所调查的值是无效的。此概率约为0.95。 实例22某分析者对一样品检测,得(1)93.3(1)93.3,(2)93.3,(2)93.3 ,(3)93.4,(3)93.4,(4)93.4,(4)93.4,(5)93.3,(5)93.3,(6)94.0,(6)94.0。 问:第六个结果有效吗? 0.600.640.690.760.861.051.53t 9876543n X 0.460.500.510.520.540.560.58t 20151413121110n 附表如下:抛弃无效测量的临界值附表如下:抛弃无效测量的临界值 注:用公式t=|X-|/R计算 t,如计算值超过表上的 值时,则所调查的值是无效的。此概率约为0.95。 实例22某分析者对一样品检测,得(1)93.3(1)93.3,(2)93.3,(2)93.3 ,(3)93.4,(3)93.4,(4)93.4,(4)93.4,(5)93.3,(5)93.3,(6)94.0,(6)94.0。 问:第六个结果有效吗? X 26 解:1.计算方法六个结果的平均值 93.45 2.计算极差R94.093.30.7 3.计算可疑值与平均值之差的绝对值 再用极差除:ti|X|R (94.0-93.45)0.70.79 4.与临界值t=0.76 (n6) 比较 ti0.79t=0.76 94.0是一个离群数据, 应舍弃. X X 27 二 . G-检验法(格鲁布斯法) 步骤: 1.算出包括可疑值在内的平均值; 2.计算可疑值与平均值之差; 3.算出包括可疑值在内的标准偏差; 4.用标准偏差除可疑值与平均值之差, 得G值; 5.查G的临界值表,若计算的 G 值大于查 到的值,就可把可疑值舍弃。 S XX G 28 实例2解法二解法二 查表G( 6, 0.05 ) =1.89 G = 2.04G( 6, 0.05 ) =1.89 所以这个数应舍去。 查表G( 6, 0.05 ) =1.89 G = 2.04G( 6, 0.05 ) =1.89 所以这个数应舍去。 04. 2 27. 0 45.930 .94 S XX G 29 质量特性值的正态分布质量特性值的正态分布 绝大多数质量特性值服从或近似服从正态分布。 正态分布的中央点(均数)最高,然后逐渐向 两侧下降;以均数为中心,两端对称;永远不 会与 X X 轴相交的钟形曲线; 99.73% 3.0 99.00% 2.58 95.45% 2.0 95.00% 1.96 68.26% 1 50.00% 0.67 机率范围 30 异常波动 由随机原因引起 的产品质量波动 由系统原因引起的 产品质量波动; 引起波动的原因- 5M1E:5M1E:人、机、料、 法、测、环。 产品质量波动产品质量波动 正常波动 生产过程在控制中, 呈稳定状态 生产过程在失控中, 呈不稳定状态 31 第二类错误:把质量坏 的一批成品当作质量好 的一批成品去看待、处 理的错误; : 第 二 类 错 误 的 概 率 值,也叫第二类错误的 风险率。 第一类错误:把质量好 的一批成品当作质量 坏的一批成品去看 待、处理的错误; :第一类错误的概率 值,也叫第一类错误 的风险率。 统计分析的两类错误和风险统计分析的两类错误和风险 弃真错误纳伪错误 32 抽样检验是由样本的质量状况去推断总体的质量是要 冒风险的。 生产方风险(PR):对于给定的抽样方案,当批产 品或过程质量水平(如不合格品率)为某一指定的 可接收值(如可接受质量水平)时的拒收的概率, 即把质量好的批产品判为不合格,用表示。 使用方风险(CR):对于给定的抽样方案,当批产 品或过程质量水平为某一指定的不满意值(如极限 质量水平)时的接收概率,即把质量差的批产品判 为合格,使用方风险一般用表示 。 药品抽样检验的风险药品抽样检验的风险 33 正确抽取样本, 为测定数据 奠定基础 样本要有代表性:要代表总体,如果 做不到这一点 ,将导致对总体特性 作出不良估计。 样本也会产生误差:即使样本代表总 体,但从样本得到的信息也会产生一 定程度的误差,这种误差的大小可通 过增大样本量来减小但却不能消除。 样本要有代表性:要代表总体,如果 做不到这一点 ,将导致对总体特性 作出不良估计。 样本也会产生误差:即使样本代表总 体,但从样本得到的信息也会产生一 定程度的误差,这种误差的大小可通 过增大样本量来减小但却不能消除。 关于样本关于样本 34 百分比抽样的不科学性百分比抽样的不科学性 在百分比抽样中,在相同的批不合格品 率的情况下,产品批量越大,则批的接 收概率越小,产品批量越小,则批的接 收概率越大,即“大批量严,小批量宽”, 不能正确鉴别批产品的质量水平,所以, 这是一种不科学的抽样检验方法, 工业发 达国家早已淘汰。 35 在统计数据描述的 基础上立新功, 对所 反映的问题再进行 分析解释和作出推 断性结论的技术。 控制图(分析用图), 回归分析, 假设检验. 描述性统计技术推断性统计技术 用来对统计数据 进行整理和描述 的技术。 折线图,饼分图, 散点图,因果图 树图,排列图, 统计分析统计分析 过程控制所用的技术:正交试验,过程能力,控制 图(控制用图), GMP实施中常用的数据分析工具GMP实施中常用的数据分析工具 36 寻找影响产品质量的主要问题寻找影响产品质量的主要问题排列图排列图6 对主题构成因素进行系统分析展开 6 对主题构成因素进行系统分析展开树图树图5 判断生产过程是否异常及导致异常的因素 5 判断生产过程是否异常及导致异常的因素控制图控制图6 分析原因与结果的关系,找到问题的原因 6 分析原因与结果的关系,找到问题的原因因果图因果图4 判断两个质量因素之间的相关性 4 判断两个质量因素之间的相关性散点图散点图3 表示一个系统中各部分所占比率 3 表示一个系统中各部分所占比率饼分图饼分图2 直观地表现出数据的变化趋势 2 直观地表现出数据的变化趋势折线图折线图1 作用名称序数 1 作用名称序数 常用质量分析图的应用常用质量分析图的应用 37 强正相关强正相关 0 2 4 6 8 10 12 14 16 18 0 1 2 3 4 5 6 7 8 9 1011121314151617 X Y 强负相关强负相关 0 2 4 6 8 10 12 14 16 18 0 1 2 3 4 5 6 7 8 9 1011121314151617 X Y 散点图散点图 又称相关图。是研究成对出现的两组相关数 据之间相关关系的简单图示技术。用来发现、 显示和确认两组相关数据之相关关系,并确 定其预期关系。 38 不相关不相关 0 2 4 6 8 10 12 14 16 18 0123456789 10 11 12 X Y 非直线相关非直线相关 0 2 4 6 8 10 0123456789 10 11 12 X Y 弱正相关弱正相关 0 2 4 6 8 10 12 14 16 18 0123456789 10 11 12 X Y 弱负相关弱负相关 0 2 4 6 8 10 12 14 16 18 0123456789 10 11 12 X Y 39 抓住生产现 场的六大 因素 人人料料 法法 环环测测 机机 因果图因果图 又名特性要因图,表示结果(特性)与原因(影响特性 的要因)之影响情形或两者间关系之图形。定性寻 找引发结果的原因。 40 帕累托原理: 关键的少数; 次要的多数 分析:通常占总频数80%以 上的 项目是主要问题,占 总频数 10%以上的项目是 次要 问题 ,余下的占总 频 数 10%左右的项目是更 次要的一般问题。 排列图排列图 又叫帕累托图。它是将质量改进项目从最重要 到最次要顺序排列而采用确定主导因素的一种 图表。 控制图控制图 控制图是对过程质量特性值的数据进行分析和判断 工序是否处于稳定状态所使用的带有控制界限的 图。从而监察过程是否处于控制状态的一种用统计 方法设计的图。 作用: 对生产过程进行监控发现异常,及时告警 控制图的种类: 分析用控制图 控制用控制图 其结构:中心线 CL 上控制线 UCL 3s 下控制线 LCL 3s X X X 42 MOONKY 主要分析: 1.所分析的过程 是否处于统计 控制状态? 2.该过程的过程 能力指数是否 满足要求,达到 技术稳态。 须将过程调整 到技术稳态。 当过程达到了所 确定的状态后, 才能将分析用控 制图的控制线作 为控制用限。 进入日常管理后 关键是保持所确 定的状态。 分析用控制图 控制用控制图 控制图-控制图-过程控制的核心手段过程控制的核心手段 控制界限就是区 分偶然波动与异 常波动的科学界 限。 43 0.090.440.150.040.350.160.260.010.090.440.150.040.350.160.260.01移动极差RS 98.1198.0298.4698.3198.2797.6297.4697.7298.1198.0298.4698.3198.2797.6297.4697.72含量 24232221201918172423222120191817批号 0.290.110.730.410.210.060.060.180.290.110.730.410.210.060.060.18移动极差RS 97.7397.4497.5598.2897.8798.0898.0298.0897.7397.4497.5598.2897.8798.0898.0298.08含量 161514131211109161514131211109批号 0.840.90.070.090.130.360.07-0.840.90.070.090.130.360.07-移动极差RS 97.997.0697.9697.8997.897.6797.3197.2497.997.0697.9697.8997.897.6797.3197.24含量 8765432187654321批号 实例实例3某制药企业生产XX链霉素,X年X月的含量 (%)(%)控制如下表,分析本月的生产控制情况。 44 X链霉素含量控制图 96 96.5 97 97.5 98 98.5 99 135 7911 131517 192123 批号 含量% 0 0.2 0.4 0.6 0.8 1 1357911131517192123 批号 RS 45 实例3.doc实例3.doc用EXCEL统计的图表用EXCEL统计的图表 46 控制图的异常判定准则控制图的异常判定准则 -GBT4091-2001,ISO8258:1991-GBT4091-2001,ISO8258:1991 点出界, 界内点排列不随机, 一点落在A区外, 连续9点落在中心线同一侧, 连续6点递增或递减, 连续14点中相邻点上下交替, 连续3点中有2点落在中心线同一侧的B区以外, 连续5点中有4点落在中心线同一侧的C区以外, 连续8点在中心线两侧,但无一在C区中, 连续15点在C区中心线上下。 47 GBT4091-2001的判异准则的判异准则1 UCL LCL X A B C C B A 一个点落在一个点落在A区以外区以外 48 判异准则判异准则2 UCL LCL X A B C C B A 连续连续9点落在中心线同一侧点落在中心线同一侧 49 判异准则判异准则3 UCL LCL X A B C C B A 连续连续6点递增或递减点递增或递减 50 判异准则判异准则4 UCL LCL X A B C C B A 连续连续14点中相邻点交替上下点中相邻点交替上下 51 判准异则5判准异则5 UCL LCL X A B C C B A 连续连续3点中有点中有2点落在中心线同一侧的点落在中心线同一侧的B区以外区以外 52 判异准则判异准则6 UCL LCL X A B C C B A 连续连续5点中有点中有4点落在中心线同一侧的点落在中心线同一侧的C区以外区以外 53 判异准则判异准则7 UCL LCL X A B C C B A 连续连续8点落在中心线两侧且无一点在点落在中心线两侧且无一点在C区内区内 54 判异准则判异准则8 UCL LCL X A B C C B A 连续连续15点落在中心线两侧的点落在中心线两侧的C区内区内 55 正交试验设计 - 正交试验设计 -JB/T7510-1994 一种结构化的有组织的方法,用于确定工艺影响因 素与工艺产出之间的联系。也被称为“实验设 计”。-ICH 原理:利用数理统计的观点,运用正交性原理,从大 量的试验点中,挑选适量的具有代表性典型性的试 验点,用正交表来合理安排试验的一种方法。 用途:正交试验就是利用正交表的特点进行研究 试验,找出最佳工艺条件为生产奠定基础。 56 正交表与正交设计正交表与正交设计 正交表是一种现成的规格化的表,它能使每次试 验的因素及水平得到合理的安排,是正交设计的基本 工具。 表中数码个数 (因素的水平数) 表的列数 (最多可安排的因素个数) L9 9( 34 ) 正交表符号表的行数 (试验次数) 58 1.明确试验目的,确定考核指标挑因素、选水平 (位级)、制定因素位级表 3.确定试验方案表,按规定条件进行试验 4.对试验数据进行统计分析 5.对比各试验方案的试验结果, 6.确定最佳的试验方案 明确试验目的,确定考核指标挑因素、选水平 (位级)、制定因素位级表 3.确定试验方案表,按规定条件进行试验 4.对试验数据进行统计分析 5.对比各试验方案的试验结果, 6.确定最佳的试验方案 2.选择合适的正交表2.选择合适的正交表 正交试验应用程序正交试验应用程序 59 正交试验的数据分析方法正交试验的数据分析方法 1. 1.极差法 计算各因素各水平的试验结果极差,确定因素 主次,再选最优组合,得最优试验条件 2. .方差法 对试验数据进行多个正态总体均值比较,以因 素的F值与临界值F比 ,按所得的 F范围, 来决定各因素的影响程度。 60 L9(34)正交表正交表.xls的处理方法的处理方法 61 实例实例4某制药企业为提高潘生丁环收率,对其工艺 进行改进。选择了3个因素:反应温度(A) , 反应时 间(B) ,投料比(C) ,各因素均取3个水平,通过试验试 找最佳工艺条件。 1:2.0101203 1:1.681102 1:1.261001 投料比投料比(mol/mol) C 反应时间反应时间(h) B 反应温度反应温度() A 因素因素 水平水平 62 用正交表安排试验的结果 )3( 4 9 L 57.0 12339 43.2 31238 62.1 231 57.0 12339 43.2 31238 62.1 2313(120)7 39.0 21326 73.7 13225 40.0 321 7 39.0 21326 73.7 13225 40.0 3212(110)4 71.6 3 4 71.6 33(1:2.0)3(10h)13 58.2 2 13 58.2 22(1:1.6)2(8h)12 40.9 1 12 40.9 11(1:1.2)1(6h)1(100)1 收率 1 收率CBA因素 结果4321列号 因素 结果4321列号 试验号试验号 用用Excel做实例做实例4.doc的方差分析的方差分析 最佳工艺为A A1 1B B2 2C C3 3 100,8hr,1:2.0100,8hr,1:2.0 各因素的主次顺序为C B AC B A 过程指数过程指数 过程性能指数PP: 用来表示过程初始或实时的能力,用以分 析、判断过程即时的能力状态. 看指数,坚持不断地改进, 控制得更好。看指数,坚持不断地改进, 控制得更好。 过程能力指数CP: 用来表示过程能力满足规范的程度,以 便分析、判断过程能力状态. 2 1 64 两种过程指数的比较 离线判断过程在线检测过程检测状态 可以间断,连续连续性数据要求 1.671.331.671.33参数要求 实时过程性能与 初始过样能力 周期性的过程评价用途 看数据显分布,是 否近似正态分布 判断过程稳态下的波 动是偶波还是异波 目的意义 直方图控制图图形表达数 过程初始或实时 能力 过程固有能力含义 过程性能指数PP过程能力指数Cp 名称 对 比 内 容 65 过程稳定状态的含义 1. 原材料或上道工序的产品符合标准要求; 2. 过程按标准操作规程实施,并能控制影响过 程的各主要质量因素(如操 作者、设备、工 装、环境)且不存在异常的条件下进行; 3. 过程的结果按标准要求进行检测正常。 66 u T lu TTT Mx l T T k 2 2 lu TT M 中心偏移量 偏移系数 中心值 标准范围 标准下限 标准上限 标准差 均值 x 1 )( 2 n xx s i 符号表示 67 过程能力指数CP的计算 -过程性能指数PP参照此计箅 1.双侧,中心无偏移( = 0 )( = 0 ) 2.双侧,中心偏移( 0 )( 0 ) S TT S T C lu P 66 PPK Ck S T C)1( 6 2 68 3.只有规范上限时 4.只有规范下限时 S xT C u pu 3 S Tx C l pl 3 过程能力判断准则 过程能力状态过程能力状态过程能力指数过程能力指数 严重不足严重不足C CP P(C(CPK PK、C 、CPU PU、C 、CPL PL)0.67 )0.67 不足不足0.67C0.67CP P(C(CPK PK、C 、CPU PU、C 、CPL PL)1 )1 正常正常1C1CP P(C(CPK PK、C 、CPU PU、C 、CPL PL)1.33 )1.33 理想理想1.33C1.33CP P(C(CPK PK、C 、CPU PU、C 、CPL PL) 1.67 ) 1.67 过剩过剩C CP P(C(CPK PK、C 、CPU PU、C 、CPL PL)1.67 )1.67 备注:收集观测值个数n30 70 两种过程指数的关系 当Pp pCp p, 表明当前的过程性能已高于过程的固 有能力,也需找原因,力求保持当前的过程性能, 若持续一段时间的过程性能指数能保持高于过程的 固有能力,并经判定过程处于稳态,则说明过程的稳 定态水平已经提高,可对过程能力指数进行调整,实 现了过程的持续改进。 过程能力指数对应的不合格品率 C CP P不合格品率不合格品率C CP P不合格品率不合格品率 1.671.676/1000万6/1000万1.11.11/10001/1000 1.51.57/100万7/100万1 13/10003/1000 1.331.336/10万6/10万0.670.674.55/1004.55/100 1.21.23/1万3/1万0.330.3331.75/10031.75/100 注: 具体可查表得到 72 CPK对应的不合格率 0.59 0.130.040.010.001.40 0.59 0.130.040.010.001.40 0.96 0.250.090.030.011.30 0.96 0.250.090.030.011.30 1.54 0.480.200.080.041.20 1.54 0.480.200.080.041.20 2.39 0.840.420.200.111.10 2.39 0.840.420.200.111.10 3.593.59 1.551.550.840.840.450.450.290.291.001.00 5.27 2.621.601.000.730.90 5.27 2.621.601.000.730.90 7.51 4.312.942.091.690.80 7.51 4.312.942.091.690.80 10.55 6.895.244.163.640.70 10.55 6.895.244.163.640.70 14.59 10.819.037.857.260.60 14.59 10.819.037.857.260.60 20.19 16.7515.1013.9913.430.50 20.19 16.7515.1013.9913.430.50 0.400.280.200.120.040.400.280.200.120.04 k P% Cp 73 实例实例5空心胶囊的直径标准为7.000.15(mm)7.000.15(mm)样 本均值,S=0.05,试估计不合格品率. 解: 分布中心 与公差中心M=7.00不重合 06. 7x 0 .1 05.06 85.615.7 6 s TT C LU p 4 . 0 85. 615. 7 )00. 706. 7(22 T K 查上表得P=0.0359=3.59P=0.0359=3.59% 同理可从生产工艺的稳定程度予测生产过程产品 的不合格率,加以控制;也可从进货的质量分析数据 矛测供应商产品的合格率,用以审核。 74 中等 风险 低风险 理想 状态 能力 富裕 能力 过剩 一般质量 特性 C类 高风险 中等 风险 低风险 理想 状态 能力 富裕 重要质量 特性 B类 极高 风险 高风险 中等 风险 低风险理想 关键质量 特性 A类 0.671.000.671.331.001.671.331.67 CP值值 风险 程度 质量特性 C CP P值与质量风险程度 75 参数估计参数估计假设检验假设检验 推断统计推断统计 我们所用到的推断统计方法我们所用到的推断统计方法 点估计 区间估计 点估计 区间估计 u 检 验 检 验 F 检 验 检 验 t 检 验 检 验 76 区间估计是根据一个样本的观察值给出总体参数 的估计范围;即给出了总体未知参数落在这一区间 的概率。 自由度:指对平均值独立的数据个数。f = n-1 置信度 : 概率判断的可靠性程度 ,表示显著性水 平,是总体参数不在区间内的概率, 常用为0.01,0.05, 0.10。 1-1-称为置信水平或可靠程度;是总体未知参数落 在区间内的概率,常用的置信水平值有 9999%, 95, 95%。 样本测定值的区间估计为 有关概念有关概念 n S n tx )1( 2 假设检验假设检验 基本思想 根据是小概率原理,所谓小概率原理:即“ 在有限次的试验中,概率很小的事件认为是 实际上不可能发生的事件,而概率接近于1 的事件认为是实际上必然要发生的。” 我们可以根据所获样本,运用统计分析方 法,对总体X的某种假设H0 0作出接受或拒绝 的判断。 78 在推断统计中,只控制而不考虑的假 设检验,称为显著性检验,称为显著性 水平,最常用的值是0.01、0.05、0.1等, 意思是在=0.01, 0.05或0.1的水平上拒 绝。一般情况下,根据研究问题,如果弃 真错误的损失大,为减少这类错误,取值 小些,反之,取值大些。 【检定的思路】 1.建立假设H0: 2.选择检验统计量,给出拒绝的形式 3.给出显著性水平 4.由样本值计算出统计量的值 5.根据统计量的不同分布查相应的分布表 6.作出判断 当则拒绝H0 则接受H0 注:代表所计算出的统计数值 代表查表出的临界统计数值 代表所计算出的统计数值 代表查表出的临界统计数值 80 假设检验(显著性检定)目的假设检验(显著性检定)目的 1.检定产品质量与标准比较,有否差异 2.检定产品质量间的差异 3.评估质量控制中各因素间的差异 4.评估生产过程中各工序间的差异 差异的表示:均值 标准差 81 结 果 临界值法P值法 比较统计量与临界值的 大小来作出结论.临界 值用查统计表获得.一 般统计教材所用。 假设检验数值比较的二种方法假设检验数值比较的二种方法 比较P值与显著性水平 的比较作出对假设的判 断.当P时拒绝H0,当 P 时接受H0,;论文与 专著采用。这里的P是 实测的显著性水平。 82 最常用的假设检验应用最常用的假设检验应用(一)(一) 确定总体的均值与质量标准值的差异性 1. U检验已知,使用u统计量 2.t检验未知,用s估计,使用t统计量 断判各查u, t检验临界值u, t 1.当uu时, 则H0成立,(即无显著性差异) 2.当tt时, 则H0成立,(即无显著性差异 ) n x u / 0 nS x t / 0 83 显著性水平=0.05的拒绝区域 84 实例实例6某药片标准重为100毫克,抽25片分别称 重,检查压片机工作是否正常? 计算得样本均数为98.4毫克,标准偏差为4.5毫 克。S= 4.5 0=100 n=25 1.检验假设: = 0 2.计算统计量: 3. f=25-1=24 查t值表, t0.052(24)=2.064, 1.778 t0.052(22)=2.07, 4.判断结果:两地药材出膏率有显著性差别,应指 定产地。 2nn S) 1n(S) 1n( S 21 2 22 2 11 0 21 0 21 11 nn S xx T 8.52 2 x 5 .46 1 x 88 最常用的假设检验最常用的假设检验(三(三) 确定2个样本间的标准差的差异性 F检验未知: 计算 按F( n1-1 , n2-1 , ) 查F检验临界值H, 当FF时, 则HO成立(即无显著性差异)。 1 2 0 H 2 2 2 1 ),min( ),max( 2 2 2 1 2 2 2 1 ss SS F 89 F分布表的使用F分布表的使用 025. 0 1018 39.50 13.90 8.26 6.02 4.85 4.14 3.67 3.33 3.08 2.88 2.72 2.60 2.49 2.40 2.32 2.25 2.19 2.13 1014 39.49 13.95 8.31 6.07 4.90 4.20 3.73 3.39 3.14 2.94 2.79 2.66 2.55 2.46 2.38 2.32 2.26 2.20 1006 39.47 14.04 8.41 6.18 5.01 4.31 3.84 3.51 3.26 3.06 2.91 2.78 2.67 2.59 2.51 2.44 2.38 2.33 1001 39.46 14.08 8.46 6.23 5.07 4.36 3.89 3.56 3.31 3.12 2.96 2.84 2.73 2.64 2.57 2.50 2.44 2.39 997.2 39.46 14.12 8.51 6.28 5.12 4.42 3.59 3.61 3.37 3.17 3.02 2.89 2.79 2.70 2.63 2.56 2.50 2.45 993.1 39.45 14.17 8.56 6.33 5.17 4.47 4.00 3.67 3.42 3.23 3.07 2.95 2.84 2.76 2.68 2.62 2.56 2.51 984.9 39.43 14.25 8.66 6.43 5.27 4.57 4.10 3.77 3.52 3.33 3.18 3.05 2.95 2.86 2.79 2.72 2.67 2.62 976.7 39.41 14.34 8.75 6.52 5.37 4.67 4.20 3.87 3.62 3.43 3.28 3.15 3.05 2.96 2.89 2.82 2.77 2.72 968.6 39.40 14.42 8.84 6.62 5.46 4.76 4.30 3.96 3.72 3.53 3.37 3.25 3.15 3.06 2.99 2.92 2.87 2.82 963.3 39.39 14.47 8.90 6.68 5.52 4.82 4.36 4.03 3.78 3.59 3.44 3.31 3.21 3.12 3.05 2.98 2.93 2.88 956.7 39.37 14.54 8.98 6.76 5.60 4.90 4.43 4.10 3.85 3.66 3.51 3.39 3.29 3.20 3.12 3.06 3.01 2.96 948.2 39.36 14.62 9.07 6.85 5.70 4.99 4.53 4.20 3.95 3.76 3.61 3.48 3.38 3.29 3.22 3.16 3.10 3.05 937.1 39.33 14.73 9.20 6.98 5.82 5.12 4.65 4.23 4.07 3.88 3.73 3.60 3.50 3.41 3.34 3.28 3.22 3.17 921.8 39.30 14.88 9.36 7.15 5.99 5.29 4.82 4.48 4.24 4.04 3.89 3.77 3.66 3.58 3.50 3.44 3.38 3.33 899.6 39.25 15.10 9.60 7.39 6.23 5.52 5.50 4.72 4.47 4.28 4.12 4.00 3.89 3.80 3.73 3.66 3.61 3.56 864.2 39.17 15.44 9.98 7.76 6.60 5.89 5.42 5.08 4.83 4.63 4.47 4.35 4.24 4.15 4.08 4.01 3.95 3.90 799.5 39.00 16.04 10.65 8.43 7.26 6.54 6.06 5.71 5.46 5.26 5.10 4.97 4.86 4.77 4.69 4.62 4.56 4.51 647.8 38.51 17.44 12.22 10.01 8.81 8.07 7.57 7.21 6.94 6.72 6.55 6.41 6.30 6.20 6.12 6.04 5.95 5.92 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 12040302420151210987654321 2 n 1 n 4.90 90 254.3 19.50 8.53 5.63 4.36 3.67 3.23 2.93 2.71 2.54 2.40 2.30 2.21 2.13 2.07 2.01 1.96 1.92 1.88 253.3 19.49 8.55 5.66 4.40 3.70 3.27 2.97 2.75 2.58 2.45 2.34 2.25 2.18 2.11 2.06 2.01 1.97 1.93 252.2 19.48 8.57 5.69 4.43 3.74 3.30 3.01 2.79 2.62 2.49 2.38 2.30 2.22 2.16 2.11 2.06 2.02 1.98 151.1 19.47 8.59 5.72 4.46 3.77 3.34 3.04 2.83 2.66 2.53 2.43 2.34 2.27 2.20 2.15 2.10 2.06 2.03 250.1 19.46 8.62 5.75 4.50 3.81 3.38 3.08 2.86 2.70 2.57 5.47 2.38 2.31 2.25 2.19 2.15 2.11 2.07 249.1 19.45 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.51 2.42 2.35 2.29 2.24 2.19 2.15 2.11 248.0 19.45 8.66 5.80 4.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 245.9 19.43 8.70 5.86 4.62 3.94 2.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 241.9 19.40 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.38 24.05 19.38 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.49 2.46 2.42 238.9 19.37 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 236.8 19.35 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 234.0 19.33 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 230.2 19.30 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90 2.85 2.81 2.77 2.74 224.6 19.25 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 215.7 19.16 9.28 6.59 5.41 4.76 4.35 4.07 3.81 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 199.5 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 5.55 3.52 161.4 18.51 10.13 7.71 6.61 5.99 5.59 5.32 3.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 12060403024201510987654321 2 n 1 n 05. 0 2.31 F分布表的使用F分布表的使用 91 最常用的假设检验最常用的假设检验(四(四) 2 min 2 max S S H 22 3 2 2 2 1 . m 确定多个样本间的标准差的差异性 哈特利检验 假设 HO: m3的正态总体数,独立取容量为K1=K2=Ki Ki3 , 计算 自由度df=K-1 查哈特利检验临界值H,当HH时, 则HO成立。 (即无显著性差异) 92 2.302.262.222.172.112.041.961.851.676060 3.293.213.123.022.912.782.612.402.073030 4.374.244.103.943.763.543.292.952.462020 5.595.405.194.954.684.374.013.542.861515 7.006.726.426.095.725.304.794.163.281212 8.668.287.877.4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全国80所名校数学试卷
- 南渝中学初二数学试卷
- 南充拓展活动策划方案招聘(3篇)
- 固废焚烧施工方案(3篇)
- 珠宝引流促销活动方案策划(3篇)
- 私人银行开业活动策划方案(3篇)
- 山坡建筑施工方案(3篇)
- 驾驶校车考试题库及答案
- 北京市门头沟区2023-2024学年八年级下学期第一次月考道德与法制试卷及答案
- 安徽省芜湖市无为市2023-2024学年高一下学期第二次月考化学考题及答案
- DB37/T 3658-2019地质灾害治理工程施工技术规范
- 个体户餐饮股东协议书
- 云仓代发货合同协议书
- 本质安全培训课件
- 挖机台班合同协议书
- 技术团队分红协议书
- 应聘个人简历标准版范文
- 2025年中国智慧养殖行业市场占有率及投资前景预测分析报告
- 全面深化信息安全培训提高医护人员的保护意识与能力水平
- 2025-2030中国工业CT行业市场运行分析及发展趋势与投资研究报告
- 废气处理合同协议
评论
0/150
提交评论