课件:药学统计学.ppt_第1页
课件:药学统计学.ppt_第2页
课件:药学统计学.ppt_第3页
课件:药学统计学.ppt_第4页
课件:药学统计学.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章 药学统计学,药学导论,统计学(statistics):研究数据的收集、描述、分析、综合和解释,以获得新信息、作出新推断的学科。 包括: (1)制定调查方案和设计科学实验 (2)描述实验数据 (3)进行假设检验 (4)获知变量间的定量关系,概 述,第一节 几个基本统计学概念,频率: 概率:,一、必然事件与随机事件,必然事件:某条件实现后一定发生或一定不发生的事件 随机事件:一定条件下,不一定发生的事件,二、频率与概率,1. 总体与样本的关系 样本参数用英文字母表示 总体参数用希腊字母表示,三、总体与样本,2. 取样的随机性 随机性包括: 总体中个体的抽取必须是相互独立的; 总体中所有个体被抽取的机会相等。 满足以上两个要求的取样,称为简单随机取样(SRS,simple random sampling) 这样抽取的样本称为简单随机样本。,四、观测值的特征集中位置与离散程度,量度集中位置的统计量 (1)均值 样本均值 总体均值 E(X)取值概率XiPi 均值的重要性质: 观测值与均值之差(偏差)之和 偏差的平方和 最小,(2)众数 频数最大的观测值叫众数,常用于表示离散型随机变量的集中位置。 (3)中位数 把变量的观测值按大小顺序排列,排在当中的一个观测值叫中位数。,(1)极差 (最大值和最小值之差) RXmaxXmin (2)平均(绝对)偏差,2. 量度数据离散程度的统计量,(3)方差 式中n1在统计学中叫自由度(degree of freedom),常用希腊字母表示,五、两个典型的概率分布,1. 二项分布是典型的离散型概率分布 (1)特点: 二项分布是一种每次试验只有两种可能结果而不受以前实验影响的分布。在样本容量相对于总体很小时,取样试验后,返回不返回,对下一次试验的结果无影响。,(2)二项分布的均值、方差、标准差 均值np 方差npq 标准差 (3)二项分布的实际意义 一些只有两个结果的互斥事件都与二项分布有关,在药学方面,可用于分析从制剂批抽出n个个体中不合格个体数的概率。,2. 正态分布是一种连续型概率分布,各种分布都以它为中心在一定条件下相互转化。 设连续性随机变量X的概率密度为 则称X服从参数为、 (- + , 0)的正态分布,记为XN( , ),(1)特点: 极大值在; 以X为对称轴; X轴是渐进线;拐点在X。,(2)标准正态分布 一般的正态分布取决于均值和标准差 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表,任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,(3)标准正态分布表的使用 将一个一般的转换为标准正态分布计算概率时 ,查标准正态概率分布表 对于负的 x ,可由 (-x) x得到 对于标准正态分布,即XN(0,1),有 P (a X b) b a P (|X| a) 2 a 1 对于一般正态分布,即XN( , ),有,六、均值的分布和中心极限定理,均值的分布 如一个随机变量X呈总体均值为、总体方差为2的正态分布,则其容量为n的样本均值 也呈正态分布,其总体均值仍为,但总体方差为2 /n,即,2. 中心极限定理 设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,第二节 取样,按与调查目的有关的某个主要性标志将总体单位划分为若干层(也称类、组或子总体),然后从多层中按随机原则分别抽取一定数目的单位构成样本。,一、随机取样与随机数表,简单随机抽样是最基本的抽样组织方式。是对总体单位不进行任何划分或排队,完全随机地直接从总体中抽取样本单位,使每个总体单位都有完全均等的机会被抽中。,二、分层取样,在大规模生产中,表明供应方产品质量特征的随机变量应不超出某规定范围。,三、系统取样,常用于质量控制,每第n个个体选取一个,但最初选取的个体是随机的。,四、验收取样,第三节 数据制图,与统计方法有关的图解: 以传递信息为目的的图解: 如直方图、条形图 在坐标中描述变量之间关系的图解,一、引言,在许多研究数据中,响应Y的对数而不是Y本身与独立变量X呈线性关系,这样就要进行半对数标绘,即变量X的坐标是自然数而响应(函数)Y的是它的对数logY。,二、描述频数的图解,直方图、条形图、扇形图,三、描述变量关系的标绘图,第四节 统计估计和假设检验,样本统计量均值 和方差S2分别是其总体均值和总体方差2的最佳估计。 置信区间(confidence interval):是我们相信统计量如总体均数所在的区间,由总体的性质、参数的样本估计值和想达到的置信度决定。 以样本均值为对称中心的双侧置信区间: P置信区间,一、统计估计,1. 用t分布确定置信区间 P置信区间 2. 几个不同置信区间的构造 (1)未知,需要由样本估计 (2)已知,直接代入公式 (3)比率的置信区间,一、统计估计,二、假设检验,1. 引言 (1)概念 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 (2)类型 参数假设检验 非参数假设检验 (3)特点 采用逻辑上的反证法 依据统计上的小概率原理,零假设(null hypothesis): 关于两个总体在某一参数如均值上一致(实际上差异为零)的假设H0。 如 H0:12 备择假设(alternative hypothesis):如果舍弃H0则接受Ha,Ha也可用H1表示。 如Ha:12,例:表 观测单一总体均值的实验示例,对此例中每一类问题的假设检验,可提出三个假设检验: H0:=0,Ha: 0 H0:=0,Ha:0,2. 检验假设的步骤 (1)提出检验统计量T并进行实验 (2)提出零假设H0和备择假设Ha (3)规定显著性水平 显著性水平:即根据统计检验的结果舍弃零假设H0(存在显著差异)而实际上不存在的概率。 (4)计算检验统计量T并进行显著性检验,3. 几种具体的假设检验 (1)已知的单样本双侧均值检验 (2)已知的单样本单侧均值检验 (3)未知的单样本双侧均值检验 先求t值,再计算置信区间,进行t检验 (4)独立样本方差S12和S22的比较:F检验,1. 什么是回归分析: 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度,第五节 回归分析,2. 回归模型的类型,3. 回归模型 (1)回答“变量之间是什么样的关系?” (2)方程中运用 1个数字的因变量(响应变量)被预测的变量 1个或多个数字的或分类的自变量 (解释变量)用于预测的变量 (3)主要用于预测和估计,概念要点 (1)当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归 (2)对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系 (3)描述因变量 y 如何依赖于自变量 x 的方程称为回归模型,5. 简单线性回归方程的形式如下 Y = 0+ 1 x 方程的图示是一条直线,因此也称为直线回归方程 0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值 1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值,6. 最小二乘法 回归直线是对若干个数据对(X,Y)绘制的,但由于遵守正态分布的实验误差,数据对中两个以上的点,不能恰好在一条直线上,即恰好通过所有数据点的直线是找不到的,只能找到一条离所有点都近的直线,所用的客观方法叫最小二乘法(method of least squares)。,7. 最小二乘线 (1)定义 给定n个数据对(X,Y),找到一条规定X,Y关系的直线,使所有数据对(X,Y)与拟规定的直线在Y轴方向的距离平方和最小用数学语言表示就是 最小,这样的一条直线就是描述X,Y间关系的最佳直线,称为最小二乘线。,(2)图示,(3) 和 的计算公式,二、回归分析在药物研究中的应用,例:把6个浓度按两倍递增的纯青霉素溶液(132U/ml)置于进行生物测定的杯碟中。下表给出每一浓度以mm表示的抑菌圈直径,在这个长度的测量中发生较大的误差。如果对青霉素溶液的浓度C取以2为底的对数(笔,binit),则抑菌圈的直径与青霉素溶液的浓度成线性关系。试求Y在X上的回归直线方程。,表 青霉素溶液浓度的对数变换,解 进行Y在X上的回归计算 X15 n6 Y122.42 2.50 20.40 X255 XY337.24 Y22553.3880 于是Y在X上的回归直线方程是 15.941.782X,第六节 实验设计,1. 基本原理 (1)对照:齐同可比 (2)重复:获得总体标准差的估计值 用大容量样本重复多次获得的均值,能把因素在实验中的效应估计得更精密。 (3)随机:有助于把可能存在得外部因素效应平均化而减免。,一、实验设计的基本原理,2. 步骤 确认并陈述问题 选择因素和水平 选择响应变量 选择实验设计 进行实验 分析数据 做结论并提建议,二、方差分析(analysis of variance,ANOVA),方差分析能确定引起生产和实验结果有差异的诸因素各自的单独作用和彼此的交互作用。 变差的大小通常用变差平方和(简称平方和)表示 平方和的加和性:总平方和等于各因素平方和与误差平方和之和,即 SStotSSASSBSSe,三、实验设计的分类,1. 两类基本的实验设计 等级分类 交叉分类 2. 两类不同性质的因素 固定的 随机的 3. 配置完整和不完整,第七节 几个现代统计方法,1. 概述 蒙特卡洛方法根据模拟抽样的结果估算求解问题解X的近似值。这样的近似值通常是以一个数学期望等于X的统计量的样本均值给出。 2. 分类 SS,SS,SM,MS,SMS 3. 一个例子制剂含量均匀度计量型检查法的制定,一、蒙特卡洛方法随机现象的统计模拟,二、模拟识别(pattern recognition),1.概述 模式识别不需要数学模型,只需要找到互不相同的数据间的关系,可处理代表模式而维数大于三的数据。 2.一般步骤和分类 (1)步骤:数据即观测值的收集、表示和预处理; 特征提取和选择; 分类、决策 (2)分类:非参数法;参数(贝叶斯)法 3.中药质量的化学模式识别,后面内容直接删除就行 资料可以编辑修改使用 资料可以编辑修改使用,主要经营:网络软件设计、图文设计制作、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论