统计分析和prism软件使用.ppt_第1页
统计分析和prism软件使用.ppt_第2页
统计分析和prism软件使用.ppt_第3页
统计分析和prism软件使用.ppt_第4页
统计分析和prism软件使用.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计基础和prism软件使用,仝鑫魏健2015-12,目录,线性回归和prism软件应用,t检验、F检验(方差分析)和prism软件应用,假设检验(参数检验和非参数检验),统计学基础知识,TheGaussianDistribution,TheGaussianfunctiondescribingthisshapeisdefinedasfollows:,wheremrepresentsthepopulationmeanandsthestandarddeviation.Fewbiologicaldistributions,ifany,reallyfollowtheGaussiandistribution,一、统计学基础知识,TheCentralLimitTheorem,Ifyoursamplesarelargeenough,thedistributionofmeanswillfollowaGaussiandistributionevenifthepopulationisnotGaussian.N=10orsoisgenerallyenough,一、统计量(DescriptiveStatistics:columnstatisticsinprism),MeasuresofLocation,Atypicalorcentralvaluethatbestdescribesthedata(centraltendency).Mean(平均值)Median(中数)Mode(众数)Geometricmean(几何均数),MeasuresofDispersion,Describespread(variation)ofthedataaroundthatcentralvalue.Range(范围)Variance(方差)StandardDeviation(标准偏差)StandardError(样本间标准误=SD/nCoefficientofvariation(变异系数)ConfidenceInterval(置信区间),Nosingleparametercanfullydescribedistributionofdatainthesample.Moststatisticssoftwarewillprovideacomprehensivetabledescribingthedistribution.,MeasuresofLocation:Mean,Mean,Morecommonlyreferredtoas“theaverage”.Itisthesumofthedatapointsdividedbythenumberofdatapoints.,MigrationAssay,M=76.78microns=77microns,MeasuresofDispersion:Variance,Variance,Definedastheaverageofthesquaredistanceofeachvaluefromthemean.,Tocalculatevariance,itisfirstnecessarytocalculatethemeanscorethenmeasuretheamountthateachscoredeviatesfromthemean.Theformulaforcalculatingvarianceis:,MeasuresofDispersion:StandardDeviation,StandardDeviation,Themostcommonandusefulmeasureofdispersion.Tellsyouhowtightlyeachsampleisclusteredaroundthemean.Whenthesamplesaretightlybunchedtogether,theGaussiancurveisnarrowandthestandarddeviationissmall.Whenthesamplesarespreadapart,theGaussiancurveisflatandthestandarddeviationislarge.,Theformulatocalculatestandarddeviationis:,SD=squarerootofthevariance.,标准偏差(SD)和标准误(SEM),Standarddeviationreferstotheamountyouexpectanindividualmeasurementtovaryfromtheaverage.标准差(standarddeviation)衡量的是样本值对样本平均值的离散程度,反应个体间变异的大小,是量度数据精密度的指标。Standarderrorofthemeanishowmuchyouexpectavalueaveragedfromseveralmeasurementstovaryfromthetruemean.标准误(standarderror)衡量的是样本平均值对总体平均值的离散程度,反映抽样误差的大小,是量度结果精密度的指标。,Shouldweshowstandarddeviationorstandarderror?,UseStandardDeviation,Ifthescatteriscausedbybiologicalvariabilityandyouwanttoshowthatvariability.Forexample:Youaliquot10plateseachwithadifferentcelllineandmeasureintegrinexpressionofeach.,Usestandarderror,Ifthevariabilityiscausedbyexperimentalimprecisionandyouwanttoshowtheprecisionofthecalculatedmean.Thenshowthe95%confidenceintervalofthemean.Forexample:Youaliquot10platesofthesamecelllineandmeasureintegrinexpressionofeach.,PrecisionoftheMean,在统计学中,样本的置信区间(Confidenceintervals)是对这个样本的总体某参数的区间估计。展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。“一定概率”:称为置信水平。当求取90%置信区间时Z=1.645当求取95%置信区间时Z=1.96当求取99%置信区间时Z=2.576,TheformulaforcalculatingCI:,CI=X(SEMxZ)XisthesamplemeanandZisthecriticalvalueforthenormaldistribution.Forthe95%CI,Z=1.96.Forourdataset:95%CI=77(19x1.96)=7732CI95%=45-109Thismeansthattheresa95%chancethattheCIyoucalculatedcontainsthepopulationmean.,CI:APracticalExample,Betweenthesetwodatasets,whichmeandoyouthinkbestreflectsthepopulationmeanandwhy?,InterpretCIofamean,SD/SEM/95%CIerrorbars,SD,SEM,95%CI,二、TheNullHypothesis(假设检定),AppearsintheformHo:m1=m2Where;Ho=nullhypothesism1=meanofpopulation1m2=meanofpopulation2AnalternateformisHo:m1-m2=0Thenullhypothesisispresumedtrueuntilstatisticalevidenceintheformofahypothesistestprovesotherwise.(非此即彼),检验统计量用于假设检验问题的统计量称为检验统计量。与参数估计相同,需要考虑:总体是否正态分布;大样本还是小样本;总体方差已知还是未知。,假设检验的一些基本概念,假设检验的一些基本概念,thedifferenceyouobservedfromsamplingtruedifferenceofpopulation.Allyoucandoiscalculateprobabilities(Pvalue:0,1).BeforethinkingaboutPvalues,youshould:1)Assessthescience.2)ReviewtheassumptionsoftheanalysisyouchosePvalues(SmallPandbigPseepage35and37),显著性水平(thresholdsignificancelevel)用样本推断H0是否正确,必有犯错误的可能。原假设H0正确,而被我们拒绝,犯这种错误的概率或风险用表示。把称为假设检验中的显著性水平,即决策中的风险。,例:0.05时的接受域和拒绝域,接受域:原假设为真时允许范围内的变动,应该接受原假设。拒绝域:当原假设为真时只有很小的概率出现,因而当统计量的结果落入这一区域便应拒绝原假设,这一区域便称作拒绝域。,假设检验的一些基本概念,双侧检验与单侧检验假设检验根据实际的需要可以分为:双侧检验(双尾):指只强调差异而不强调方向性的检验。单侧检验(单尾):强调某一方向性的检验。左侧检验右侧检验,假设检验中的单侧检验示意图,拒绝域拒绝域(a)右侧检验(b)左侧检验,假设检验的一些基本概念,假设检验中的两类错误假设检验是依据样本提供的信息进行推断的,即由部分来推断总体,因而假设检验不可能绝对准确,是可能犯错误的。两类错误:错误(I型错误):H0为真时却被拒绝,弃真错误;错误(II型错误):H0为假时却被接受,取伪错误。假设检验中各种可能结果的概率:接受H0,拒绝H1拒绝H0,接受H1H0为真1(正确决策)(弃真错误)H0为伪(取伪错误)1-(正确决策),(1)与是两个前提下的概率。即是拒绝原假设H0时犯错误的概率,这时前提是H0为真;是接受原假设H0时犯错误的概率,这时前提是H0为伪。所以不等于1。(2)对于固定的n,与一般情况下不能同时减小。对于固定的n,越小,Z/2越大,从而接受假设区间(-Z/2,Z/2)越大,H0就越容易被接受,从而“取伪”的概率就越大;反之亦然。即样本容量一定时,“弃真”概率和“取伪”概率不能同时减少,一个减少,另一个就增大。,与,(3)要想减少与,一个方法就是要增大样本容量n。,与,StatisticalPower(统计功效),HypothesisTesting,Nonparametrictestsandparametrictests(参数检验和非参数检验),ANOVA,ttests,andmanystatisticaltests:sampleddatafrompopulationsthatfollowaGaussianbell-shapeddistribution.manykindsofbiologicaldatafollowabell-shapeddistributionthatisapproximatelyGaussian.aGaussiandistribution:Normalitytest(正态性检验):Normalitytestscanhelpyoudecidewhentousenonparametrictests,butthedecisionshouldnotbeanautomaticone.examinethefrequencydistributionorthecumulativefrequencydistribution.,使用服从t分布的统计量检验正态总体平均值的方法。是定量资料分析中最常用的假设检验方法,t检验和prism软件应用,三、t检验、F检验(方差分析)和prism软件应用,t检验类型,1、样本均数与已知某总体均数比较的t检验usethecolumnstatisticsanalysis2、配对设计(paireddesign)均数比较的t检验目的:推断两个未知总体均数1与2是否有差别,用配对设计。3、两个独立样本(unpaireddesign)均数比较的t检验目的:推断两个未知总体的均数1与2是否有差别,用成组设计。,适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。已知总体均数0一般为标准值、理论值或经大量观察得到的较稳定的指标值。单样t检验的应用条件是总体标准未知的小样本资料(如n50),且服从正态分布。,一、样本均数与已知某总体均数的比较(单样本t检验),二、配对设计均数比较的t检验(配对t检验),配对设计处理分配方式主要有三种情况:两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。,案例1,6L1Tm1tratioTestingifpairsfollowaGaussiandistribution,独立样本:又称非配对样本或成组样本。是指一组数据与另一组数据没有任何关系,也就是说,两样本资料是相互独立的。两组的样本容量尽可能相同,可以提高检验的精确度。其均数差异显著性的t检验,又分为两总体方差相等(方差齐性)和方差不等两种检验方法(LevenesTestforequalityofvariance)。若两总体方差不等,即方差不齐,可采用t检验,或进行变量变换,或用秩和检验方法处理。,三、两个独立样本均数比较的t检验(两独立样本的t检验),案例2,6L1rs和16L1rsTm1,nonparametrictest,ChoosingwhentouseanonparametrictestisnotstraightforwardTheMann-WhitneytestWilcoxonmatchedpairstest-unpaireddata,总结,应用条件:t检验:1.小样本(n50)计量资料2.样本来自正态分布总体3.总体标准差未知4.两样本均数比较时,要求两样本相应的总体方差相等(方差齐性),2019/12/7,把所有观察值之间的变异分解为几个部分。即把描写观察值之间的变异的离均差平方和分解为某些因素的离均差平方和及随机抽样误差的离均差平方和,进而计算其相应的均方差,构成F统计量。分类:单因素方差分析:因素只有一个,这个因素的水平2。多因素(2)方差分析:因素2,各因素的水平2,方差分析(ANOVA,F检验)和prism软件应用,在试验中所考虑的因素只有一个时,称为单因素实验。它是最简单的一种,它适用于只研究一个试验因素的资料,目的在于正确判断该试验因素各处理的相对效果(各水平的优劣)1.各样本是相互独立的随机样本;2.各样本数据均服从正态分布;3.相互比较的各样本的总体方差相等,即方差齐性(homogeneityofvariance)。,单因素方差分析(onewayANOVA),ordinaryone-wayANOVARepeatedmeasuresone-wayANOVANonparameters:Kruskal-Wallistest;Fredmanstest,案例3,NaCl浓度对6L1rs颗粒影响NaCl浓度对11L1rs颗粒影响Fratio,2019/12/7,多因素方差分析(twowayANOVA),总体思路:1、观察数据类型选择方法一般线性模型多因素方差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论