Hypothesis Testing假设检验讲义(中英文版)(ppt 34页).ppt_第1页
Hypothesis Testing假设检验讲义(中英文版)(ppt 34页).ppt_第2页
Hypothesis Testing假设检验讲义(中英文版)(ppt 34页).ppt_第3页
Hypothesis Testing假设检验讲义(中英文版)(ppt 34页).ppt_第4页
Hypothesis Testing假设检验讲义(中英文版)(ppt 34页).ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 HypothesisTesting 2 假设检验 3 Objectives ExplainthedifferencesbetweendecisionmakingwithpopulationdataandsampledataExplaintherisksofsamplebaseddecisionmakingExplainwhatahypothesisisExplainwhyhypothesistestingisimportanttoprocessimprovement Definetheterms NullHypothesis and AlternativeHypothesis CompareHypothesistestingtoCourtroomDecisionMaking Explaintheterms arisk and brisk Explainwhata pvalue is 4 目标 解释由全部数据或抽样数据所作出决策的不同解释根据抽样资料所作出决策的风险说明假设是什么说明假设检验对程序优化的重要性介定 原假设 和 备择假设 比较假设检验和法庭式决策 说明术语 a风险 和 b风险 说明什么是 p数值 5 Population TheUniverseDataorinformationthatdefinestheentiresetParameters m s may ormaynotbeknown Sample Asubsetdataorinformationthatpossessesthesamecharacteristicsasthatofthepopulation Wecancalculatestatistics XBar s Wemakedecisionsaboutthepopulationbasedonthesample Howmanysamplesshouldbetaken Whyshouldwetakeasample Shouldthesampleberandom Isitpossibletohavesamplingerror PopulationsandSamples 6 总体 统计总体用以定义所有可知或不可知参数 m s 的数据或信息 样品 总体中具有共同特征的子集 可以计算其形成的统计表 X 我们以样本为基础做出总体决策 应取多少样本 为何要选取样本 样本需要随机抽取吗 可能出现取样错误吗 总体和样本 7 Samples WhyUseThem Whyuseasampleinsteadofapopulation UsingasamplereducestimeandcostCapturingdataontheentirepopulationmaybeverydifficult ifnotimpossible WhentouseasampleWeusesamplestoBaselineaprocessUsesamplestoevaluatetheresultsofacontrolledchangetoaprocess Howshouldthesamplebetaken Seesection5 8 样本 为何使用样本 为何采用样本而非总体 采用样本可减少时间和成本消耗即使可能 获取总体数据也是非常困难的 何时采用样本 我们利用样本定流程基线利用样本对过程的可控变化结果进行评估 如何获取样本 请看第五部分 9 Howcanwedependonasample 10 怎样使用样本 11 ConfidenceIntervalsandPointEstimates Confidenceintervalsidentifyarangeofplausiblevaluesforasamplestatisticofapopulationparameter Theycanbeeitherone sidedortwo sided SampleMeans SampleStandarddeviation SampleVariancesandothersamplestatisticsareknownasPointEstimatorsbecausetheyaresinglevaluesusedtorepresentpopulationparameters 12 可信区间和特征值的估计 可信区间确定了总体参数中样本统计可能的数值范围 它们可以是单边也可是双边 样本均值 样本标准偏差 样本方异和其它样本统计被称为特征值评估者 因为它们是用以代表总体参数的单一数值 13 HypothesisTests PointEstimatesofparametersandConfidenceIntervalInterpretationarebothmeansformakinginferencesaboutsampledata Hypothesistestsaredesignedtohelpusmakeaninferenceaboutthetruepopulationvalueatthedesiredlevelofconfidence Wewilluseconfidenceintervalsandtestsofsamplemeans variancesandsamplestandarddeviationtoinvestigatedifferenceandcause effectrelationshipsusingdata HypothesisTestshelpdetermineifanapparentdifferenceisrealorcouldbeduetochance Byusingdataandhypothesistesting wecanquantifyourlevelofconfidencethatthedifferenceisreal 14 假设检验 对参数特征值估计和可信区间的诠释都是得出样本数据推论的路径 假设检验是用以帮助我们在需要的可信度上对真实的总体数值进行推论的 我们将用可信区间和样本均值 样本差异及样本标准偏差测验来研究使用数据的差別和因果关系 假设检验有助于判断一个明显的差别是否真实存在还是偶然的 而且还可以提高差异真实性的可信度 15 AStatisticalHypothesis AnassertionorconjectureaboutoneormoreparametersofthepopulationTodeterminewhetheritistrueorfalse wemustexaminetheentirepopulation Thisisimpossible Insteadusearandomsampletoprovideevidencethateithersupportsordoesnotsupportthehypothesis Theconclusionisthenbaseduponstatisticalsignificance Itisimportanttorememberthatthisconclusionisaninferenceaboutthepopulationdeterminedfromthesampledata 16 统计假设 对于一个或多个总体里的参数的肯定或推断为了判断它的正误 我们必须检查总体的全部 这是不可能的 我们应使用随机样本 观察其是否能支持该假设 从而该结论是建立在统计学意义的基础之上的 必须记住该有关总体的结论是由样本推测出的 17 WhyDoHypothesisTesting 1 Toimproveprocesses weneedtoidentifyfactorswhichimpactthemeanorstandarddeviation 2 Oncewehaveidentifiedthesefactorsandmadeadjustmentsforimprovement weneedtovalidateactualimprovementsinourprocesses 3 Sometimeswecannotdecidegraphicallyorbyusingcalculatedstatistics samplemeanandstandarddeviation ifthereisastatisticallysignificantdifferencebetweenprocesses 4 Insuchcasesthedecisionwillbesubjective 5 Weperformaformalstatisticalhypothesistesttodecideobjectivelywhetherthereisadifference Datahelpseveryonemakesthesamedecision 18 为何要做假设检验 1 为了改进过程 我们需要确定影响均值和标准偏差的因素 2 一旦确定了这些因素并对改进措施进行了调整 我们就需要验证其在过程中的切实效果 3 若过程中存在统计上的重大差别 有时我们就不能利用图表或算得的统计数据 样本均值和样本标准偏差 作出决策 4 在这种情况下 决定可能是主观的 5 我们采用正统假设检验以客观地判断是否存在差別 数据帮助每个人作出同样的决定 19 NatureofHypotheses NullHypothesis Ho UsuallydescribesastatusquoTheoneyouassumeunlessotherwiseshownSignsusedinMinitab AlternativeHypothesis Ha UsuallydescribesadifferenceTheoneyouacceptorrejectbaseduponevidenceSignsusedinMinitab not or Or ItseitherNull same orAlternative Different 20 假设的种类 虚无性假设通常用以描述现状除非其它方面有所说明 否则就是人为设想的 在Minitab中用 表示 选择性假设 Ha 通常用以描述差別以证据为基础接受或拒绝的类型在Minitab中用 not or 表示 Or 不是全虚性假设 相同 就是选择性假设 相区别的 21 HypothesisTestingGuiltyvs InnocentExample TheAmericanjusticesystemcanbeusedtoillustratetheconceptofhypothesistesting InAmericaweassumeinnocenceuntilprovenguilty Innocencecorrespondstothenullhypothesis Itrequiresstrongevidence beyondareasonabledoubt toconvictthedefendant Returningaguiltyverdictcorrespondstorejectingthenullhypothesisandacceptingthealternativehypothesis Morespecifically wehavesignificantevidencetosupportthatadifferenceexists Ho Personisinnocent Ha Personisguilty Whatarethepossibleoutcomeswhenthetruthisknown 22 假设检验有罪vs 无罪的案例 美国的司法体系可以用于阐述假设检验的概念 在美国罪犯在被判有罪之前均是清白的 清白对应虚无性假设 它需要强而有力的证据 必需 排除所有合理的怀疑 才能把被告定罪 若陪审团裁定被告有罪则相当于拒绝虚无性假设接受选择性假设 更具体些 我们拥有重要的证据证明差別的存在 Ho 被告是清白的 Ha 被告有罪 当得知真相后 可能的结果是什么 23 TheTypeIError aerror isrejectingHowhenitistrue sometimescalledtheproducer srisk TheTypeIIError berror isfailingtorejectHowhenitisfalse sometimescalledtheconsumer srisk RiskDecisionMakinginourCourtsandinBusiness 24 TypeI错误 a错误 当Ho是无误时而拒绝 有时称作生产者风险TypeII错误 b错误 是当Ho有错误时却接受 有时称作消费者风险 法庭和商业上的决策风险 25 ThepValue AnotherwaytomeasuretheriskinthedecisionisthroughthepValue Thep valueisknownastheObservedLevelofSignificanceforafactor Itisthechanceofobservingthisamountofdifferenceifthesampleisconsistentwiththepopulation Thep valueisalsotheprobabilityofbeingwrongifwerejecttheNullHypothesis TypeIError Unlessthereisanexceptionbasedonengineeringjudgment wewillsetanacceptancelevelofaTypeIerrorata 0 05 Thus anyp valuelessthan0 05meanswerejecttheNullhypothesis 26 p值 衡量决策风险的另一种方法是通过P值 P值是指一个因素可测的重要性水平 当样本和总体相对时 P值是指观测到其中差別的机会率 P值也指如果拒绝虚无性假设可能发生错误的概率 错误I 除非在基于工程判断上的例外 我们将错误I的可接受水平定在a 0 05 从而 任何小于0 05的P值就表示虚无性假设被拒绝 27 DefiningHypotheses NullHypothesesHO X1 TargetHO X1 mHO X1 X2 0HO m1 m2 0HO X1 X2 X3 XnHO s1 s2HO S1 S2HO S1 S2 S3 Sn AlternativeHypothesesHA m1 m2InequalitiesaretwosidedtestsHA X1 X2HA m1hypotheses HA m1 m2HA X1 X2HA X1 X2 0 HA X1 X20 HA s1 s2 HA s1S2 ScriptingHypothesesasequationsisusefulwhenstating 28 定义假设 虚无性假设HO X1 TargetHO X1 mHO X1 X2 0HO m1 m2 0HO X1 X2 X3 XnHO s1 s2HO S1 S2HO S1 S2 S3 Sn 选择性假设HA m1 m2不等式是针对两边的测试HA X1 X2HA m1假设 HA m1 m2HA X1 X2HA X1 X2 0 HA X1 X20 HA s1 s2 HA s1S2 把假设以等式陈述很有用 29 HypothesisTestingProtocol Thehypothesesarealwaysstatementsaboutthepopulationparameters Stateyournullhypothesis Ho HO TheheightofcitizensincountryAisequaltotheheightofcitizensincountryB mA mB StateyourAlternativeHypothesis Ha HA TheheightofcitizensincountryAislessthantheheightofcitizensincountryB mA mB DeterminetheappropriatestatisticaltestbasedontheHypothesisbeingtested Determinethelevelofacceptablerisk aRisk usually5 Default bRisk Usually10 20 Default 30 假设检验协议 假设总是关于总体参数的陈述 定明虚无性假设 Ho HO A国与B国居民身高相等 mA mB 规定选择性假设 Ha HA A国居

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论