DMD课件及资料 chapter4_第1页
DMD课件及资料 chapter4_第2页
DMD课件及资料 chapter4_第3页
DMD课件及资料 chapter4_第4页
DMD课件及资料 chapter4_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 Chapter4StatisticalSampling统计抽样 Data Models andDecisions 2 Marketingmanager营销经理Toestimatethepotentialsalesofaproductaspartofthebroadspectrumofproductdevelopmentdecision估计一种产品潜在的销售额 将其作为整个产品系列开发决策的一部分 Operationsmanager业务经理Toestimatetheproportionofdefectivepartsinaproductionprocessandthenusethisinformationtomakerecommendationaboutalterationsintheproductionprocess 估计一个产品生产过程中有缺陷部件的比例 然后利用得到的信息建议产品生产过程的改进 Inthesetwocases aswellasmanyothers amanagerneedstoestimatekeyparametersofapopulationbasedonasampledrawnfromthispopulation andthemanagerneedstoassessthereliabilityofhis herestimates 基于总体的样本对总体的关键参数进行估计 也需要对结果的可靠性进行估计 3 STATISTICALSAMPLING AnExample NEXNetisarelativelysmallbutaggressiveplayerinthetelecommunicationsmarketinthemid AtlanticregionoftheUS ItisnowconsideringamoveintotheBostonarea NEXNetwouldliketoestimatetheaveragemonthlyphonebillinthecommunitiesofWeston Wayland andSudbury byconductingaphonesurvey Asanenticementforpeopletoparticipateinthesurvey NEXNetwillofferdiscountcouponsoncertainproductstosurveyparticipants HowmanyhouseholdsshouldNEXNetplantosurvey successfully inordertoeffectivelyestimatetheaveragephonebillinthesethreecommunities HowshouldNEXNetanalyzethesurveyresults 最常见于媒体的问题是在公布抽样调查结果时 不提样本量和调查对象 或如何得到样本的 比如 一项广告可以说 有三分之二人选择某产品 人们往往理解为在广大消费者中 有三分之二的人选择该产品 但是 也不是没有下面的可能 即该广告数据仅仅来源于一个三口之家 其中有两个家庭成员使用该产品 有些调查报告还煞有介事地公布调查的误差 比如误差为 加减三个百分点 之类 在没有样本量或没有置信度的情况下 仅仅公布百分比及误差都是不负责任的 公布调查对象也是十分重要的 一个旨在发现全社会文化水准的调查如果仅仅在城镇居民中进行 则是毫无意义的 ChapterOutline 4 1RandomSampling随机样本4 2StatisticsofaRandomSample随机样本的统计量4 3ConfidenceIntervalsfortheMean forLargeSampleSize大样本均值的置信区间4 4Thet Distributiont分布4 5ConfidenceIntervalsfortheMean forSmallSampleSize小样本均值的置信区间4 6EstimationandConfidenceIntervalsforthePopulationProportion母体比例的估计与置信区间4 7ExperimentalDesign试验设计4 8ComparingEstimatesoftheMeanofTwoPopulations两个母体的均值估计的比较4 9ComparingEstimatesofthePopulationProportionofTwopopulations两个母体的比例估计的比较4 10SummaryandExtensions 6 7 4 1RandomSamples Apopulation or universe 总体 母体 isthesetofallunitsofinterest 所有感兴趣个体的集合 Asample 样本 isasubsetoftheunitsofapopulation由总体的事件个体构成的子集 即母体的子集 Arandomsample 随机样本 isasamplecollectedinsuchawaythateveryunitinthepopulationisequallylikelytobeselected用母体中每个个体被选中的机会都相等的选择方法选出的样本 OurGoal Makeinferences i e estimates predictions etc aboutapopulationbasedoninformationfromasample Inparticular wewanttoestimatethepopulationmeanm andthepopulationstandarddeviations 8 9 Aboutpopulation总体 Itisacollectionoftheunits numericalmeasures Itisarandomvariable oftendenotedasX Y orZ Apopulationisdeterminedbyourinterest Theboundaryofapopulationisoftendifficulttobedetermined Aboutsample样本 Whyrandomsample Howtoavoidgettingabiasedsample 有偏差的样本 Howcanwegetarandomsample NEXNetCorporationcasediscussion 4 1RandomSamples 10 4 1RandomSamples随机抽样 Whysample hardtoinvestigateeveryunitinthepopulationnotpracticaltoinvestigateeveryunit 11 4 1随机抽样 例4 1NEXNet电信公司考虑发展业务 目标为收入相对较高的群体 发现在具有下面特征的社区经营有利可图 平均每月每户电话费至少75美元每月电话费低于45美元的用户不超过15 每月电话费在60到100美元之间的用户至少有30 调查结果表4 1 12 为了估计每月每户电话费的分布 在三个目标地区中 随机抽取了70家用户 调查了他们10月份电话费的情况 结果见表4 1 13 Sampleof70monthlytelephonebillsforthemonthofOctober 基于表4 1可得到下面问题的答案 10月份用户电话费分布的形状是什么 10月份电话费低于45美元的用户数所占百分比是多少 10月份电话费在60美元与100美元之间的用户数所占百分比是多少 10月份电话费均值估计是多少 10月份电话费标准差的估计值是多少 14 例4 1中的总体和样本 15 母体是三个地区所有用户的电话费 样本是被调查的70个用户的电话费 如果每个用户被选中的机会相等的话 那么那70个用户的电话费就是一个随机抽样 从电话簿随机翻一页随机选一家 重复70次 超市购物的70个顾客 例4 1的随机抽样 随机抽取一用户 他的电话费X是一个随机变量 它有均值 方差 概率密度函数 累积分布函数 调查前 电话费是随机变量 16 例4 1的随机抽样 调查后 电话费就是确定的值 我们用大写字母表示随机变量 小写字母表示随机变量的实现值 realization 17 频数表 随机变量X的直观分布形状 首先把样本观测值分成一组区间 计算每一区间内的样本个数占样本总数的比例 样本观测值所在区间及其对应的比例构成了频数表 若以样本区间为横轴 以对应比例为纵轴 作柱状图 那么我们得到的直方图 histogram 它是概率密度函数的一种近似 18 19 Frequencytableofthe70Octobertelephonebills 建立例4 1的频数表及直方图 20 Histogramofthe70Octobertelephonebills 舍去125美元与155美元之间的样本点 在家办公或者国外亲人 余下的电话费分布近似为正态分布 峰值在65美元附近 21 FortheexampleofNEXNetCorporation UsingExceltocompute AnestimateofthemeanofthedistributionofOctobertelephonebillis AnestimateofthestandarddeviationofthedistributionofOctobertelephonebillsisWhatconclusionscanLisaget ThesiteareahasthenecessarycharacteristicsforNEXNettooperateprofitably 22 WearenowabletoanswerLisa squestions TheshapeofthedistributionislikeaNormaldistribution withpeaknear 65 exceptforasmallbutsignificantgroupintherangebetween 125and 155 AnswertothesecondquestionisAnswertothethirdquestionis 舍去125美元与155美元之间的样本点 余下的电话费分布近似为正态分布 峰值在65美元附近十月份电话费低于45美元的居民比例为7 十月份电话费位于60美元与100美元之间的居民比例为64 23 Supposethatwearegiventwonumbersaandbandthatwewishtoestimatetheprobabilityp P a X b Letdenotethatfractionofthesampledatawhoseobservedvaluesaregreaterthanorequaltoaandarelessthanorequaltob Thenisanestimateofthetrueprobabilityp P a X b 概率的估计 4 2StatisticsofARandomSample 随机样本统计量 24 ImportantConcepts LetbearandomsampleofsizencollectedfrompopulationX thenThesamplemean样本均值 denotedby isdefinedas 4 2StatisticsofARandomSample随机样本统计量 25 Thesamplevariance样本方差 denotedbyS2 isdenotedas Thesamplestandarddeviation样本标准差 denotedbyS isdefinedas 4 2StatisticsofARandomSample随机变量的统计量 26 Pleasenoticethat S2 andSareallrandomvariables wecallthemasestimators估计量 4 2StatisticsofARandomSample 27 Observedvalues观测值 Letbetheobservedvaluesof thenTheobservedsamplemean样本均值观测值 denotedby isdefinedas 4 2StatisticsofARandomSample 28 Theobservedsamplevariance样本方差观测值 denotedbys2 isdenotedas Theobservedsamplestandarddeviation样本标准差观测值 denotedbys isdefinedas 4 2StatisticsofARandomSample 29 Whennislarge thedifferenceisnegligible ThesamplevarianceS2isan unbiasedestimator ofthepopulationvariance i e E S2 Var X 2 无偏估计量 数学期望等于被估计的量的统计估计量 Question Whyn 1 andnotn Answer Itgivesabetterestimate WewilluseStoestimatethepopulationstandarddeviations 对例4 1中的样本进行计算 十月份电话费均值的估计值为79 40美元十月份电话费标准差的估计值为28 79美元 30 31 中位数Anothermeasureofcentraltendencyinasampleofsizenisthemedian中位数 Themedian theobservationinasamplebelowwhichliehalfthedata the50thpercentile 中位数是不大于它的样本数占样本总数比例等于50 的样本观测值 ForoddnumberofobservationsForevennumberofobservations 4 2StatisticsofARandomSample 32 样本均值为 33 HowtoUnderstandtheSamplingProcedure Beforewecollectthesample X1 X2 XnarethevaluesthatwillarisefromthesampleX1 X2 XnarerandomvariablesX1 X2 Xnareindependentandidenticallydistributed Inparticular eachXihasthesamedistributionastheentirepopulation Asaresult wehaveforeachXi E Xi m Var Xi 2 34 BEFOREandAFTER Afterwecollectedthesample x1 x2 xnareobservedvaluesofthesample justnumbers Basedontheoutcomeofthisparticularrandomsample wereportsasourestimatefor typically wegetdifferentresultsfromdifferentsamples 35 HowGoodIstheSampleMean Dowehittherighttargetornot E X1 X2 Xn n nm n m YES 1 n2 Var X1 X2 Xn 1 n2 Var X1 Var Xn 1 n2 n 2 2 n Well onaverage 36 WhatcanwesayaboutthedistributionofX1 X2 Xn CentralLimitTheorem CLT tellsusthatX1 X2 Xnisapproximatelynormallydistributedwhennislarge Withwhatparameters 例4 4 Berbshire电力公司 37 Barkshire电力公司是马萨诸塞西部Berkshire郡的一家电力公司 现在公司想知道1月份Berkshire郡每户电力消费量的均值和方差 随机抽取100户并记录他们的电力消费数据 见表4 4 例4 4的计算结果 38 图4 2和图4 3的随机模拟 39 我们随机抽出10户居民并记录他们的电力消费量 计算他们的均值 重复这个实验 若干次 我们可以得如图4 2的柱形分布图 如果我们把样本容量改为20 那么可以得到如图4 3的柱形分布图 显然 图4 3中的离散程度比图4 2的要小 这就说 样本容量越大 样本均值的离散程度即样本标准差越小 这正是中心极限定理的结论 40 4 2StatisticsofARandomSample 41 样本均值是随机变量X均值 的估计量 但是一个随机变量 它的某一特定观测值 一般情况下都不会等于均值 Anaturalquestionabouttheestimateofpopulationmeanis Howgoodistheestimateaboutthepopulationmean Thatis howreliableisthisestimate Inordertoanswerthisquestion weneedtodiscusstheconceptofconfidenceintervals 置信区间 42 ConfidenceIntervals Theconfidencelevelrepresentstheprobabilitythatmwillfallwithintheinterval Lisdeterminedbythesamplesizen theconfidencelevel andthestandarddeviationsoritsestimates 43 Inausualapplication weonlysampleonceandreportasingleconfidencelevel forexample 95 Ifwerepeatedthissamplingprocedurefor100times our random intervalswillcapturethetruepopulationmean onaverage 95timesoutofthe100times Interpretingconfidenceintervals 44 4 3ConfidenceIntervalsfortheMean forLargeSampleSize大样本下均值的置信区间 我们希望找到一个数b 使得样本均值落在均值两旁b单位内的概率为p 0 95 也就是说我们希望找到数b 使得或等价地有 于是 我们定义 对样本均值的一个实现值 称区间为均值的一个置信度为95 置信区间 问题是 如何确定b的值 对上式进行变换 得到 由中心极限定理 Z服从于标准正态分布 再由标准正态分布 可得 45 4 3大样本下均值的置信区间 46 重组初始的表达式我们有 在表达式中 我们用代替 用s代替 我们得到 如果N足够大 n 30 均值的95 置信区间为 47 InterpretationofConfidenceInterval SinceboththesamplemeanandthesamplestandarddeviationSarerandomvariables eachtimewetakerandomsamples wefinddifferentvaluesfortheobservedsamplemeanandtheobservedsamplestandarddeviations Thiswillresultinadifferentconfidenceintervaleachtimewesample A95 confidenceintervalmeansthat95 oftheresultingintervalswillcontaintheactualmean 4 3ConfidenceIntervalsfortheMean forLargeSampleSize 由于样本均值和样本标准差S均为随机变量 我们会看到不同的样本均值的实现值和样本标准差的实现值s 这样就会导致每次抽样都会得到不同的置信区间 95 的置信区间的含义是 我们得到的置信区间中有95 的区间会包含实际的均值 例4 5Berkshire电力公司 续 48 这就是说 我们有95 的把握相信一月份Berkshire郡电力消费均值在2866 9KWH与3155 1kwh之间 例4 6 NewspaperWaste 49 一家大报业公司正在考虑它的公司是否浪费了太多的新闻纸 为了判断问题的严重性 公司记录过50天来每天浪费的新闻纸 吨 样本均值观测值是273 1吨 样本标准差观测值为64 2吨 于是 我们有95 的把握相信每月新闻纸浪费数量的均值位于255 3吨与290 8吨之间 置信区间及相应的c值 50 c值由下面决定 例4 7 NewspaperWaste 续 51 均值99 的置信区间为 置信区间的权衡 其它因素不变 样本容量n越大 置信区间越小 即我们的估计越精确 若样本容量不变 要想得到更高的置信度就必须增大置信区间的长度 如果样本容量与置信水平均不变 那么母体标准差越小 置信区间长度越短 这就是说小方差的母体更容易进行估计 52 4 4Thet Distributiont 分布 Whatifsamplesizenisnotlargerthan30 Needtouset distributionwhencomputingconfidenceintervalswithsmallsamplesizes Thepdfoft distributiondependsonaparameterkassociatedwiththedistributionthatiscalledthe degreeoffreedom自由度 ofthedistribution Let sseetheshapeofthepdf 53 54 如果随机变量T的密度函数为 则称T服从自由度为n的t 分布 t分布的密度函数是偶函数 自由度 degreeoffreedom df 是指当以样本的统计量来估计总体的参数时 样本中独立或能自由变化的资料的个数 称为该统计量的自由度 如均值的自由度为n 4 4Thet Distributiont 分布 55 4 4Thet Distribution t distributionwith5degreeoffreedomt distributionwith10degreeoffreedomStandardNormaldistribution Theprobabilitydensityfunctionf x ofthet distributionandtheNormaldistribution Noticethatthet distributionhasmoreareainthetailsthanthestandardNormaldistribution 0 4 4Thet Distribution Propertiesofpdfoft distribution Itisbell shapedItissymmetricaroundzerowhichisitsmeanThestandarddeviationoft distributionwithkdegreesoffreedomis 自由度为K的t 分布的标准差等于 Whenkislargeenough theshapeofthepdfoft distributionbecomesclosertotheshapeofstandardNormaldistribution当k足够大时 t 分布标准差接近于1 因而可以用标准正态分布来近似t 分布 k 30 56 4 4Thet Distribution Calculatetheprobabilityoft distribution LetTbearandomvariablethatobeysthet distributionwithkdegreesoffreedom denotedby WewouldliketofindthevalueofcsuchthatExercises Pleasefindcsuchthat 57 4 5ConfidenceIntervalsfortheMean forSmallSampleSize小样本下均值的置信区间 Whennislessthan30 itcanbeshownthatwhenpopulationXisNormallydistributed thenobeyst distributionwithk n 1degreesoffreedom 58 Infact whennislessthan30 whenpopulationXisroughlyNormallydistributed thenobeyst distributionwithk n 1degreesoffreedom whichwillbedenotedbyT n 1 4 5ConfidenceIntervalsfortheMean forSmallSampleSize Wewouldliketofindquantitybsuchthatforacertainvalueofp sayp 95 59 4 5ConfidenceIntervalsfortheMean forSmallSampleSize Therefore wegetwherecsatisfiesSo aconfidenceintervalforthemeanforsmallsamplesizeisgivenby 60 ProcedureforComputingConfidenceIntervalforthePopulationMeanforSmallSample Findoutwhethersamplesizeislessthan30 Makesurethatthepopulationisroughlynormallydistributed Computeobservedsamplemean observedsampledeviation andthevalueofcsuchthatFinallygettheintervalas 61 4 5ConfidenceIntervalsfortheMean forSmallSampleSize Exercise4 8Questions Smallsampleorlargesample Whatdistributionwillbeinvolvedintheanalysis Howwillyoucompute Anyassumptionsneedtobemade 62 4 5ConfidenceIntervalsfortheMean forSmallSampleSize Exercise4 8Theobservesamplemeanis theobservedsamplestandarddeviationisTherefore thestandarddeviationofthesamplemeanisapprox 63 Weusethet studentdistributionwithk 9degreesoffreedom A95 confidenceintervalis 163 8 2 262 4 7 163 8 2 262 4 7 153 2 174 4 为什么叫学生分布 因为它是在1908年由WilliamS Gosset以Student的笔名所发表的 4 6EstimationandConfidenceIntervalsforthePopulationProportion总体比例的估计及置信区间 Proportionofapopulation ProportionofChinesecollegestudentswhohavecellularphonesProportionofdefectedproductsProportionofMBAstudentswhoneedBankloans 64 Thissectionwillintroduceamethodforestimatingsuchaproportion andalsoamethodforcomputingaconfidenceintervalfortheproportion 4 6EstimationandConfidenceIntervalsforthePopulationProportion 65 Supposeweareinterestedinestimatingtheproportionpofatargetedpopulationthathasaparticularcharacteristic basedonarandomsampleofnobservationsfromthepopulation Eachelementofthesampleeitherdoesordoesnotpossesstheparticularcharacteristic Supposethatwehavecollectedthensampleobservationsandletxdenotethenumberofthesampleelementsthatpossesstheparticularcharacteristic 一般地 若我们想估计具有某一特性的个体占总体的比例p 记n为收集的样本数 x为样本中具有某种特性的个体数 66 Theobservedsampleproportionisdefinedtobe样本比例观测值 andisanestimateoftheproportionpofthetargetedpopulation 母体比例的估计值 thathastheparticularcharacteristic 4 6EstimationandConfidenceIntervalsforthePopulationProportion LetXbethenumberofindividualsinthesampleofnindividualsthatwillpossesstheparticularcharacteristic ThenXwillbeobeyabinomialdistributionwithntrialsandprobabilityofsuccessp 假设我们随机抽样容量为n X为样本中具有某种特征的个体数 那么X是随机变量 服从成功概率为P的二项分布 therefore 67 Next wewouldliketocomputeaconfidenceintervalfortheestimateoftheproportion 4 6EstimationandConfidenceIntervalsforthePopulationProportion Letthesampleproportion 样本比例 arandomvariable bedenotedas 68 样本比例的均值与标准差 FromCLT 中心极限定理 whennislargeenough 69 IfXisanormallydistributedrandomvariablewithmean andstandarddeviation thentherandomvariableZdefinedby StandardizationofaNormalDistribution obeysastandardnormaldistribution Proof 母体比例P的置信区间 70 c值由下式决定 由 置信区间会推导 4 6EstimationandConfidenceIntervalsforthePopulationProportion Whennandsatisfy andthena95 confidenceintervalforthepopulationproportionpisgivenby 71 例4 9 有线电视公司 95 置信区间 72 估计某地区拥有2台或2台以上电视机的家庭所占比例以及95 置信区间N 200 124 200 0 62 均大于5 例4 10少年吸烟者 99 置信区间某机构估计吸烟青少年的比例 73 均大于5 例4 11商学院MBA一年级学生的年龄年纪大于25岁的比例的置信区间 74 假设我们在商学院MBA一年级学生中随机抽取了36人 发现其中30人的年纪大于25岁 我们想求出商学院MBA一年级学生中大于25岁的比例的90 置信区间 均大于5 4 7ExperimentalDesign试验设计 75 Wehaveseenthatthe confidenceintervalforthemean ofthedistributionofarandomvariableis 样本容量大小对置信区间有影响 并且容量越大 置信区间越小 76 TheExperimentaldesignwillestimatehowlargeasamplenweneedtogatherinordertosatisfyapre specifiedtoleranceinthewidthoftheconfidenceinterval 在抽样的时候 人们必须决定样本容量多大才能满足给定的置信区间长度 这个问题通常被称作试验设计 TwokindsofExperimentaldesignExperimentaldesignforestimatingthemean 估计均值的试验设计Experimentaldesignforestimatingtheproportionp估计比例p的实验设计 估计均值的试验设计 77 4 7ExperimentalDesign 假设我们求均值置信水平为 容忍限为L的置信区间 也就是说置信区间的形状为 假设s为样本标准差的观测值 那么样本容量至少为 估计均值的试验设计 78 估计均值的置信区间为 其中 或Z服从标准正态分布 或Z服从自由度为n 1的t 分布 估计均值的试验设计 79 如果我们要求置信水平为 容忍限为L时 即要求置信区间为 即要求 所以 样本容易至少为 其中c由下式决定n至少为30 以保证统计上的有效性 80 81 4 7ExperimentalDesign Example4 12 MarketResearch Supposethatamarketingresearchfirmwantstoconductasurveytoestimatethemean ofthedistributionoftheamountspentonentertainmentbyeachadultwhovisitacertainpopularresort Thefirmwouldliketoestimatethemean ofthisdistributiontowithin 120 00with95 confidence Fromdataregardingpastoperationsattheresort itishasbeenestimatedthatthestandarddeviationofentertainmentexpendituresisnomorethan 400 00 Howlargedoesthefirm ssamplesizeneedtobe 假设一家市场调研公司想设计一个实验来估计到某个旅游胜地成年人花费的均值 他们要求置信水平为95 容忍限为120美元 根据以往的经验 花费的标准差估计为400美元 那么抽样的容量应该为多大呢 82 UsingtheformulawithL 120 s 400 c 1 96 since 95 wehave 4 7ExperimentalDesign Example4 12 MarketResearch Themarketresearchfirmneedstoconductarandomsampleof43adultswhohavevisitedtheresort 83 Thehalflength or tolerancelevel ofa95 CIfortheproportionofthedistributionofarandomvariableis Inordertoconstructa95 CIfortheproportionpwithagiventolerancelevelL therequiredsamplesizenis Canweusethisformuladirectlyforcomputingtherequiredsamplesize 样本比例的观测值 估计比例p的实验设计 84 假设我们要求比例的置信水平为 容忍限为L的置信区间 也就是置信区间的形式为 那么样本容量的估计值为 4 7ExperimentalDesign Experimentaldesignforestimatingtheproportionp估计比例p的实验设计 其中c由下式决定 85 例4 13 设计一次民意调查 86 假设某电视网想估计国内成年人中赞成某项政策的比例 电视网想计算置信水平95 容忍限3 的置信区间 它应该调查多少位成年人 Thetelevisionnetworkmustpoll1068adultsinordertoobtainthedesiredtolerancelevelof3 例4 4 设计另外一次民意调查 87 假设一家报纸想估计成年人想参军的比例 他们想要的置信水平为98 容忍限为4 这家报纸应该调查多少个成年人 这家报纸应该调查846个成年人以便获得容忍限为4 比较2个月的销售额的差异来估算促销活动的效果估计购买一项新产品的男性比例与女性比例的差异在管理决策中 经常需要估计两个总体均值的差异 88 4 8ComparingEstimatesoftheMeanofTwoDistributions两个分布均值估计的比较 一家全国连锁店正在考虑 是否用直接邮寄的方法对商品进行促销 由于促销活动花费很大 公司在进行活动之前 检查促销的效果 他们随机抽出两组人 他们打算给第一组人邮寄促销材料 对第二组则不进行促销 为了估计促销的效果 他们调查了每组人在未来一月内在连锁店的消费情况 89 Example4 15 AProduct PromotionDecision产品促销决策 4 8ComparingEstimatesoftheMeanofTwoDistributions 90 Supposethattwoindependentpopulation1and2havepopulationmeans 1and 2 andstandarddeviations 1and 2 Ourobjectiveistoestimatethedifferencebetweenthemeansofthetwopopulation thatis 1 2 Supposethatweplantorandomlysamplefrombothpopulations obtainingn1observationsX1 X2 Xn1fromthefirstpopulationandn2observationsY1 Y2 Yn2fromthesecondpopulation Thetwosamplemeansare 4 8ComparingEstimatesoftheMeanofTwoDistributions 91 Since Wehave Thedifferencebetweentheobservedsamplemeansisanestimateofthedifferencebetweenthepopulationmeans 1 2 样本均值差为母体均值差的估计值 approximatelyobeysastandardNormaldistribution n1n2足够大 样本足够大时 近似服从标准正态分布 用与4 3节同样的方法 我们得到的的置信区间如下 92

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论