医学统计学课件_第1页
医学统计学课件_第2页
医学统计学课件_第3页
医学统计学课件_第4页
医学统计学课件_第5页
已阅读5页,还剩655页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章緒論第1頁共666頁第一章緒論

第一節醫學統計學的定義和內容醫學統計學(medicalstatistics)---是以醫學理論為指導,運用數理統計學的原理和方法研究醫學資料的搜集、整理與分析,從而掌握事物內在客觀規律的一門學科。第1章緒論第2頁共666頁醫學研究的對象----主要是人以及與其健康有關的各種影響因素。醫學統計學的主要內容

:1.統計設計包括實驗設計和調查設計,它可以合理地、科學地安排實驗和調查工作,使之能較少地花費人力、物力和時間,取得較滿意和可靠的結果。2.資料的統計描述和總體指標的估計通過計算各種統計指標和統計圖表來描述資料的集中趨勢、離散趨勢和分佈特徵況(如正態分佈或偏態分佈);利用樣本指標來估計總體指標的大小。

第1章緒論第3頁共666頁3.假設檢驗是通過統計檢驗方法(如t檢驗、u檢驗、F檢驗、卡方檢驗、秩和檢驗等)來推斷兩組或多組統計指標的差異是抽樣誤差造成的還是有本質的差別。4.相關與回歸醫學中存在許多相互聯繫、相互制約的現象。如兒童的身高與體重、胸圍與肺活量、血糖與尿糖等,都需要利用相關與回歸來分析。第1章緒論第4頁共666頁5.多因素分析如多元回歸、判別分析、聚類分析、正交設計分析、主成分分析、因數分析、logistic回歸、Cox比例風險回歸等,都是分析醫學中多因素有效的方法(本書不涉及,請參考有關統計書籍)。這些方法計算複雜,大部分需借助電腦來完成。

6.健康統計研究人群健康的指標與統計方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預測等方法第1章緒論第5頁共666頁醫學統計工作可分為四個步驟:統計設計、搜集資料、整理資料和分析資料。這四個步驟密切聯繫,缺一不可,任何一個步驟的缺陷和失誤,都會影響統計結果的正確性。第二節統計工作的基本步驟第1章緒論第6頁共666頁設計(design)是統計工作的第一步,也是關鍵的一步,是對統計工作全過程的設想和計畫安排。統計設計---就是根據研究目的確定試驗因素、受試對象和觀察指標,並在現有的客觀條件下決定用什麼方式和方法來獲取原始資料,並對原始資料如何進行整理,以及整理後的資料應該計算什麼統計指標和統計分析的預期結果如何等。一、統計設計第1章緒論第7頁共666頁搜集資料(collectionofdate)——是根據設計的要求,獲取準確可靠的原始資料,是統計分析結果可靠的重要保證。醫學統計資料的來源主要有以下三個方面:1.統計報表統計報表是醫療衛生機構根據國家規定的報告制度,定期逐級上報的有關報表。如法定傳染病報表、出生死亡報表、醫院工作報表等,報表要完整、準確、及時。

二、搜集資料第1章緒論第8頁共666頁2.醫療衛生工作記錄如病歷、醫學檢查記錄、衛生監測記錄等。3.專題調查或實驗研究它是根據研究目的選定的專題調查或實驗研究,搜集資料有明確的目的與針對性。它是醫學科研資料的主要來源。第1章緒論第9頁共666頁

整理資料(sortingdata)的目的就是將搜集到的原始資料進行反復核對和認真檢查,糾正錯誤,分類匯總,使其系統化、條理化,便於進一步的計算和分析。整理資料的過程如下:1.審核:認真檢查核對,保證資料的準確性和完整性。2.分組:歸納分組,分組方法有兩種:①品質分組,即將觀察單位按其類別或屬性分組,如按性別、職業、陽性和陰性等分組。②數量分組,即將觀察單位按其數值的大小分組,如按年齡的大小、藥物劑量的大小等分組。三、整理資料

第1章緒論第10頁共666頁3.匯總:分組後的資料要按照設計的要求進行匯總,整理成統計表。原始資料較少時用手工匯總,當原始資料較多時,可使用電腦匯總。四、分析資料

分析資料(analysisofdata)——是根據設計的要求,對整理後的數據進行統計學分析,結合專業知識,作出科學合理的解釋。第1章緒論第11頁共666頁1.統計描述(descriptivestatistics)

將計算出的統計指標與統計表、統計圖相結合,全面描述資料的數量特徵及分佈規律。

2.統計推斷(inferentialstatistics)

使用樣本資訊推斷總體特徵。通過樣本統計量進行總體參數的估計和假設檢驗,以達到瞭解總體的數量特徵及其分佈規律,才是最終的研究目的。統計分析包括以下兩大內容:第1章緒論第12頁共666頁醫學統計資料按研究指標的性質一般分為定量資料、定性資料和等級資料三大類。一、定量資料定量資料(quantitativedata)亦稱計量資料(measurementdata),是用定量的方法測定觀察單位(個體)某項指標數值的大小,所得的資料稱定量資料。如身高(㎝)、體重(㎏)、脈搏(次/分)、血壓(kPa)等為數值變數,其組成的資料為定量資料。第三節統計資料的類型第1章緒論第13頁共666頁

定性資料(qualitativedata)亦稱計數資料(enumerationdata)或分類資料(categoricaldata),是將觀察單位按某種屬性或類別分組,清點各組的觀察單位數,所得的資料稱定性資料。定性資料的觀察指標為分類變數(categoricalvariable)。如人的性別按男、女分組;化驗結果按陽性、陰性分組;動物實驗按生存、死亡分組;調查某人群的血型按A、B、O、AB分組等,觀察單位出現的結果為分類變數,分類變數沒有量的差別,只有質的不同,其組成的資料為定性資料。二、定性資料第1章緒論第14頁共666頁三、等級資料等級資料(rankeddata)亦稱有序分類資料(ordinalcategoricaldata),是將觀察單位按屬性的等級分組,清點各組的觀察單位數,所得的資料為等級資料。如治療結果分為治癒、顯效、好轉、無效四個等級。

第1章緒論第15頁共666頁

根據需要,各類變數可以互相轉化。若按貧血的診斷標準將血紅蛋白分為四個等級:重度貧血、中度貧血、輕度貧血、正常,可按等級資料處理。有時亦可將定性資料或等級資料數量化,如將等級資料的治療結果賦以分值,分別用0、1、2…等表示,則可按定量資料處理。如調查某人群的尿糖的情況,以人為觀察單位,結果可分—、±、+、++、+++五個等級。第1章緒論第16頁共666頁同質(homogeneity)是指觀察單位或研究個體間被研究指標的主要影響因素相同或基本相同。如研究兒童的生長發育,同性別、同年齡、同地區、同民族、健康的兒童即為同質兒童。變異(variation)由於生物個體的各種指標所受影響因素極為複雜,同質的個體間各種指標存在差異,這種差異稱為變異。如同質的兒童身高、體重、血壓、脈搏等指標會有一定的差別。第四節統計學中的幾個基本概念

一、同質與變異第1章緒論第17頁共666頁二、總體與樣本樣本(sample):是從總體中隨機抽取的部分觀察單位變數值的集合。樣本的例數稱為樣本含量(samplesize)。注意:1。總體是相對的,總體的大小是根據研究目的而確定的。2。樣本應有代表性,即應該隨機抽樣並有足夠的樣本含量。

第1章緒論第18頁共666頁圖示:總體與樣本populationsample2sample1sample3sample4sample5第1章緒論第19頁共666頁三、參數與統計量參數(parameter):由總體計算或得到的統計指標稱為參數。總體參數具有很重要的參考價值。如總體均數μ,總體標準差σ等。統計量(statistic):由樣本計算的指標稱為統計量。如樣本均數,樣本標準差s等。注意:一般不容易得到參數,而容易獲得樣本統計量。第1章緒論第20頁共666頁四、抽樣誤差抽樣誤差(sampleerror):由於隨機抽樣所引起的樣本統計量與總體參數之間的差異以及樣本統計量之間的差別稱為抽樣誤差。如樣本均數與總體均數之間的差別,樣本率與總體率的差別等。注意:抽樣誤差是不可避免的。無論抽樣抽得多麼好,也會存在抽樣誤差。第1章緒論第21頁共666頁五、概率概率(probability):是描述隨機事件發生可能性大小的量值。用英文大寫字母P來表示。概率的取值範圍在0~1之間。當P=0時,稱為不可能事件;當P=1時,稱為必然事件。小概率事件:統計學上一般把P≤0.05或P≤0.01的事件稱為小概率事件。小概率原理:小概率事件在一次試驗中幾乎不可能發生。利用該原理可對科研資料進行假設檢驗。第1章緒論第22頁共666頁第五節學習醫學統計學應注意的問題1.重點掌握醫學統計學的基本知識、基本技能、基本概念和基本方法,掌握使用範圍和注意事項。2.要培養科學的統計思維方法,提高分析問題、解決問題的能力。3.掌握調查設計和實驗設計的原則,培養搜集、整理、分析統計資料的系統工作能力。第1章緒論第23頁共666頁課後作業

列舉出計量資料、分類資料、等級資料各10個實例。列舉出可能事件、必然事件、不可能事件及小概率事件各10個。認真復習本章已學過的基本概念2-3遍。第1章緒論第24頁共666頁BestWishestoAllofYou!ThankYouforListening!THEEND第2章定量資料統計描述第25頁醫學本科生用主講程琮泰山醫學院預防醫學教研室zcheng@醫學統計學第2章定量資料統計描述第26頁Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege第2章定量資料統計描述第27頁第2章定量資料的統計描述目錄

第二節集中趨勢的描述

第三節離散趨勢的描述

第四節正態分佈

第一節頻數分佈表第2章定量資料統計描述第28頁統計描述:是用統計圖表、統計指標來描述資料的分佈規律及其數量特徵。頻數分佈表(frequencydistributiontable):主要由組段和頻數兩部分組成表格。第一節頻數分佈表第二章定量資料的統計描述第2章定量資料統計描述第29頁二、頻數分佈表的編制

編制步驟:1.計算全距(range):一組變數值最大值和最小值之差稱為全距(range),亦稱極差,常用R表示。2.確定組距(classinterval):組距用i表示;3.劃分組段:每個組段的起點稱組下限,終點稱組上限。一般分為8~15組。;4.統計頻數:將所有變數值通過劃記逐個歸入相應組段;5.頻率與累計頻率:將各組的頻數除以n所得的比值被稱為頻率。累計頻率等於累計頻數除以總例數。

第2章定量資料統計描述第30頁表2-2某年某市120名12歲健康男孩身高(cm)的頻數分佈

身高組段

(1)

頻數

(2)頻率(%)(3)累計頻數

(4)累計頻率(%)(5)125~10.8310.83129~43.3354.17133~108.341512.50…………………………合計120100.00第2章定量資料統計描述第31頁第2章定量資料統計描述第32頁二、頻數分佈表的用途1.揭示資料的分佈類型2.觀察資料的集中趨勢和離散趨勢3.便於發現某些特大或特小的可疑值4.便於進一步計算統計指標和作統計處理第2章定量資料統計描述第33頁第2章定量資料統計描述第34頁第二節集中趨勢的描述集中趨勢:代表一組同質變量值的集中趨勢或平均水準。常用的平均數有算術均數、幾何均數和中位數。另外不常用的有:眾數,調和平均數和調整均數等。第2章定量資料統計描述第35頁一、算術均數

算術均數(arithmeticmean):簡稱均數。適用條件:對稱分佈或近似對稱分佈的資料。習慣上以希臘字母μ表示總體均數(populationmean),以英文字母表示樣本均數(samplemean)第2章定量資料統計描述第36頁1.直接法:用於觀察值個數不多時

計算方法第2章定量資料統計描述第37頁2.加權法(weightingmethod):用於變數值個數

較多時。注意:權數即頻數f,為權重權衡之意。第2章定量資料統計描述第38頁

身高

(1)

組中值X(2)

頻數f(3)fX(4)=(2)(3)fX2(5)=(2)(4)125~127112716129129~131452468644133~135101350182250…………………………合計120171682460040表2-4120名12歲健康男孩身高(cm)均數和標準差加權法計算表

第2章定量資料統計描述第39頁第2章定量資料統計描述第40頁120名12歲健康男孩身高均數為143.07cm。

計算結果第2章定量資料統計描述第41頁幾何均數(geometricmean,簡記為G):表示其平均水準。適用條件:對於變數值呈倍數關係或呈對數正態分佈(正偏態分佈),如抗體效價及抗體滴度,某些傳染病的潛伏期,細菌計數等。計算公式:有直接法和加權法。

二、幾何均數第2章定量資料統計描述第42頁1.直接法:用於變數值的個數n較少時第2章定量資料統計描述第43頁直接法計算實例第2章定量資料統計描述第44頁2.加權法:用於資料中相同變數值的個數f(即頻數)較多時。第2章定量資料統計描述第45頁

抗體滴度(1)頻數f

(2)滴度倒數X

(3)lgX

(4)flgX(5)=(2)(4)1:4240.60201.20401:8680.90315.41861:167161.20418.4287…………………………合計50

--89.1045表2-550名兒童麻疹疫苗接種後血凝抑制抗體滴度幾何均數計算表第2章定量資料統計描述第46頁第2章定量資料統計描述第47頁50名兒童麻疹疫苗接種後平均血凝抑制抗體滴度為1:60.55。計算結果:將有關已知數據代入公式有第2章定量資料統計描述第48頁①變數值中不能有0;

②不能同時有正值和負值;

③若全是負值,計算時可先把負號去掉,得出結果後再加上負號。計算幾何均數注意事項:第2章定量資料統計描述第49頁㈠中位數

定義:將一組變數值從小到大按順序排列,位次居中的變數值稱為中位數(median,簡記為M)。適用條件:①變數值中出現個別特小或特大的數值;②資料的分佈呈明顯偏態,即大部分的變數值偏向一側;③變數值分佈一端或兩端無確定數值,只有小於或大於某個數值;④資料的分佈不清。

三、中位數及百分位數第2章定量資料統計描述第50頁定義:百分位數(percentile)是一種位置指標,以Px表示。百分位數是將頻數等分為一百的分位數。一組觀察值從小到大按順序排列,理論上有x%的變數值比Px小,有(100-x)%的變數值比Px大。故P50分位數也就是中位數,即P50=M

。㈡百分位數第2章定量資料統計描述第51頁①描述一組資料在某百分位置上的水準;②用於確定正常值範圍;③計算四分位數間距。百分位數的應用條件:第2章定量資料統計描述第52頁計算方法:有直接法和加權法1.直接法:用於例數較少時n為奇數時n為偶數時

第2章定量資料統計描述第53頁2.頻數表法:用於例數較多時中位數百分位數第2章定量資料統計描述第54頁

潛伏期(小時)(1)頻數f

(2)累計頻數(3)累計頻率(%)(4)0~171711.76~466343.412~3810169.9……………………合計145

--表2-6145例食物中毒病人潛伏期分佈表第2章定量資料統計描述第55頁第2章定量資料統計描述第56頁先找到包含Px的最小累計頻率;該累計頻率同行左邊的組段值為L;L同行右邊的頻數為fx(或fm);L前一行的累計頻數為∑fL;將上述已知條件代入公式計算Px或P50。計算中位數及百分位數的步驟:第2章定量資料統計描述第57頁計算結果:第2章定量資料統計描述第58頁定義:用來說明變數值的離散程度或變異程度。注意:僅用集中趨勢尚不能完全反映一組數據的特徵。故應將集中趨勢和離散趨勢結合起來才能更好地反映一組數據的特徵。常用離散指標有:極差、四分位數間距、標準差、方差、變異係數。第三節離散趨勢的描述第2章定量資料統計描述第59頁甲組:184186188190192乙組:180184188192196兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標。實例分析第2章定量資料統計描述第60頁㈠極差

極差(range,簡記為R)亦稱全距,即一組變數值中最大值與最小值之差。特點:計算簡單,不穩定,不全面,易變化;可用於各種分佈的資料。一、極差和四分位數間距第2章定量資料統計描述第61頁㈡四分位數間距

公式:

Q=P75-P25

特點:比極差穩定,只反映中間兩端值的差異。計算不太方便。可用於各種分佈的資料。第2章定量資料統計描述第62頁二、方差和標準差㈠方差(variance)總體方差樣本方差第2章定量資料統計描述第63頁自由度(degreeoffreedom)的概念n-1是自由度,用希臘小寫字母ν表示,讀作[nju:]。定義:在N維或N度空間中能夠自由選擇的維數或度數。例:A+B=C,共有n=3個元素,其中只能任選2個元素的值,故自由度ν=n-1=3-1=2。第2章定量資料統計描述第64頁方差的特點充分反映每個數據間的離散狀況,意義深刻;指標穩定,應用廣泛,但計算較為複雜,不易理解;方差的單位與原數據不同,有時使用時不太方便;在方差分析中應用甚廣而極為重要。第2章定量資料統計描述第65頁(二)標準差(standarddeviation)總體標準差樣本標準差第2章定量資料統計描述第66頁牢記:離均差平方和展開式:第2章定量資料統計描述第67頁標準差的特點:意義同方差,是方差的開平方;標準差的單位與原數據相同,使用方便,意義深刻,應用廣泛;故一般已作為醫學生物學領域中反映變異的標準,故稱標準差。第2章定量資料統計描述第68頁標準差的計算方法:可分為直接法和加權法。

1.直接法

2.加權法第2章定量資料統計描述第69頁直接法:標準差計算實例:例2.12例2.2中7名正常男子紅細胞數(1012/L)如下:4.67,4.74,4.77,4.88,4.76,4.72,4.92,計算其標準差。∑x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46

∑x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99

第2章定量資料統計描述第70頁計算結果:第2章定量資料統計描述第71頁例2.13對表2-4資料用加權法計算120名12歲健康男孩身高值的標準差。加權法:標準差計算實例:在表2-4中已算得∑fx=17168,∑fx2=2460040,代入公式第2章定量資料統計描述第72頁變異係數(coefficientofvariation):

簡記為CV

;特徵:①變異係數為無量綱單位,可以比較不同單位指標間的變異度;②變異係數消除了均數的大小對標準差的影響,所以可以比較兩均數相差較大時指標間的變異度。三、變異係數第2章定量資料統計描述第73頁例2.14某地20歲男子160人,身高均數為166.06cm,標準差為4.95cm;體重均數為53.72kg,

標準差為4.96kg。試比較身高與體重的變異程度。變異係數計算實例第2章定量資料統計描述第74頁身高

體重變異係數計算結果第2章定量資料統計描述第75頁第四節正態分佈一、正態分佈的概念和特徵

正態分佈(normaldistribution):也稱高斯分佈,是醫學和生物學最常見的連續性分佈。如身高、體重、紅細胞數、血紅蛋白等。第2章定量資料統計描述第76頁圖2-1120名12歲健康男孩身高的頻數分佈第2章定量資料統計描述第77頁㈠正態分佈的函數和圖形正態分佈的密度函數,即正態曲線的方程為:第2章定量資料統計描述第78頁圖2-2頻數分佈逐漸接近正態分佈示意第2章定量資料統計描述第79頁為了應用方便,常按公式(2.19)作變數變換u值稱為標準正態變數或標準正態離差,有的參考書也將u值稱為z值。第2章定量資料統計描述第80頁這樣將正態分佈變換為標準正態分佈

(standardnormaldistribution)第2章定量資料統計描述第81頁圖2-3正態分佈的面積與縱高

第2章定量資料統計描述第82頁㈡正態分佈的特徵1.集中性正態曲線的高峰位於正中央,即均數所在的位置。對稱性正態曲線以均數為中心,左右對稱,3.正態分佈有兩個參數,即均數和標準差。4.正態曲線下麵積有一定的分佈規律

第2章定量資料統計描述第83頁圖2-4不同標準差的正態分佈示意第2章定量資料統計描述第84頁二、正態曲線下麵積的分佈規律第2章定量資料統計描述第85頁標準正態分佈表(u值表)

標準正態分佈曲線下的面積,由此表可查出曲線下某區間的面積。查表時應注意:①表中曲線下麵積為-∞到u

的下側累計面積;②當已知μ、σ、和X時,先按公式(2.19)求得u值,再查表;當和未知時,並且樣本例數在100例以上,常用樣本均數和標準差S分別代替μ和σ,按公式(2.19)求得u值;③曲線下橫軸上的總面積為100%或1第2章定量資料統計描述第86頁

例2.16

前例2.1中,某年某市120名12歲健康男孩身高,已知均數=143.07cm,標準差S=5.70cm,①估計該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數的百分數;②估計身高界於135cm~150cm範圍內12歲男孩的比例;③分別求出均數±1S、均數±1.96S、均數±2.58S範圍內12歲男孩人數占該120名男孩總數的實際百分數,說明與理論百分數是否接近。

第2章定量資料統計描述第87頁根據題意,按公式(2.19)作u變換第2章定量資料統計描述第88頁身高範圍所占面積

故估計該地12男孩身高在135cm以下者約占7.78%;身高界於135cm~150cm範圍內者約占81.10%。

第2章定量資料統計描述第89頁三、正態分佈的應用㈠制定醫學參考值範圍參考值範圍也稱為正常值範圍。醫學上常把絕大數正常人的某指標範圍稱為該指標的正常值範圍。這裏的“絕大多數”可以是90%、95%、99%,最常用的是95%。㈡品質控制

常以均數±2S作為上、下警戒值,以均數±3S作為上、下控制值。

㈢正態分佈是很多統計方法的理論基礎第2章定量資料統計描述第90頁THEENDTHANKYOUFORLISTENING第3章總體均數的區間估計和假設檢驗第91頁本科生用

醫學統計學教案主講程琮泰山醫學院預防醫學教研室Zcheng@第3章總體均數的區間估計和假設檢驗第92頁Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege第3章總體均數的區間估計和假設檢驗第93頁第3章總體均數的區間估計和假設檢驗目錄

第五節均數的u檢驗

第二節t分佈

第三節總體均數的區間估計

第四節假設檢驗的意義和基本步驟

第一節均數的抽樣誤差與標準誤

第六節均數的t檢驗

第七節兩個方差的齊性檢驗和t’檢驗

第八節Ⅰ型錯誤和Ⅱ型錯誤

第九節應用假設檢驗應注意的問題第3章總體均數的區間估計和假設檢驗第94頁圖示:總體與樣本Populationμsample2sample1sample3sample4sample5第3章總體均數的區間估計和假設檢驗第95頁一、標準誤的意義及其計算統計推斷(statisticalinference)

:根據樣本資訊來推論總體特徵。均數的抽樣誤差:由抽樣引起的樣本均數與總體均數的差異稱為均數的抽樣誤差。標準誤(standarderror):反映均數抽樣誤差大小的指標。

第一節均數的抽樣誤差與標準誤第3章總體均數的區間估計和假設檢驗第96頁σ已知:標準誤計算公式σ未知:第3章總體均數的區間估計和假設檢驗第97頁

實例:如某年某市120名12歲健康男孩,已求得均數為143.07cm,標準差為5.70cm,按公式計算,則標準誤為:第3章總體均數的區間估計和假設檢驗第98頁1.表示抽樣誤差的大小;2.進行總體均數的區間估計;

3.進行均數的假設檢驗等。二、標準誤的應用第3章總體均數的區間估計和假設檢驗第99頁正態變數X採用u=(X-μ)/σ變換,則一般的正態分佈N(μ,σ)即變換為標準正態分佈N(0,1)。又因從正態總體抽取的樣本均數服從正態分佈

N(μ,),同樣可作正態變數的u變換,即第二節t分佈

一、t分佈的概念第3章總體均數的區間估計和假設檢驗第100頁

實際工作中由於理論的標準誤往往未知,而用樣本的標準誤作為的估計值,此時就不是u變換而是t變換了,即下式:第3章總體均數的區間估計和假設檢驗第101頁t分佈於1908年由英國統計學家W.S.Gosset以“Student”筆名發表,故又稱Studentt

分佈(Students’

t-distribution)。第3章總體均數的區間估計和假設檢驗第102頁二、t分佈曲線的特徵t分佈曲線是單峰分佈,以0為中心,左右兩側對稱,曲線的中間比標準正態曲線(u分佈曲線)低,兩側翹得比標準正態曲線略高。t分佈曲線隨自由度υ而變化,當樣本含量越小(嚴格地說是自由度υ=n-1越小),t分佈與u分佈差別越大;當逐漸增大時,t分佈逐漸逼近於u分佈,當υ=∞時,t分佈就完全成正態分佈。t分佈曲線是一簇曲線,而不是一條曲線。t分佈下麵積分布規律:查t分佈表。第3章總體均數的區間估計和假設檢驗第103頁t分佈示意圖第3章總體均數的區間估計和假設檢驗第104頁t分佈曲線下雙側或單側尾部合計面積我們常把自由度為υ的t分佈曲線下雙側尾部合計面積或單側尾部面積為指定值α時,則橫軸上相應的t界值記為tα,υ。如當υ=20,α=0.05時,記為t0.05,20;當υ=22,α=0.01時,記為t0.01,22。對於tα,υ值,可根據α和υ值,查附表2,t界值表。第3章總體均數的區間估計和假設檢驗第105頁t分佈是t檢驗的理論基礎。由公式(3.4)可知,│t│值與樣本均數和總體均數之差成正比,與標準誤成反比。在t分佈中│t│值越大,其兩側或單側以外的面積所占曲線下總面積的比重就越小,說明在抽樣中獲得此│t│值以及更大│t│值的機會就越小,這種機會的大小是用概率P來表示的。│t│值越大,則P值越小;反之,│t│值越小,P值越大。根據上述的意義,在同一自由度下,│t│≥tα

,則P≤α;反之,│t│<tα,則P>α。第3章總體均數的區間估計和假設檢驗第106頁第三節總體均數的區間估計參數估計:用樣本指標(統計量)估計總體指標(參數)稱為參數估計。估計總體均數的方法有兩種,即:點值估計(pointestimation)區間估計(intervalestimation)。第3章總體均數的區間估計和假設檢驗第107頁一、點值估計點值估計:是直接用樣本均數作為總體均數的估計值。此法計算簡便,但由於存在抽樣誤差,通過樣本均數不可能準確地估計出總體均數大小,也無法確知總體均數的可靠程度。第3章總體均數的區間估計和假設檢驗第108頁二、區間估計區間估計是按一定的概率(1-α)估計包含總體均數可能的範圍,該範圍亦稱總體均數的可信區間(confidenceinterval,縮寫為CI)。1-α稱為可信度,常取1-α為0.95和0.99,即總體均數的95%可信區間和99%可信區間。1-α(如95%)可信區間的含義是:總體均數被包含在該區間內的可能性是1-α,即(95%),沒有被包含的可能性為α,即(5%)。第3章總體均數的區間估計和假設檢驗第109頁總體均數的可信區間的計算1.未知σ且n較小(n<100)按t分佈的原理2.已知σ或n較大(n≥100)按u分佈的原理第3章總體均數的區間估計和假設檢驗第110頁95%的可信區間為123.7±2.064×2.38,即(118.79,128.61)。故該地1歲嬰兒血紅蛋白平均值95%的可信區間為118.7~128.61(g/L)。例3.1

為了瞭解某地1歲嬰兒的血紅蛋白濃度,從該地隨機抽取了1歲嬰兒25人,測得其血紅蛋白的平均數為123.7g/L,標準差為11.9g/L。試求該地1歲嬰兒的血紅蛋白平均值95%的可信區間。第3章總體均數的區間估計和假設檢驗第111頁例3.2

上述某市120名12歲健康男孩身高均數為143.07cm,標準誤為0.52cm,試估計該市12歲康男孩身高均數95%和99%的可信區間。95%的可信區間為

143.07±1.96×0.52,即(142.05,144.09)。99%的可信區間為

143.07±2.58×0.52,即(141.73,144.41)。第3章總體均數的區間估計和假設檢驗第112頁注意點標準誤愈小,估計總體均數可信區間的範圍也愈窄,說明樣本均數與總體均數愈接近,對總體均數的估計也愈精確;反之,標準誤愈大,估計總體均數可信區間的範圍也愈寬,說明樣本均數距總體均數愈遠,對總體均數的估計也愈差。第3章總體均數的區間估計和假設檢驗第113頁表3-1標準差和標準誤的區別

第3章總體均數的區間估計和假設檢驗第114頁第四節假設檢驗的意義和基本步驟假設檢驗(hypothesistest):亦稱顯著性檢驗(significancetest),是統計推斷的重要內容。它是指先對總體的參數或分佈作出某種假設,再用適當的統計方法根據樣本對總體提供的資訊,推斷此假設應當拒絕或不拒絕。第3章總體均數的區間估計和假設檢驗第115頁例3.3

根據大量調查,已知健康成年男子脈搏的均數為72次/分鐘,某醫生在一山區隨機測量了25名健康成年男子脈搏數,求得其均數為74.2次/分鐘,標準差為6.5次/分鐘,能否認為該山區成年男子的脈搏數與一般健康成年男子的脈搏數不同?

本例兩個均數不等有兩種可能性:①山區成年男子的脈搏總體均數與一般健康成年男子的脈搏總體均數是相同的,差別僅僅由於抽樣誤差所致;②受山區某些因素的影響,兩個總體的均數是不相同的。如何作出判斷呢?按照邏輯推理,如果第一種可能性較大時,可以接受它,統計上稱差異無統計學意義(nostatisticalsignificance);如果第一種可能性較小時,可以拒絕它而接受後者,統計上稱差異有統計學意義(statisticalsignificance)。

第3章總體均數的區間估計和假設檢驗第116頁假設檢驗的一般步驟如下:1.建立檢驗假設一種是無效假設(nullhypothesis),符號為H0;一種是備擇假設(alternativehypothesis)符號為H1。H0:

H1:第3章總體均數的區間估計和假設檢驗第117頁

表3-2樣本均數所代表的未知總體均數

與已知總體均數的比較第3章總體均數的區間估計和假設檢驗第118頁表3-3兩樣本均數所代表的未知總體均數的比較第3章總體均數的區間估計和假設檢驗第119頁2.確定檢驗水準

檢驗水準(sizeofatest)亦稱顯著性水準(significancelevel),符號為α

。它是判別差異有無統計意義的概率水準,其大小應根據分析的要求確定。通常取α

α=0.05。3.選定檢驗方法和計算統計量根據研究設計的類型和統計推斷的目的要求選用不同的檢驗方法。如完全隨機設計中,兩樣本均數的比較可用t檢驗,樣本含量較大時(n>100),可用u檢驗。不同的統計檢驗方法,可得到不同的統計量,如t值和u值。第3章總體均數的區間估計和假設檢驗第120頁4.確定概率P值

P值是指在H0所規定的總體中作隨機抽樣,獲得等於及大於(或小於)現有統計量的概率。│t│≥tα,υ,則P≤α;│t│<tα,υ,則P>α。

第3章總體均數的區間估計和假設檢驗第121頁5.作出推斷結論

①當P≤α時,表示在H0成立的條件下,出現等於及大於現有統計量的概率是小概率,根據小概率事件原理,現有樣本資訊不支持H0,因而拒絕H0,結論為按所取檢驗水準拒絕H0,接受H1,即差異有統計學意義,如例3.3可認為兩總體脈搏均數有差別;②當P>α時,表示在H0成立的條件下,出現等於及大於現有統計量的概率不是小概率,現有樣本資訊還不能拒絕H0,結論為按所取檢驗水準不拒絕H0,即差異無統計意義,如例3.3尚不能認為兩總體脈搏均數有差別。第3章總體均數的區間估計和假設檢驗第122頁下結論時的注意點:P≤α,拒絕H0,不能認為H0肯定不成立,因為雖然在H0成立的條件下出現等於及大於現有統計量的概率雖小,但仍有可能出現;同理,P>α,不拒絕H0,更不能認為H0肯定成立。由此可見,假設檢驗的結論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發生錯誤,即第一類錯誤或第二類錯誤第3章總體均數的區間估計和假設檢驗第123頁第五節均數的u檢驗國外統計書籍及統計軟體亦稱為單樣本u檢驗(onesampleu-test)。樣本均數與總體均數比較的u檢驗適用於:①總體標準差σ已知的情況;②樣本含量較大時,比如n>100時。對於後者,是因為n較大,υ也較大,則t分佈很接近u分佈的緣故。一、樣本均數與總體均數比較的u檢驗第3章總體均數的區間估計和假設檢驗第124頁u

值的計算公式為:總體標準差σ已知時,不管n的大小。總體標準差σ未知時,但n>100時。第3章總體均數的區間估計和假設檢驗第125頁例3.4

某托兒所三年來測得21~24月齡的47名男嬰平均體重11kg。查得近期全國九城市城區大量調查的同齡男嬰平均體重11.18kg,標準差為1.23kg。問該托兒所男嬰的體重發育狀況與全國九城市的同期水準有無不同?(全國九城市的調查結果可作為總體指標)實例第3章總體均數的區間估計和假設檢驗第126頁(1)建立檢驗假設H0:μ=μ0

,即該托兒所男嬰的體重發育狀況與全國九城市的同期水準相同,α=0.05(雙側)H1:μ≠μ0

,即該托兒所男嬰的體重發育狀況與全國九城市的同期水準不同。(2)計算u值本例因總體標準差σ已知,故可用u檢驗。本例n=47,樣本均數=11,總體均數=11.18,總體標準差=1.23,代入公式(3.7)第3章總體均數的區間估計和假設檢驗第127頁(3)確定P值,作出推斷結論查u界值表(附表2,t界值表中為∞一行),得u0.05=1.96,u=1.003<u0.05=1.96,故P>0.05。按α=0.05水準,不拒絕H0,差異無統計學意義。結論:可認為該托兒所男嬰的體重發育狀況與全國九城市的同期水準相同。第3章總體均數的區間估計和假設檢驗第128頁二、兩樣本均數比較的u檢驗該檢驗也稱為獨立樣本u檢驗(independentsampleu-test),適用於兩樣本含量較大(如n1>50且n2>50)時,u值可按下式計算:第3章總體均數的區間估計和假設檢驗第129頁

例3.5

測得某地20~24歲健康女子100人收縮壓均數為15.27kPa,標準差為1.16kPa;又測得該地20~24歲健康男子100人收縮壓均數為16.11kPa,標準差為1.41kPa。問該地20~24歲健康女子和男子之間收縮壓均數有無差別?實例第3章總體均數的區間估計和假設檢驗第130頁(1)建立檢驗假設

H0:μ1

=μ2

,即該地20~24歲健康女子和男子之間收縮壓均數相同;

H1:μ1≠μ2

,即該地20~24歲健康女子和男子之間收縮壓均數不同。

α=0.05(雙側)(2)計算u值

本例n1=100,均數1=15.27,S1=1.16

n2=100,均數2=16.11,S2=1.41第3章總體均數的區間估計和假設檢驗第131頁(3)確定P值,作出推斷結論查u界值表(附表2,t界值表中為∞一行),得u0.05=1.96,現u>u0.05=1.96,故P<0.05。按水準α=0.05,拒絕H0,接受H1,差異有統計學意義。結論:可認為該地20~24歲健康人的收縮壓均數男性高於女性。第3章總體均數的區間估計和假設檢驗第132頁第六節均數的t檢驗當樣本含量較小(如n<50)時,t分佈和u分佈有較大的出入,所以小樣本的樣本均數與總體均數的比較以及兩個樣本均數的比較要用t檢驗。t檢驗的適用條件:①樣本來自正態總體或近似正態總體;②兩樣本總體方差相等。第3章總體均數的區間估計和假設檢驗第133頁一、樣本均數與總體均數比較的t檢驗亦稱為單樣本t檢驗(onesamplet-test)。即樣本均數代表的未知總體均數與已知的總體均數(一般為理論值、標準值或經過大量觀察所得的穩定值等)進行比較。這時檢驗統計量t值的計算在H0成立的前提條件下由公式(3.4)變為:第3章總體均數的區間估計和假設檢驗第134頁例3.6對例3.3資料進行t檢驗。(1)建立檢驗假設

H0:μ=μ0

,即該山區健康成年男子脈搏均數與一般健康成年男子脈搏均數相同;

H1:μ≠μ0

,即該山區健康成年男子脈搏均數與一般健康成年男子脈搏均數不同。α=0.05(雙側)

(2)計算t值本例n=25,s=6.5,樣本均數=74.2,總體均數=72,代入公式(3.10)第3章總體均數的區間估計和假設檢驗第135頁(3)確定P值,作出推斷結論

本例υ=25-1=24,查附表2,t界值表,得t0.05,24=2.064,現t=1.692<t0.05,24=2.064,故P>0.05。按α=0.05的水準,不拒絕H0,差異無統計學意義。結論:即根據本資料還不能認為此山區健康成年男子脈搏數與一般健康成年男子不同。第3章總體均數的區間估計和假設檢驗第136頁二、配對資料的t檢驗醫學科研中配對資料的三種主要類型:同一批受試對象治療前後某些生理、生化指標的比較;同一種樣品,採用兩種不同的方法進行測定,來比較兩種方法有無不同;配對動物試驗,各對動物試驗結果的比較等。配對實驗設計得到的資料稱為配對資料。第3章總體均數的區間估計和假設檢驗第137頁

先求出各對子的差值d的均值,若兩種處理的效應無差別,理論上差值d的總體均數應為0。

所以這類資料的比較可看作是樣本均數與總體均數為0的比較。

要求差值的總體分佈為正態分佈。

t檢驗的公式為:配對資料的t檢驗(pairedsamplest-test)第3章總體均數的區間估計和假設檢驗第138頁例3.7

設有12名志願受試者服用某減肥藥,服藥前和服藥後一個療程各測量一次體重(kg),數據如表3-4所示。問此減肥藥是否有效?(1)建立檢驗假設

H0:μd=0,即該減肥藥無效;

H1:μd≠0,即該減肥藥有效。單側α=0.05第3章總體均數的區間估計和假設檢驗第139頁表3-4某減肥藥研究的體重(kg)觀察值第3章總體均數的區間估計和假設檢驗第140頁(2)計算t值本例n=12,Σd=-16,Σd2

=710,差值的均數=Σd/n=-16/12=-1.33(kg)第3章總體均數的區間估計和假設檢驗第141頁(3)確定P值,作出推斷結論自由度=n-1=12-1=11,查附表2,t界值表,得單側t0.05,11=2.201,現t=0.58<t0.05,11=2.201,故P>0.05。按α=0.05水準,不拒絕H0,差異無統計學意義。結論:故尚不能認為該減肥藥有減肥效果。第3章總體均數的區間估計和假設檢驗第142頁例3.8

某單位研究飲食中缺乏維生素E與肝中維生素A含量的關係,將同種屬的大白鼠按性別相同,年齡、體重相近配成8對,並將每對中的兩頭動物隨機分到正常飼料組和維生素E缺乏組,然後定期將大白鼠殺死,測得其肝中維生素A的含量如表3-5。

問不同飼料組的大白鼠肝中維生素A含量有無差別?

(自學內容)第3章總體均數的區間估計和假設檢驗第143頁三、兩樣本均數比較的t檢驗兩本均數比較的t檢驗亦稱為成組t檢驗,又稱為獨立樣本t檢驗(independentsamplest-test)。適用於比較按完全隨機設計而得到的兩組資料,比較的目的是推斷它們各自所代表的總體均數和是否相等。第3章總體均數的區間估計和假設檢驗第144頁樣本估計值為:總體方差已知:標準誤的計算公式第3章總體均數的區間估計和假設檢驗第145頁若n1=n2時:已知S1和S2時:第3章總體均數的區間估計和假設檢驗第146頁例3.9

測得14名慢性支氣管炎病人與11名健康人的尿中17酮類固醇(mol/24h)排出量如下,試比較兩組人的尿中17酮類固醇的排出量有無不同。原始調查數據如下:病人X1:n=14;10.0518.7518.9915.9413.9617.6720.5117.2214.6915.109.428.217.2424.60健康人X2:n=11;17.9530.4610.8822.3812.8923.0113.8919.4015.8326.7217.29第3章總體均數的區間估計和假設檢驗第147頁(1)建立檢驗假設

H0:μ1

=μ2

,即病人與健康人的尿中17酮類固醇的排出量相同H1:μ1≠μ2

,即病人與健康人的尿中17酮類固醇的排出量不同α=0.05

第3章總體均數的區間估計和假設檢驗第148頁(2)計算t值本例n1=14,ΣX1=212.35,ΣX12=3549.0919

n2=11,ΣX2=210.70,ΣX22=4397.64第3章總體均數的區間估計和假設檢驗第149頁(3)確定P值作出推斷結論

υ=14+11-2=23,查t界值表,得t0.05,23=2.069,現t=1.8035<t0.05,23=2.069,故P>0.05。按α=0.05水準,不拒絕H0,差異無統計學意義。結論:尚不能認為慢性支氣管炎病人與健康人的尿中17酮類固醇的排出量不同。第3章總體均數的區間估計和假設檢驗第150頁四、兩樣本幾何均數t檢驗比較兩樣本幾何均數的目的是推斷它們各自代表的總體幾何均數有無差異。適用於:①觀察值呈等比關係,如血清滴度;②觀察值呈對數正態分佈,如人體血鉛含量等。。兩樣本幾何均數比較的t檢驗公式與兩樣本均數比較的t檢驗公式相同。只需將觀察X用lgX來代替就行了

第3章總體均數的區間估計和假設檢驗第151頁例3.10將20名鉤端螺旋體病人的血清隨機分為兩組,分別用標準株和水生株作凝溶試驗,抗體滴度的倒數(即稀釋度)結果如下。問兩組抗體的平均效價有無差別?標準株(11人):1002004004004004008001600160016003200水生株(9人):1001001002002002002004001600將兩組數據分別取對數,記為x1,x2。

x1:2.0002.3012.6022.6022.6022.6022.9033.2043.2043.2043.505x2:2.0002.0002.0002.3012.3012.3012.3012.6023.204第3章總體均數的區間估計和假設檢驗第152頁一、兩樣本方差的齊性檢驗用較大的樣本方差S2比較小的樣本方差S2

第七節兩總體方差的齊性檢驗和t'檢驗υ1為分子自由度,υ2為分母自由度第3章總體均數的區間估計和假設檢驗第153頁注意:①方差齊性檢驗本為雙側檢驗,但由於公式(3.18)規定以較大的方差作分子,F值必然大於1,故附表3單側0.025的界值,實對應雙側檢驗P=0.05;②當樣本含量較大時(如n1和n2均大於50),可不必作方差齊性檢驗。第3章總體均數的區間估計和假設檢驗第154頁深層水:n1=8,樣本均數=1.781(mg/L),S1=1.899(mg/L)表層水:n2=10,樣本均數=0.247(mg/L),S2=0.210(mg/L)例3.11

某研究所為了瞭解水體中汞含量的垂直變化,對某氯堿廠附近一河流的表層水和深層水作了汞含量的測定,結果如下。試檢驗兩個方差是否齊性。第3章總體均數的區間估計和假設檢驗第155頁

確定P值作出推斷結論本例υ1=8-1=7,υ2=10-1=9,查附表3,F界值表(方差齊性檢驗用),得F0.05,7,9=4.20,本例F=80.97>F0.05,7,9=4.20;故P<0.05,按α=0.05水準,拒絕H0,接受H1,結論:故可認為兩總體方差不齊。第3章總體均數的區間估計和假設檢驗第156頁方差不齊時,兩小樣本均數的比較,可選用以下方法:①採用適當的變數變換,使達到方差齊的要求;②採用秩和檢驗;③採用近似法t'

檢驗。二、t'檢驗第3章總體均數的區間估計和假設檢驗第157頁計算統計量t'

第3章總體均數的區間估計和假設檢驗第158頁例3.12由例3.11已知表層水和深層水含汞量方差不齊,試比較其均數有無差別?自學內容第3章總體均數的區間估計和假設檢驗第159頁假設檢驗中作出的推斷結論可能發生兩種錯誤:①拒絕了實際上是成立的H0,這叫Ⅰ型錯誤(typeⅠerror)或第一類錯誤,也稱為α錯誤。②不拒絕實際上是不成立的H0,這叫Ⅱ型錯誤(typeⅡerror)或第二類錯誤,也稱為β錯誤。第八節Ⅰ型錯誤和Ⅱ型錯誤第3章總體均數的區間估計和假設檢驗第160頁表3-6可能發生的兩類錯誤第3章總體均數的區間估計和假設檢驗第161頁第3章總體均數的區間估計和假設檢驗第162頁聯繫:一般α增大,則β減小;α減小,則β增大;區別:(1)一般α為已知,可取單側或雙側,如0.05,或0.01。(2)一般β為未知,只取單側,如取0.1或0.2。1-β(把握度)≮0.75。兩類錯誤的聯繫與區別第3章總體均數的區間估計和假設檢驗第163頁1-β稱為檢驗效能(poweroftest)或把握度,其意義是兩總體確有差別,按α水準能發現它們有差別的能力。α與β的大小應根據實際情況適當取值。第3章總體均數的區間估計和假設檢驗第164頁1.資料要來自嚴密的抽樣研究設計2.選用假設檢驗的方法應符合其應用條件3.正確理解差別有無顯著性的統計涵義正確理解差別有統計學意義及臨床上的差別的統計學意義。4.假設檢驗的推斷結論不能絕對化5.要根據資料的性質事先確定採用雙側檢驗或單側檢驗第九節應用假設檢驗的注意問題第3章總體均數的區間估計和假設檢驗第165頁THANKYOUFORLISTENINGTHEEND第4章方差分析第166頁醫學本科生用泰山醫學院預防醫學教研室Email:zcheng@主講程琮醫學統計學第4章方差分析第167頁TeachingPlan

forMedicalStudentsMedicalStatisticsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege第4章方差分析第168頁第4章方差分析目錄

第五節多個方差的齊性檢驗

第二節單因素方差分析

第三節雙因素方差分析

第四節多個樣本均數間的兩兩比較

第一節方差分析的基本思想

第六節變數變換第4章方差分析第169頁第四章方差分析

學習要求:1。掌握方差分析的基本思想;2。掌握單因素、雙因素方差分析的應用條件、意義及計算方法;3。熟悉多個均數間兩兩比較的意義及方法;4。瞭解方差齊性檢驗和t’檢驗的意義及方法;5。熟悉變數變換的意義和方法。第4章方差分析第170頁第一節方差分析的基本思想一、方差分析的用途及應用條件方差分析(analysisofvariance,縮寫為ANOVA)是常用的統計分析方法之一。其應用廣泛,分析效率高,節省樣本含量。主要用途有:①進行兩個或兩個以上樣本均數的比較;②可以同時分析一個、兩個或多個因素對試驗結果的作用和影響;③分析多個因素的獨立作用及多個因素之間的交互作用;④進行兩個或多個樣本的方差齊性檢驗等。方差分析對分析數據的要求及條件比較嚴格,即要求各樣本為隨機樣本,各樣本來自正態總體,各樣本所代表的總體方差齊性或相等。第4章方差分析第171頁

二、方差分析的基本思想處理因素可分為若干個等級或不同類型,通常稱為水準。在不同的水準下進行若干次試驗並取得多個數據,可以將在每個水準下取得的這些數據看作一個樣本。若某個因素有四個水準,每個水準的數據代表一個樣本,則獲得四個樣本的數據。

設有k個相互獨立的樣本,分別來自k個正態總體X1,X2,…Xk,且方差相等,即要求檢驗假設為此假設的意義為,在某處理因素的不同水準下,各樣本的總體均數相等。

第4章方差分析第172頁1。設某因素有多個水準,即試驗數據產生多個樣本。由多個樣本的全部數據可以計算出總變異,稱為總的離均差平方和。即SS總。2。數理統計證明,SS總可以由幾個部分構成。單因素方差分析中,

SS總由組間變異和組內變異構成。

SS總=SS組間+SS組內。3。組間變異主要受到處理因素和個體誤差兩方面影響,組內變異主要受個體誤差的影響。當H0

為真時,由於處理因素不起作用,組間變異只受個體誤差的影響。此時,組間變異與組內變異相差不能太大。第4章方差分析第173頁表4-2PCNA在三種不同胃組織中的表達結果標本Xj不同胃組織XiABC156302124637143392027…………∑Xj553221100874(∑X)ni109827(N)均數55.3024.5612.532.37(總均值)∑Xj2312916273167239236(∑X2)第4章方差分析第174頁4。各種變異除以相應的自由度,稱為均方,用MS表示,也就是方差。當H0為真時,組間均方與組內均方相差不大,兩者比值F值約接近於1。即F=組間均方/組內均方≈1。5。當H0不成立時,處理因素產生了作用,使得組間均方增大,此時,F>>1,當大於等於F臨界值時,則P≤0.05。可認為H0不成立,各樣本均數不全相等。第4章方差分析第175頁三、方差分析的類型1。單因素方差分析(one-wayANOVA)也稱為完全隨機設計(completelyrandomdesign)的方差分析。該設計只能分析一個因素下多個水準對試驗結果的影響。2。雙因素方差分析(two-wayANOVA)稱為隨機區組設計(randomizedblockdesign)的方差分析。該設計可以分析兩個因素。一個為處理因素,也稱為列因素;一個為區組因素,也稱為行因素。第4章方差分析第176頁3。三因素方差分析也稱為拉丁方設計(Latinsquaredesign)的方差分析。該設計特點是,可以同時分析三個因素對試驗結果的作用,且三個因素之間相互獨立,不能有交互作用。4。析因設計(factorialdesign)的方差分析當兩個因素或多個因素之間存在相互影響或交互作用時,可用該設計來進行分析。該設計不僅可以分析多個因素的獨立作用,也可以分析多個因素間的交互作用,是一種高效率的方差分析方法。第4章方差分析第177頁5。正交試驗設計的方差分析如果要分析的因素有三個或三個以上,可進行正交試驗設計(orthogonalexperimentaldesign)的方差分析。當分析因素較多時,試驗次數會急劇增加,用此設計進行分析則更能體現出其優越性。該設計利用正交表來安排各次試驗,以最少的試驗次數,得到更多的分析結果。第4章方差分析第178頁四、方差分析的基本步驟1。計算總變異:指所有試驗數據的離均差平方和。2。計算各部分變異:單因素方差分析中,可以分出組間變異(SS組間)和組內變異(SS組內);雙因素方差分析中,可以分出處理組變異(SS處理),區組變異(SS區組)或稱為配伍組變異(SS配伍)及誤差變異(SS誤差)。

第4章方差分析第179頁3。計算各部分變異的均方在方差分析中,方差也稱為均方,是各部分的離均差平方和除以其相應的自由度,用MS表示。基本公式為:MS=SS/ν

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论