医学统计方法与应用课件_第1页
医学统计方法与应用课件_第2页
医学统计方法与应用课件_第3页
医学统计方法与应用课件_第4页
医学统计方法与应用课件_第5页
已阅读5页,还剩200页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS10forWindows

醫學統計方法與應用(基礎統計)SPSS10介面介紹

(StatisticalProductsandServicesSolutions)窗口類型介紹主介面菜單介紹對話框介紹SPSS系統設置目錄窗口類型介紹數據編輯窗口變數編輯窗口結果輸出窗口腳本編輯窗口命令語句編輯窗口數據觀察/編輯窗口變數名個體序號數據格編輯欄數據格位置變數定義選項:變數名類型數據位小數位標籤數值標籤缺失值數據量度變數定義編輯窗口欄寬對齊方式主介面菜單介紹檔菜單編輯菜單視圖菜單統計分析菜單均數比較子菜單統計分析菜單一般線性模型子菜單統計分析菜單相關分析子菜單統計分析菜單回歸分析子菜單統計分析菜單對數線性分析生存分析非參數檢驗分類分析作圖菜單條形圖線圖面積圖圓圖散點圖直方圖圖形特性描述高_低圖誤差條圖箱圖工具菜單變數資訊定義變數使用變數對話框介紹變數類型設置對話框變數標籤設置對話框SPSS系統設置Edit/Options…

可以對數據、表格、草稿、標題、數據編輯器、結果閱讀器、草稿閱讀器視圖介面進行定義或修改。資料庫建立和結果輸出相關統計學概念(1)SPSS數據統計分析步驟資料庫的建立數據編輯數據保存、轉換和讀取結果輸出數據和結果列印目錄SPSS數據統計分析步驟輸入供SPSS分析的數據選擇統計分析過程為統計分析選擇變數運行過程並對統計結果做出判斷資料庫的建立問題舉例:一個醫生觀察了一組住院病人,完成了其中24名患者的資料收集,指標包括:觀察編號、住院號(inno)、年齡(age)、性別(sex)、身高(x1,cm)、體重(x2,kg)、血壓(收縮壓x3,舒張壓x4,mmHg)、空腹血糖(x5,mmol/L)和胰島素樣生長因數-1水準(igf-1,ng/ml),並根據臨床情況將患者的病情分為5級(x0,1為正常,2為一級,3為二級,4為三級,5為四級),建立其原始數據表。數據分析:住院日期為日期變數病情分級為有序變數(Ordinal)

性別為字元變數(innominal)

其他各指標為連續變數(Scale)

注意到igf-1指標中有個體數據丟失或實驗誤差

編號innoindateagesexx0x1x2x3x4x5ifg-11551744210/21/199623.0男3166.052.5108788.90186.631771728110/16/199625.2女5160.060.090505.99230.321181726410/15/199626.4女4164.058.5100807.59117.45

1712099902/25/199728.0男2 172.061.21107014.07105.74702479706/27/199732.0女2152.042.0118765.89135.89491720410/14/199633.9女2157.058.01468612.418.33

641950301/23/199735.0男3167.068.0124767.94162.401662846010/20/199738.0女1153.550.5114628.81416.74174133210/26/199843.2男3174.080.01449412.60141.731582811710/09/199745.0女2155.067.01801105.76297.581461921812/17/199648.1男2178.069.0110727.44234.852404343712/21/199849.3男3173.069.0110709.80467.81422207503/31/199752.8男2163.062.01258014.87150.62722223904/07/199754.2男2167.572.0140907.80172.551953125701/08/199857.3女2143.541.51528813.530.00

204091010/13/199858.8男2168.061.51107015.80120.42224196511/11/199862.8男2160.060.0140908.83160.37362468106/24/199765.6男3162.052.01667017.79180.41164123110/22/199867.4女2153.062.01408611.9417505/199968.9女1145.042.01085011.72160.331724554903/03/199971.1女4151.061.51509015.80145.97143697806/25/199872.3女2148.050.0966616.88181.51382486806/30/199773.0女2149.051.51167413.16129.26244357912/25/199874.6男4170.060.0160869.37350.09原

表數據編輯(1)剪切複製粘貼清除網格字體File/New…/Data…數據編輯(2)Data/InsertCase

插入個體數據編輯(3)Data/InsertVariable

插入變數數據編輯_變數設置(1)Width、Decimals、Column選項通過微調按鈕調整數值數據編輯_變數設置(2)變數類型數值(默認)逗號點科學記數日期時間貨幣自定義數據類型字元數據編輯_變數設置(5)數據量度Measure有序變數名字變數連續變數數據保存、轉換和讀取數據檔默認保存為*.savFile/Save

File/SaveAs…可以將數據檔轉換為其他格式如:*.xls*.dat*.dbfFile/SaveAs…數據檔讀取:File/Open…/Data…

直接讀取*.sav檔或直接讀取*.xls檔等數據檔結果輸出(1)啟動結果閱讀器SPSSViewer

File/New/Output…分析結果窗分析結果目錄窗結果輸出(2)選擇分析過程,如:Means…

Analyze/CompareMeans/Means…修改選項內容:原文字為Mean更換為平均值結果輸出(3)統計分析_圖表設置

Graphs/Bar…

圖表結果輸出:可以通過Copy複製到其他應用程式,或Export…輸出為圖形檔*.jpg

默認輸出檔:*.spo數據和結果列印可以根據需要列印全部或部分數據按住院號inno排序結果_昇冪行列轉置(Transpose)變數值轉換為變數名變數(Variable)轉換為個體(Case)丟失的變數複置Data/Transpose…行列轉換丟失了name、sex變數,以id變數值作為新數據表變數合併檔(MergeFile)-1Data/Mergefiles…/AddCases…合併檔_僅合併相同變數Data/Mergefiles…/AddVariables…合併檔(MergeFile)-2合併檔_增加變數以主表為主合併所有個體Data/Mergefiles…/AddVariables…合併檔(MergeFile)-3條件運算式生成器函數選擇框輸入條件運算式符號按鈕框若條件滿足過濾未滿足條件的個體Filter_$=0非選擇個體Filter_$=1選擇個體刪除未滿足條件的個體若條件滿足僅保留符合條件的個體不符合條件的個體被刪除,不可恢複;因此必須將其另存為新的數據檔。Sex=“女”

and(x5>=8andx5<=12)加權個體(WeightCases)設定某變數為頻數變數Data/WeightCases…用x5變數加權個體頻數變數非加權個體加權個體概念建立新變數重置代碼記數數據變換目錄概念

數據變換通過一個有效的數值運算式或SPSS內部函數(對數、平方根、倒數、百分比數的平方根、反正弦等)來實現。連續型變數可變換為分類型變數。平方根變換Sq=SQRT(x3)Ifsex=“男”倒數變換y5=1/x5重置代碼(Recode)重置代碼包括:重置同一變數代碼和重置不同變數代碼Transform/Recode

/IntoDifferentVariables數值範圍最低值最高值重置不同變數代碼年齡分組重置相同變數代碼Transform/Recode/IntoSameVariables‘男’->1‘女’->2記數Transform/Count…>170男性報表即時分析處理立體表綜合表行輸出綜合報告列輸出綜合報告目錄sexagesbp_bdbp_bsbp_0dbp_0dbp_10sbp_10dbp_20sbp_20dbp_30sbp_30group265150.080.0150.080.0150.080.0150.080.0150.080.02269180.080.0180.080.0184.080.0184.080.0184.080.02263150.092.0146.090.0146.090.0146.090.0150.090.02265160.0100.0160.0100.0162.0100.0160.098.0160.098.02177170.095.0170.095.0170.095.0170.095.0170.095.02251150.090.0142.080.0142.080.0146.080.0146.080.02269170.0110.0166.0108.0170.0110.0170.0110.0170.0110.02160160.0100.0150.0100.0158.0100.0158.0100.0160.0100.02164170.0100.0168.098.0168.098.0170.0100.0170.0100.02258160.095.0160.095.0160.095.0160.095.0160.095.02160180.096.0180.096.0182.096.0182.096.0182.096.02253150.096.0150.096.0150.096.0150.096.0150.096.02267170.0100.0170.0100.0170.0100.0170.0100.0170.0100.02166150.090.0150.090.0154.092.0154.092.0154.092.02170160.0100.0158.096.0160.0100.0160.0100.0160.0100.02262155.094.0152.094.0155.092.0155.094.0155.094.02167164.098.0160.095.0160.095.0164.098.0164.098.02續前表(對照組)即時分析處理立體表

(OnlineAnalyticProcessingCubs)Analyze/Reports/OLAPCubs…綜合統計變數分組變數擬統計內容統計學內容求均值和標準偏差(立體報表)求均值和標準偏差(立體表不同層統計結果)治療組(1)對照組(2)男性組(整體)女性組(整體)取消層合併為平面報表雙擊OLAPCubs表Pivot/MoveLayertoRowsPivot/MoveLayertoRows或Pivot/ResetPivotDefaults還原表綜合表Analyze/Reports/CaseSummaries…樣本綜合表(無分組)樣本分組綜合表行輸出綜合報告ReportSummariesinRows

行輸出綜合報告過程是以行的形式輸出統計量,每個所選的變數都在報告中產生一列。Analyze/Report/ReportSummariesinRows…分組排序方式綜合統計選項頁面設置標題預覽格式化顯示個體數據變數數據列變數選擇分組變數選擇分組綜合統計內容Summary…數據列格式化定義Format…分組格式定義Format…分組選項Options…分類間空行每一分類從新一頁開始綜合分析前的空行頁碼從1開始報表綜合統計內容Summary…報表標題設置Titles…頁眉頁腳變數行綜合輸出表結果注意:行綜合輸出適合於多項統計分析結果的輸出列輸出綜合報告ReportSummariesinColumn

行輸出綜合報告過程是以列的形式輸出統計量,每個所選的變數都在報告中產生一列。Analyze/Report/ReportSummariesinColumn…插入統計合計值列綜合輸出表結果注意:列綜合輸出僅適合於單項統計分析結果的輸出

百分位數(percentile):Px

,如P25,P50等四分為數:QL(下四分位數,25%),QU(上四分位數,75%)方差(variance):樣本方差S2,總體方差

2標準差(standarddeviation):標準差S替代方差描述數據分佈的離散程度變異係數(coefficientofvariation):CV,標準差與算術均數之比,它描述數據分佈的相對離散程度。標準誤(standarderror,SE)與均數的標準誤(standarderrorofmean,SEM

):均數的標準誤與標準差成正比,與樣本例數n的平方根成反比頻數表分析(Frequencies過程)

Frequencies分析過程可產生頻數分佈圖、條形圖、餅圖、直方圖、計算任意百分位數、分佈參數估計值、集中趨勢與離散趨勢等各項統計學指標。Analyze/DescriptiveStatistics/Frequencies…統計…圖表…格式化…顯示頻數表某市1982年110名7歲男童的身高資料:序號數據cm統計…圖表…直方圖餅圖條形圖正態曲線頻數表身高的各項統計學指標集中趨勢指標離散趨勢指標偏度係數峰度係數分佈參數估計值四分位數某城市7歲男童身高直方圖正態曲線描述性統計分析(Descriptives過程)

Descriptive分析過程可計算數值變數的描述性統計量:均數、總和、標準差、方差、全距、最小值、最大值、標準誤、峰度係數、偏度係數及標準化(Z值、Z分數)。Analyze/DescriptiveStatistics/Descriptives…Data/SelectCases…/Ifconditionissatisfiedsex=‘男’Data/SelectCases…/AllCases第一層:病情分級第二層:性別中位數續前表總病例統計值抗體滴度X1:41:81:161:321:641:1281:2561:512人數麻疹易感兒的血凝抑制抗體滴度平均抗體滴度統計表(平均滴度為1:64)第一步:建立分組變數第二步:加權頻數變數幾何均數第三步:選擇統計變數和分組變數第四步:選擇統計專案探索性分析(Explore過程)Explor過程對數據進行探索性分析,包括數據描述、篩選、奇異值辨認和假設驗證,提供整體或分組數據的概要性統計指標或圖表,以瞭解數據的分佈規律和特徵以及亞組間的特征性差異。提供反應數據集中趨勢的四種最大似然估計量、數據中前5位最大值和最小值、正態分佈檢驗及正態分佈Q-Q圖、轉換前和多種轉換後的方差齊性檢驗及分佈-水準散點圖。女性:66名281.14162.82339.26206.04214.19294.24120.37332.60191.95144.76207.67255.37419.86621.73984.81841.97330.86229.97273.67147.20179.07215.55203.72258.34100.4053.71684.86422.84655.12354.67462.16186.35206.41112.7181.71185.54218.39106.90141.48119.18160.2282.86180.46486.38228.43263.99398.2674.31359.48434.70579.99102.51280.48171.7586.32298.43412.01453.15478.4378.28374.38371.23147.26130.89301.08234.21男性:83名169.49125.82190.62262.67279.77181.48286.85262.20308.34101.09215.60822.86566.27207.51163.33193.32121.89182.52147.31269.30243.46225.86106.90123.27134.27118.60227.46148.01167.59166.06275.34119.80327.97100.61253.28290.93335.76147.37190.99196.50164.99131.27164.45183.7799.75189.96138.29215.07547.76412.64470.84400.32103.72111.13145.15142.1487.22111.95184.54102.6193.30237.02165.5180.73143.27130.38417.64401.25249.38120.31160.49256.92202.69347.91345.86727.5995.73404.00393.26427.08432.65321.65160.11某醫生測定了149名正常人的空腹血清胰島素樣因數-1水準:Analyze/DescriptiveStatistics/Explore…統計指標統計圖描述性統計指標反映集中性趨勢的4種似然估算量百分位值及Tukey’s折點奇異值正態檢驗方差正態檢驗直方圖-1直方圖-2正態Q-Q圖-1期望正態分佈直線正態Q-Q圖-2期望正態分佈直線均數箱圖奇異值P50均值P25-P75分佈自然對數-水準自然對數散點圖數據轉換力度不接近0,表示要使兩組方差齊性,需做數據轉換數據轉換經數據轉換後的方差正態齊性檢驗選擇自然對數轉換基於均數的顯著性為0.135>0.05,表示接受兩組均數方差的假設先進行IGF-1F數據轉換(自然對數)數據轉換(Ln)後的

描述性統計指標數據轉換(Ln)後的百分位值及Tukey’s折點數據轉換(Ln)後的4種似然估算值數據轉換(Ln)後的奇異值數據轉換(Ln)後的正態分佈Q-Q圖接近期望正態分佈直線數據轉換(Ln)後的去勢正態分佈Q-Q圖接近期望正態分佈直線T檢驗單樣本T檢驗獨立樣本T檢驗配對樣本T檢驗目錄相關統計學概念(3)假設檢驗(hypothesistest)也稱顯著性檢驗(significancetest)

1、建立檢驗假設(hypothesisundertest

):無效假設,

=0

(樣本均數=總體均數)H02、建立備擇假設(alternativehypothesis

):H1,若H0被否決,則H1成立。

3、設定檢驗水準(sizeoftest)或稱顯著性水準(significance

level):=0.05(方差齊性檢驗=0.10,正態性檢驗

=0.20)

4、確定P值,作出推斷:推斷結論包括統計結論和專業結論,統計結論說明有統計學意義(statisticalsignificance)或無統計學意義(nostatisticalsignificance

),若P,則拒絕H0

,接受H1

,有統計學意義(統計結論);則可認為

……不同或不等(專業結論)。假設檢驗的方法:t檢驗(t-test或稱Student’st-test)和u檢驗(u-test或稱Z-test)。

t檢驗應用條件:當樣本量較小時(如n<50),理論上要求樣本取自正態總體,兩小樣本均數比較時要求兩樣本總體方差相等。

u檢驗的應用條件:樣本含量n較大,或n雖小但總體標準差已知。單樣本t檢驗(onesample/groupt-test):即樣本均數代表的未知總體均數

和已知總體均數

0

(一般為理論值、標準值或經過大量觀察所得的穩定值)的比較。配對t檢驗(pairedt-testfordependentsamples):兩種情況(1)兩個同質受試對象分別接受兩種不同的處理;(2)同一受試對象分別接受兩種不同的處理。配對t檢驗設兩種處理的效應相同,即

1

=

2

,則

1

-

2

=0(即已知總體

0

)。兩樣本t檢驗(tow-samplet-testforindependentsamples

):完全隨機設計兩樣本均數的比較。當關心兩總體均數

1

2

是否相等時,理論上應考慮是否兩總體方差相同,即齊性方差(homogeneity),若相等直接接受t檢驗。單樣本T檢驗(One-sampleTTest)SPSS的One-sampleTTest過程用於執行單樣本T檢驗,它是進行單變數均數與一常數或假設值的比較,要求單變數為定量變數(數值型變數)。Analyze/CompareMeans/One-sampleTTest…檢驗變數檢驗值T檢驗:樣本均數與總體均數的比較問題:正常人的脈搏平均72次/分,現測得10例某病患者的脈搏(次/分):54,67,68,78,70,66,67,70,65,69,試問此病患者與正常人有無顯著性差別?結論:因t=-2.453,df=9,P=0.037〈0.05,有統計學意義;故此病患者與正常人脈搏有顯著性差異。問題:某市1982年110名7歲男童的身高(cm)如下表,試估計該市7歲男童身高的95%可信區間。不設檢驗值問題:某克山病區測得11例克山病患者與13名健康人的血磷(mmol/L)如下,問該地急性克山病患者與健康人的血磷值是否不同?患者:0.84,1.05,1.20,1.20,1.39,1.53,1.67,1.80,1.87,2.07,2.11健康人:0.54,0.64,0.64,0.75,0.76,0.81,1.16,1.20,1.34,1.35,1.48,1.56,1.87結論:Levene方差齊性檢驗F=0.032,P=0.086>0.05,可認為兩總體方差相等。取t=2.524,df=22,P=0.019<0.05,可認為該地克山病患者與健康人的血磷值之間有統計意義。兩獨立樣本均數比較兩獨立樣本幾何均數比較問題:選甲型流感病毒抑制抗體滴度(倒數)<5者24人,隨機分為兩組,每組12人。用甲型流感病毒活疫苗進行免疫,一組用氣霧法,另一組用鼻腔噴霧法。免疫後一月采血,分別測定血凝抑制抗體滴度,結果如下。問兩法免疫的效果有無差別?氣霧組(1):402030251015253040101530鼻腔噴霧組(2):504030356070302025703525先進行flu數據的自然對數轉換(lnFlu),然後進行兩樣本幾何均數比較。結論:Levene方差齊性檢驗F=0.420,P=0.524>0.05,可認為兩總體方差相等。取t=-2.934,df=22,P=0.008<0.05,可認為兩種方法的免疫效果差別之間有統計意義。配對樣本T檢驗SPSS的Paired-SamplesTTest過程用於執行配對樣本均數的比較。Analyze/CompareMeans/Paired-SamplesTTest…問題:某單位研究飲食中缺乏維生素E與肝中維生素A含量的關系,將同種屬的大百鼠按性別相同,年齡、體重相近配成對子,共8對並將每對種的兩頭動物隨機分到正常飼料組和維生素E缺乏組,經一定時期將大百鼠殺死,測得其肝中維生素A的含量,結果如下。問不同飼料的大百鼠肝中維生素A含量有無差別?大百鼠對號(1):12345678正常飼料組(x1):35502000300039403800375034503050維生素E缺乏組(x2):24502400180032003250270025001750配對樣本均數比較配對變數結論:相關係數=0.584,P(sig.)=0.129,認為兩配對變數無相關關係。t=4.207,df=7,P=0.004<0.05,故可認為不同飼料的大百鼠肝中維生素A含量有統計意義。方差分析(ANOVA)完全隨機設計的單因素方差分析隨機區組設計的兩因素方差分析析因(有重複數,平衡數據)設計的雙因素方差分析析因(有重複數,不平衡數據)設計的雙因素方差分析完全隨機設計的協方差分析完全隨機區組設計的協方差分析目錄多項式模型趨勢檢驗選項參照子集選擇參照系數線性假定方差齊同時的兩兩比較方法選項:選擇Bonferroni法假定方差不齊時的兩兩比較方法選項:選擇Tamhane’sT2法顯著性水準描述性統計量描述性統計量方差齊性檢驗均數圖總體均數95%可信區間方差齊性檢驗結論:按

=0.05檢驗水準,P>0.05,拒絕H0,接受H1,可以認為各組方差齊同方差分析表結論:組間F值=MS組間/MS組內=84.544,根據第一和第二自由度得P<0.0005,按

=0.05檢驗水準,拒絕H0,接受H1,可認為各組總體均數不等或

不全等;線性趨勢檢驗MS未加權/MS加權一致,F=9.165組間/1.534組內=167.259,根據第一和第二自由度得P<0.0005,按

=0.05檢驗水準,拒絕H0,接受

H1,可認為三組別值與各組均數間呈線性趨勢;偏離線性趨勢檢驗F=0.100組間/1.534組內=1.829,根據第一和第二自由度得P<0.187,按

=0.05檢驗水準,接受H0,可認為偏離線性無統計

學意義。各組肺活量兩兩比較表星號表示均數的差別在

=0.05檢驗水準上有統計學意義因各組方差齊同,故不選擇Tamhane’sT2法檢驗各組均數趨勢圖結論:各組肺活量均數隨分類值(分組值)的增大而增加呈線性趨勢隨機區組設計的兩因素方差分析

廣義線性模型(GLM)中的單變數(Univariate)過程可以進行雙因素和多因素方差分析、協方差分析和線性回歸分析。適用條件:1、各樣本是相互獨立的隨機樣本;2、各樣本來自正態;3、各樣本的總體方差齊同;4、單個因變數為連續型變數;5、單個或以上因素為分類變數;6、單個或以上的協變數(Covariate)為連續變數。Analyze/GenerallinearModel/Univariate…GLM-單變數過程全析因模型自定義模型因素和協變數效應選擇平方和模型中包含截距參照類型:Polynomial多項式模型趨勢檢驗參照分類假定方差齊同時的兩兩比較方法選項假定方差不齊時的兩兩比較方法選項因素兩兩比較檢驗因素因素室溫和因素家兔種屬及其各水準值和例數方差分析表因素室溫的F=MS室溫/MS家兔種屬=18.866,根據第一自由度df1=3和第二自由度df2=18得P<0.0005;按=0.05檢驗水準,可認為不同室溫的血糖濃度總體不等或不完全相等。同左下道理因素家兔種屬,P<0.0005;按=0.05檢驗水準,可認為不同家兔種屬(區組)的血糖濃度總體不等或不完全相等,故該區組因素(控制因素)不容忽略。期望均方表檢驗結果表類似方差分析表因素室溫變異和殘差多項式參照模型線性二次(拋物線)三次四次模型指標因變數值六個模型中,假定值均相同都等於0,故參照估計值和差值相等;參照估計值和差值以二次模型最大,同時P值最小故取其模型;按=0.05檢驗水准,可認為不同室溫水平與其血糖濃度均數呈拋物線模型趨勢。Tukey法的不同室溫均數兩兩比較表星號表示均數差別在=0.05檢驗水准上有統計學意義Tukey法的均衡子集表每個均衡子集內的各組均數比較均無統計學意義因素水準軸分離線分離圖繪圖估計邊緣均數顯示邊緣均數殘差圖擬合度不足設定檢驗水準參照系數矩陣因素和因素交互效應欄因素A和因素B及其各水準值和例數因素A和因素B的描述性統計A藥和B藥同時使用紅細胞增加的均數為210萬/mm3單獨使用A藥紅細胞增加的均數為120萬/mm3單獨使用B藥紅細胞增加的均數為100萬/mm3都不使用紅細胞增加的均數為80萬/mm3方差齊性檢驗方差分析表P=1.000,按

=0.05檢驗水準,接受H0,可認為各格子方差齊同。同上道理推出:使用和不使用B藥的紅細胞增加總體均數不等。A藥和B藥存在交互作用。因素A

P<0.0005,可認為使用和不使用A藥的紅細胞增加總體均數不等。均數與標準差二維圖均數與方差二維圖兩項對應指標均不成比例,提示各格子方差齊同因素A和因素B邊緣均數圖圖中兩線不平行,提示A藥和B藥存在交互作用。析因(有重複數,不平衡)設計的雙因素方差分析性別工廠男(1)女(1)繡品廠電視機廠蓄電池廠(1):54.131.819.120.736.653.428.727.131.821.431.822.3(2):15.021.721.723.341.735.015.028.336.7(3):163.9192.3183.6129.4160.8160.8155.6188.8129.0110.190.097.9136.4問題:從三個工廠隨機抽查一些男女職工的血原卟啉(

g/100ml),數據見下表;問各廠男女職工的血原卟啉有無差異?Analyze/GenerallinearModel/Univariate…因變數固定因素隨機因素協變數加權變數模型參照值繪圖因素各水準兩兩比較估計邊緣均數顯示邊緣均數設定檢驗水準觀察效能因素和因素交互效應欄因素廠別和因素性別及其各水準值和例數因素廠別和因素性別的描述性統計方差齊性檢驗方差分析表P<0.05,可認為各格子總體方差不齊同因素廠別P<0.0005,可認為不同廠別之間職工的血原卟啉全不等或不全等因素性別P>0.05,可認為不同性別之間職工的血原卟啉相等因素廠別*性別P>0.05,可認為廠別與性別之間不存在交互作用檢驗效能很大邊緣均數表不同廠別血卟啉兩兩比較表由於方差檢驗認定各格子總體方差不齊同因此使用Tamhane法數據繡品廠與電視機廠、電視機廠與繡品廠比較,P>0.05,可認為均數比較無統計學意義。繡品廠與蓄電池廠、電視機廠與蓄電池廠、蓄電池廠與繡品廠、蓄電池廠與電視機廠比較,P<0.0005,可認為均數比較有統計學意義。均數與標準差二維圖均數與方差二維圖兩項對應指標均成比例,各格子總體方差不齊同因素廠別和因素性別邊緣均數圖圖中兩線近似平行,提示廠別與性別無交互作用。完全隨機設計的協方差分析母乳飼料(X1):549.1532.0510.0526.0373.3560.0571.1618.7470.9500.9母乳組增重(Y1):123.5117.0124.5104.089.0142.5127.0140.0102.5111.2奶粉飼料(X2):704.0690.2517.1576.6566.0母乳組增重(Y1):171.0170.0113.0126.0121.0問題:把15頭公鼠隨機分兩組,第一組10只白鼠飼以母乳,第二組5只飼以奶粉,現將兩組白鼠九周內食物消耗量(X,克)及所增體重(Y,克)列下表。問攝取兩種不同飼料的白鼠所增體重的均數有無顯著差異?因素分組及其各水準值和例數因變數增重的描述性統計方差齊性檢驗P>0.05,可認為各格子總體方差齊同方差分析表協變數飼料P<0.0005,可認為飼料與增重存在線性回歸關係因素分組P>0.05,可認為用不同飼料餵養白鼠的增重調整均數相等觀察效能飼料=1.000,可認為的檢驗效能很大,協變數飼料無須增加標本含量;觀察效能飼料=0.064,可認為的檢驗效能很小,即使增加樣本含量也難於得出顯著差異結果參數估計值表公共回歸係數不為零邊緣均數表消除協變數對增重的影響,顯示調整後的均數、標準誤及95%可信區間完全隨機區組設計的協方差分析核黃素缺乏組X1:256.9271.6210.2300.1262.2304.4272.4248.2242.8342.9356.9198.2核黃素缺乏組增重Y1:27.041.725.052.014.548.848.09.537.056.576.09.2限食量組X2:260.3271.1214.7300.1269.7307.5278.9256.2240.8340.7356.3199.2限食量組增重Y2:32.047.736.765.039.037.951.526.741.061.3102.18.1不限食量組X3:544.7481.2418.9556.6394.5426.6416.1549.9580.5608.3559.6371.9不限食量組增重Y3:160.396.1114.6134.876.372.899.4133.7147.0165.8169.854.3問題:在“核黃素缺乏對於蛋白質利用的影響之研究”中,將體重相近(34~38克),出生三周的大白鼠36只,按照窩別分成12窩,每窩三只,隨機分到核黃素缺乏組(1),限食量組(2)和不限食量組(3)進行餵養。觀察記錄的數據如下表,觀察不同飼料對體重增長的影響?因變數固定因素隨機因素協變數加權變數模型參照值繪圖因素各水準兩兩比較全析因模型自定義模型因素和協變數效應選擇平方和模型中包含截距估計邊緣均數顯示邊緣均數設定檢驗水準因素和因素交互效應欄參數估計值比較主效應多重比較檢驗方法之一。基於Student’st統計量因素分組和因素區組及其各水準值和例數各方差分量的係數和計算期望均方的公式參數估計值表公共回歸係數不為零邊緣均數表各調整均數間兩兩比較表各調整均數間兩兩比較均無統計學意義單變數檢驗表P>0.05,可認為不同分組的增量總體調整均數相等相關分析Pearson相關分析Spearman等級相關分析偏相關分析目錄相關統計學概念(5)

所謂“相關關係”,既變數之間既存在密切的關係,又不能由一個(或幾個)變數的數值精確地求出另一個變數的值,我們就定義這類變數之間的關係為“相關關係”。

負相關……一個量的增長導致另一個量的下降。

正相關……一個量的增長同時促使另一個量的增長。相關係數(CorrelationCoefficient)是一個介於-1與1之間的值。如果兩個量之間的相關係數為-1,則為“絕對負相關”;若兩個量之間的相關係數為1,則為“絕對正相關”;相關係數為0時,表示二者沒有關聯關係。測量二元分佈的相關性的主要公式是Pearson公式。

相關分析是研究兩個隨機變數之間相互關聯的密切程度。當兩個變數都服從正態分佈資料時,可選用Pearson相關係數。當其中一個甚至兩個變數都不服從正態分佈,可選用Spearman等級相關係數。偏相關係數是在其他變數固定的條件下,某兩個變數之間是相關關係,從而排除了其他引數的干擾作用。

SPSS使用Bivariate過程計算Pearson相關係數和Spearman等級相關係數。用Partial過程計算偏相關係數,並對偏相關係數進行假設檢驗。Analyze\Correlate\Bivariate…Analyze\Correlate\Partial…Analyze\Correlate\Bivariate…Pearson相關分析問題:某地一年紀12名女大學生的體重(kg)X與肺活量(L)Y數據如下表,試計算肺活量與體重的相關系數,並檢驗兩者間是否有直線相關關係?體重(X):424246464650505052525858肺活量(Y):2.552.202.752.402.802.813.413.103.462.853.503.00相關係數類型假設檢驗選項用*或**標記在

=0.05或

=0.01水準有統計學意義的相關係數相關係數類型假設檢驗選項用*或**標記在

=0.05或

=0.01水準有統計學意義的相關係數Spearman等級相關係數為0.745,P=0.013,按

=0.05水準,拒絕無效假設,故可以認為,黃麯黴素與肝癌死亡率間存在正相關。偏相關分析Analyze\Correlate\Partial…問題:某地29名13歲男童身高(X1,cm)、體重(X2,

kg)及肺活量(Y,L)的實測數據如下表。試計算其Pearson相關係數。當體重(X2)控制(即固定時),計算身高(X1)與肺活量(Y)的偏相關係數,並作假設檢驗?男童身高(X1):135.1139.9163.6146.5156.2156.4167.8149.7145.0148.5165.5135.0153.3152.0160.5153.0147.6157.5155.1160.5143.0149.4160.8159.0158.2150.0144.5154.6156.5體重(X2):32.030.446.233.537.135.541.531.033.037.049.527.641.032.047.232.040.543.344.737.531.533.940.438.537.536.034.739.532.0肺活量(Y):1.752.002.752.502.752.002.751.502.502.253.001.252.751.752.251.752.002.252.752.001.752.252.752.502.001.75

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论