数据分析(SAS描述性统计分析过程)_第1页
数据分析(SAS描述性统计分析过程)_第2页
数据分析(SAS描述性统计分析过程)_第3页
数据分析(SAS描述性统计分析过程)_第4页
数据分析(SAS描述性统计分析过程)_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析(SAS描述性统计分析过程)

几种描述性统计分析的SAS过程和作图过程procmeans

procunivariate

proccorr

procplot//procgplot

proccapability数据分析(SAS描述性统计分析过程)

procmeans(1)

Means过程的语句格式

Means过程的主要控制语句如下:

procmeans输入数据集名<选项列表>;var变量列表;class变量列表;byfreq变量列表;

变量;weight变量;id变量列表;

output<out=输出数据集名><统计量关键字=变量名列表>;run;数据分析(SAS描述性统计分析过程)

procmeans(2)var语句——规定要求计算简单描述性统计量的数值变量的次序。by语句——按by语句定义的变量进行分组计算其相应的简单统计量,要求输入数据集已按by变量排序。class语句——与by语句一样,可用class变量定义观测组,分别计算各组观测的描述统计量。输出格式与by不同且事先不需要按class变量排序。freq语句——指定一个数值型的freq变量,它的值表示输入数据集中相应观测出现的频数。weight语句——规定一个weight变量,它的值表示相应观测的权数。id语句——在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。数据分析(SAS描述性统计分析过程)

ntcvprocmeans(3)

procmeans语句中可用的统计量关键字统计量名称含义统计量名称含义未丢失的观测个数mode众数,出现频数最高的数nmissmeanstderrsumstdvarusscssskewnesskurtosis丢失的观测个数算术平均均值的标准误差加权和标准偏差方差变异系数的百分数加权平方和关于均值偏差的加权平方和对称性的度量——偏度对尾部陡平的度量——峰度sumwgtmaxminrangemedianprtclmlclmuclm权数和最大值最小值极差,max—min中间值总体均值等于0的t统计量t分布的双尾p值置信度上限和下限置信度下限置信度上限数据分析(SAS描述性统计分析过程)

procmeans(4)output语句中的选项。<out=输出数据集名>——输出数据集名。统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。数据分析(SAS描述性统计分析过程)Nprocmeans(5)

SAS程序

dataexamp1; inputx@@; cards; 70.472.076.574.376.577.667.372.075.074.3 73.579.573.574.765.076.581.675.472.772.7 67.276.572.770.477.268.867.367.367.372.7 75.873.575.072.773.573.572.781.670.374.3 73.579.570.476.572.777.284.375.076.570.4 ; procmeansdata=examp1nmeancvskewnesskurtosisrangemedian; varx; run;

输出TheMEANSProcedureAnalysisVariable:xMeanVariationSkewnessKurtosisRangeMedian5073.74600005.40837940.15401110.358117919.300000073.5000000数据分析(SAS描述性统计分析过程)

procunivariate(1)单变量统计分析对一组单指标实验数据进行分析常采用两种方法:

图示法——包括茎叶图、盒型图和正态概率图。

描述统计量——包括矩、分位数、极端值和頻数分布表。数据分析(SAS描述性统计分析过程)procunivariate(2)

Univariate过程的主要控制语句如下:

procunivariate输入数据集名<选项列表>;varbyfreqweightid变量列表变量列表变量;变量;变量列表;;;output<out=输出数据集名><统计量关键字=变量名列表><pctlpts=

百分位数pctlpre=变量前缀名pctlname=变量后缀名>;run;数据分析(SAS描述性统计分析过程)procunivariate(3)

Univariate过程的主要控制语句如下:

procunivariate输入数据集名<选项列表>;varbyfreqweightid变量列表变量列表变量;变量;变量列表;;;output<out=输出数据集名><统计量关键字=变量名列表><pctlpts=

百分位数pctlpre=变量前缀名pctlname=变量后缀名>;run;数据分析(SAS描述性统计分析过程)教材1.1例题examp1_1(SAS程序)dataexamp1_1;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_1;varx;run;数据分析(SAS描述性统计分析过程)教材1.1例题examp1_1(SAS结果1)

TheUNIVARIATEProcedure Variable:x MomentsNMeanStdDeviationSkewness100SumWeights 73.66SumObservations 3.94008153Variance 0.06007521Kurtosis100 7366 15.5242424 0.03386864UncorrectedSS544116.46CorrectedSS1536.9CoeffVariation5.34901103StdErrorMean BasicStatisticalMeasures0.39400815LocationVariabilityMean73.66000StdDeviationMedian73.50000VarianceMode73.50000Range

3.94008 15.5242420.00000InterquartileRange4.60000数据分析(SAS描述性统计分析过程)教材1.1例题examp1_1(SAS结果2)

TheUNIVARIATEProcedure

Quantiles(Definition5)Quantile100%Max99%95%90%75%Q3Estimate 84.30 82.95 80.50 79.15 75.8050%Median25%Q110%

73.50 71.2068.405%1%0%Min67.3064.65 64.30数据分析(SAS描述性统计分析过程)

proccapability(能力分析过程)PROCCAPABILITYisdesignedforprocesscapabilityanalysis,including:Histograms(直方图)andcomparativehistograms.Cumulativedistributionfunctionplots(cdfplots)(累积分布函数).Quantile-quantileplots(Q-Qplots),probabilityplots,andprobability-probabilityplots(P-Pplots).Theseplotsfacilitatethecomparisonofadatadistributionwithvarioustheoreticaldistributions.Goodness-of-fit(拟合优度)testsforavarietyofdistributionsincludingthenormal.Statisticalintervals(prediction,tolerance,andconfidenceintervals)foranormalpopulation.数据分析(SAS描述性统计分析过程)教材1.2例题examp1_4(SAS程序)dataexamp1_4;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;proccapabilitydata=examp1_4;histogramx/normal(mu=estsigma=est);cdfplot/normal(mu=estsigma=est);qqplotx/normal(mu=estsigma=est);run;数据分析(SAS描述性统计分析过程)教材1.2例题examp1_4(SAS结果)

TheCAPABILITYProcedure FittedNormalDistributionforx ParametersforNormalDistribution ParameterSymbolEstimateMeanMu73.66

StdDevSigma3.940082QuantilesforNormalDistribution ------Quantile------ PercentObservedEstimated 1.064.650064.4940 5.067.300067.1791 10.068.400068.6106 25.071.200071.0025 50.073.500073.6600 75.075.800076.3175 90.079.150078.7094 95.080.500080.1409 99.082.950082.8260数据分析(SAS描述性统计分析过程)教材1.2例题examp1_4(SAS直方图)数据分析(SAS描述性统计分析过程)教材1.2例题examp1_4(SAS分布函数图)数据分析(SAS描述性统计分析过程)教材1.2例题examp1_4(SASqq图)数据分析(SAS描述性统计分析过程)教材1.2例题examp1_6(SAS程序)dataexamp1_6;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_6plot;varx;run;数据分析(SAS描述性统计分析过程)#4教材1.2例题examp1_6(SAS结果)StemLeafBoxplot8438382812668035579555780888772267655555557588874333333337735555555555572777712222703444444469777680088867233336665006431 3 3 3 4 3 714 91114 8 3 5 5 2 1

0 | | | | | |+-----+||*--+--*||+-----+ | | | | | | 0数据分析(SAS描述性统计分析过程)教材1.2例题examp1_8(SAS程序)dataexamp1_8;inputx@@;cards;254550545561646872757578798183848484858686868789898990919192100;procunivariatedata=examp1_8normal;run;proccapabilitydata=examp1_8graphicsnoprint;histogramx/weibullvscale=proportion;run;datadelmin;setexamp1_8;ifx=25thendelete;run;proccapabilitydata=delmingraphicsnoprint;histogramx/weibullvscale=proportion;cdfplotx/weibull;run;数据分析(SAS描述性统计分析过程)2

教材1.2例题examp1_8(SAS结果1)TestsforNormalityTest--Statistic--------pValue------Shapiro-WilkW0.863287Pr<W0.0010Kolmogorov-SmirnovD0.195196Pr>D<0.0100Cramer-vonMisesAnderson-DarlingW-Sq0.295854 A-Sq1.593346Pr>W-Sq<0.0050Pr>A-Sq<0.0050结论:拒绝正态分布的假设

Goodness-of-FitTestsforWeibullDistributionTestCramer-vonMises----Statistic----- W-Sq0.2242363DF

------pValue------Pr>W-Sq<0.010Anderson-DarlingA-Sq1.2884219Pr>A-Sq<0.010Chi-SquareChi-Sq24.87188823Pr>Chi-Sq<0.001结论:拒绝Weibull分布的假设

Goodness-of-FitTestsforWeibullDistributionTest----Statistic-----DF------pValue------Cramer-vonMisesAnderson-DarlingChi-SquareW-Sq0.16341872 A-Sq1.00500667Chi-Sq5.22777090

Pr>W-Sq0.013Pr>A-Sq<0.010Pr>Chi-Sq0.073结论:对于删去25的数据集,接受Weibull分布的假设数据分析(SAS描述性统计分析过程)教材1.2例题examp1_8(SAS结果2)数据分析(SAS描述性统计分析过程)

proccorr(1)

proccorr(相关分析过程)用于计算变量之间 的相关系数,包括Pearson(皮尔逊)的乘 积矩相关和加权乘积矩相关。还能产生三个 非参数的关联测量:Spearman的秩相关,

Kendall的tau-b和Hoeffding的相关性度量D。

proccorr语句调用corr过程,且是唯一必须的语句。如果只使用proccorr这一条的语句,过程计算输入数据集中所有数值变量之间的相关系数。其余语句是供选择的。数据分析(SAS描述性统计分析过程)

proccorr(2)

proccorr过程一般由下列语句控制:proccorrvarwithpartialweightfreqByrun;

data=数据集<选项>;变量列表;变量列表;变量列表;变量;变量;变量列表;数据分析(SAS描述性统计分析过程)教材1.3例题examp1_9(SAS程序)dataexamp1_9;inputxy;cards;689716389270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proccorrdata=examp1_9pearsonspearmancov;run;run;数据分析(SAS描述性统计分析过程)xyNxy

教材1.3例题examp1_9(SAS结果1)TheCORRProcedure2Variables:xyCovarianceMatrix,DF=19

x 570.45007845.0789

y 7845.0789112404.2632SimpleStatisticsVariable20

Mean33.85000StdDev 23.88410Median 27.00000Minimum 5.00000Maximum70.0000020477.50000335.26745342.0000082.000001125数据分析(SAS描述性统计分析过程)xyxy教材1.3例题examp1_9(SAS结果2)

TheCORRProcedurePearsonCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0

x1.000000.97971y0.97971 <.00011.00000

<.0001SpearmanCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0

x1.000000.97366<.0001y0.97366<.00011.00000数据分析(SAS描述性统计分析过程)教材1.3例题examp1_10(SAS程序)dataexam1_10;inputx1-x6;cards;19136505162601893752211060………156335415225731383368211043;proccorrdata=exam1_10covpearsonspearman;varx1-x6;run;数据分析(SAS描述性统计分析过程)Nx520教材1.3例题examp1_10(SAS结果1)TheCORRProcedure6Variables:x1x2x3x4x5x6CovarianceMatrix,DF=19(略)

SimpleStatisticsVariableMeanStdDevMedianMinimumMaximumx120178.6000024.69051

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论