多元统计分析实验指导书(12-13统计)_第1页
多元统计分析实验指导书(12-13统计)_第2页
多元统计分析实验指导书(12-13统计)_第3页
多元统计分析实验指导书(12-13统计)_第4页
多元统计分析实验指导书(12-13统计)_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《多元统计分析》

实验指导书

冯艳芳编

沈阳高校经济学院

书目

试验一:SAS基础学问3

试验二:正态分析与假设检验4

试验三:相关分析与回来分析5

试验四:方差分析入门8

试验五:属性数据分析9

试验六:判别分析10

试验七:聚类分析10

课程编号:11655111课程类别:专业选修课

适用层次:本科适用专业:经济统计学

课程总学时:54学时适用学期:第5学期

试验学时:34学时开设试验项目数:7项

撰写人:冯艳芳审核人:王丹萍教学院长:米娟

试验一:SAS基础学问

一、试验目的

熟识驾驭SAS基础学问。

二、试验类型(含验证型、设计型或综合型)

综合型。

三、试验内容与步骤

1.启动:用如下方法可以进入SAS系统的窗口运行环境:

在Windows环境中,从起先菜单的程序文件夹中找到SAS系统文件夹,从中启动

SAS系统。或者生.成SAS.EXE的快捷方式(把SAS.EXE用鼠标右键拖到桌面),双击

SAS.EXE启动。或在Windows环境中找到SAS系统程序组中的SAS图标双击启动。

2.SASAWS(SAS应用工作空间):

启动后,出现如图1的SAS运行界面,术语称为“SAS工作空间(SASApplication

Workspace)它象其它Windows应用程序一样,在一个主窗口内,包含若干个子窗

口,并有菜单条、工具栏、状态栏等。

或者说是SAS显示管理系统,SAS显示管理系统(DisplayManagerSystem)是用户和

SAS实现文互式对话的多窗口工作环境。它由14个窗口组成,最基本的窗口是PGM、

LOG、OUTPUT窗口。用户利用显示管理系统可以输入SAS语句和吩咐,编辑和修改

SAS源程序并提交系统运行,视察整个程序的执行记录和输出结果;了解SAS数据库、

数据集和有关文件的各种信息:设置选择项、定义功能键和修改显示窗口等。

*菜单条

1.FILE菜单:

NEW:清空程序编辑窗口

OPEN:打开外部文件到程序编辑窗口。

IMPORT:启动SAS的导入向导,把其他格式的数据转换为SAS数据。

EXPORT:启动SAS的导出向导,把SAS数据转换为其他文件格式,与IMPORT一

起完成外部文件与SAS数据集之间的相互转换。

•程序运行…在编辑窗输入程序后

-点击图标

-按功能键“F8”

在吩咐行(窗)键入"submit”

-在local下拉菜单中选“submit”

•窗口内容保存--激活窗口后

-在吩咐行(窗)键入file“路径'文件名”

-点击图标

-在file下拉菜单中选“save"或“saveas”

-只有编辑窗口(edit窗)才能打开文件

常用的快捷键

-Flhelp吩咐

-F3end吩咐

-F4recall吩咐,用于pgm窗,将前面提交的程序调问,可多次运用

F5切换到pgm窗

F6切换到log窗

F7切换到output窗

F8zoomoff;submit

datachild;/*建立临时数据集child.sd2,自动放在saswork子书目下*/

inputidxl$x2x3x4x5x6;/♦指明要输入的变量,$为字符型变量*/

cards;/*标记数据区起先,数据之间以一个或几个空格分隔*/

1m3295.514.053.549.64

2m3592.013.052.041.61

3m3389.012.553.535.81

254in176168.053.582.0100.14

255f3091.011.048.035.39

256f3391.011.547.044.98

521f178163.051.079.087.42

;/*标记数据区结束,分号必需单独一行*/

run;

•缺失值的输入一以.表示,缺失值不进入分析

datachild;

inputidxl$x2x3x4x5x6;

cards;

1m3295.514.053.549.64

2m3513.052.041.61

3m3389.012.553.535.81

254m176168.053.582.0100.14

255f3091.011.048.035.39

256f3391.011.547.044.98

521f178163.051.079.087.42

procmeans;

run;

SAS数据集建立…Infile和input语句

如已存在一纯文本文件c:\child.txt,内容如下:

1m3295.514.053.549.64

2in3592.013.052.041.61

3m3389.012.553.535.81

254in176168.053.582.0100.14

255f3091.011.048.035.39

256f3391.011.547.044.98

521f178163.051.079.087.42

可用infile干脆读入:

Datachild;

Infile'c:\child.txt';

Inputidxl$x2x3x4x5x6;

Run;

从已建立的SAS数据集中读入数据建外新的SAW数据集…set吩咐

libname1'c:\teach';

datal.child;

setchlid;

procprint;

run;

注:Proc步的操作对象总是最新生成的SAS数据集。只有proc步时,也可通过在

proc语句后加dala=来指定要分析的数据集。

dataa;

setl.child;

procprint;

run;

Datab;Seta;

Run;

SAS数据集的整理一变量操作

datab1;

setchild;

ifid<200thengroup=1;

elsegroup=2;

renameid=xO;

keepidxlx2group;

procprint;

run;

注:keepidxlx2group

等价于dropx3-x6;

结果:OBSX0XlX2GROUP

11m321

22m351

33ni331

4254m1762

5255f302

6256f332

7521f1782

数据子集化

记录输出if<表达式>[henoinpu”数据集];

记录删除ifv表达式,thendelete;

datab1;

setchild;

ifxl='m'thenoutput;keepxlx5group;

procprint;

run;

OBSIDXIX2X3X4X5X6

11in3295.514.053.549.64

22m3592.013.052.041.61

33m3389.012.553.535.81

4254m176168.053.582.0100.14

databI;

setchild:keepxlx5group;

Ifxl=tin,thenoutput;Procprint;

Run;

OBSXlX5group

1m53.51

2m52.01

3m53.51

4m82.02

datablb2;

setchild;

Ifxl='m'thenoutputbl;

Elseoutputb2;

Run;

■纵向合并:set〈数据集A>〈数据集B>…;

dataa;

inputidxlx2@@;

cards;

11112

22122

44142

4411422

55152

datab;inputidx3@@;

cards;

1133334435535533

run;

datac;setab;procprint;run;

DATATEST;

INPUTX$@@:

CARDS;

AAABBBcccDDD;

PROCPRINTDATA=TESTSPLIT='#';

LABELX='THIS#ISA#LABEL';RUN;

输出结果为;THIS

OBSISA

LABEL

1AAA

2BBB

3CCC

4DDD

PROCPRINTDATA=TESTSPLIT='*';

LABELX='*';RUN;

输Hd结果为:OBS

1AAA

2BBB

3CCC

4DDD

(5)NOOBS

4.常用的选择语句

(1)PAGEBY语句

例1:PROCPRINT;BYXYZ;PAGEBYY;RUN;

PROCFORMAT:

VALUESA105-120=tLOW,

121-180=tMIDDLE,

181-200=lHIGHT,;

DATAWORKER:

INPUTNAMES15.AGESALARY;

FORMATSALARYSA.;

CARDS;

LIHONG28110

ZHANGWEI30105

ZHAOBO30115

LILIHUA33150

WANGFANG45200

ZHENGHAI30170

JIATAO42180

PROCPRINT;RUN;

输出结果:

OBSNAMEAGESALARY

1LIHONG28LOW

2...LOW

3...LOW

4MIDDLE

5HIGHT

6MIDDLE

7MIDDLE

STANDARD过程:

一般标准化都是使均值为0,标准差为1,其程序如下:

PROCSTANDARDDATA=TEMPOUT=NEWMEAN=0STD=1;

VARXI-X3;

RUN:

dataa;

setchild;

procmeansmaxdec=2;

varx2-x6;

run;

试验二:正态分析与假设检验

一、试验目的

熟识驾驭正态性检验和假设检验方法。

二、试验类型(含验证型、设计型或综合型)

综合型。

三、试验内容与步骤

练习1:正态性检验。

练习《SAS统计分析》董大钧73-75页5.8.2例题

作业1:要求练习编程并写出统计分析试验报告。

现搜集到一组鸟巢高度的数据,这种鸟是北达科他的草原隼。

153.53.57175.75271584.757.54.256.255,7558.59

6.255.547.58.756.545.253123.754.756.253.252.5

1.试对草原隼鸟巢高度的数据进行正态性检验;

2.若把四个异样点的值删除后,再进行正态性检验会得出什么结论?

DATAAA;INPUTHEIGHT@@;CARDS;

153.53.57175.75271584.757.54.256.255.755

8.596.255.547.58.756.545.253123.754.756.253.252.5

PROCUNIVARIATENORMALPLOT;

VARHEIGHT;RUN;

1.由于Prob<W值为0.000Y0.05,拒绝原假设,即认为鸟巢高度不是听从正态分布;

*号与+号重叠很少,再次确定这组数据不是来自正态分布;可以看出正态概率图接近分

布向右偏斜的情形。

2.当把4个异样值删除后,Prob<W值约为0.88>0.05,接受原假设,即表明这数据是

来自正态分布总体。

作业2:要求练工编程并写出统计分析试验报告。

(1)已知13名男子和10名女子大约参与了约每周三次的无人监督的体操练习和减肥

训练,一年以后进行测量他们的身体脂肪含量百分比的数据如下:

性别M

体脂(为)13.319208182220312112161224

性别F

体脂迷)2226161221.723.221283023

要求对卜述两独立绢样木进行I检验(检验两组体脂含量是否有显著差异).

(2)已知某班20名学生统计学课程的两次测验成果。两次测验考同样的学问(试题不

同),老师想知道两次测验难度是否相同,试进行t检验。数据如下(练习配对比较的

t检验):

19398288743896748892567836899078374894979899610

5581118883129194138589147078159096169093179481186781

198793208391

试验三:相关分析与回来分析

一、试验目的

熟识驾驭相关分析方法。

二、试验类型(含验证型、设计型或综合型)

验证型。

三、试验内容与步骤

练习1:练习相关分析。

相关分析:参考书董大钧等:《SAS统计分析》Pw例题。

作业1:要求练工编程并写出统计分析试验报告。

(1)利用食物中热量与脂肪两个变量的样本数据通过SAS程序绘制相关图、计算相关

系数,并分析两变量之间的相关关系。资料见下页。

(2)已知四川绵阳地区3年生中山柏逐月生长贤HGRO(CM)、月平均气温TEMP(摄

氏度)、月降雨量RAIN(MM)、月平均日照时数HSUN(小时)和月平均湿度HUMI

(%)的一年各月数据资料。(见后面)要求分析哪些因素影响着中山柏的生长量。

练习2:练习相关分析。

相关分析:参考书董大钧等:《SAS统计分析》练习例题。

作业2:要求练工编程并写出统计分析试验报告。

(1)随机地抽取12个人,分别记录其性别、身高和体重如下:SEXMFFM

MFMMMFFM

HEIGHT168156163174169165178179181159155179

WEIGHT5549657570578581755748621)用PROCPLOT过程绘制

WEIGHT对HEIGHT的散点图,要求横坐标刻度为150、155、160、165、170、175、

180>185;纵坐标刻度为45、50、55、60、65、70、75、80、85。

2)用PROCCORR过程计算WEIGHT和HEIGHT的相关系数,并问相关是否显著(a

=0.05),>

(4)为了分析影响牛猪牛产的缘由,以(XI)肥猪收购价格(元/百斤),(X2)猪肉零

售平均价格(元/百斤),(X3)粮食产量(万吨),(X4)粮食收购价格指数(以1950

年为00),(X5)农夫出售产品收入(亿元),(X6)乡村总人口数(万人),(X7)全国

人均猪肉消费量(斤)为第一组变量;以(Y1)肥猪产量(万头),(Y2)生猪年底存

栏头数(万头),(Y3)HI口活猪数量(万头),(Y4)肥猪收购数量(万头)为其次组

变量。

要求:试对•两组变量做典型相关分析。

资料如下表:数据来自《中国统计年鉴1988》从1952年到1987年v观测值为36个,

p=7,q=4,a=0.05(要求只分析高度显著相关的典型变量)。(资料省略)

练习3:练习回来分析。N57例题

练习4:练习STEPWISE过程。

STEPWISE过程:参考书董大钧等:《SAS统计分析》P*⑶例题。

作业3:要求练工编程并写出统计分析试验报告。

I.下表列出了1()个最大的食品公司”雇佣的职工人数''和“年销售收入”的数据。要求:

(1)利用SAS求出年收入y关于职工人数x的估计的回来方程。

(2)说明回来系数是否显著。

职工人数年收入(万元)

95001734

224001600

190001044

8943988

11200704

10200557

5000490

6600461

3734450

1550405

2.下表列出/10个主要品牌啤酒广告费(白万元)和销售量(白万箱)的数括。要求:

(1)利用SAS求出估计的回来方程,并检验回来方程和回来系数的显著性。

(2)计算预料值、预料值的置信界限、残差,并生成永久SAS数据集。

广告费销售量

12036.3

68.720.7

100.115.9

76.613.2

8.78.1

0.17.1

21.55.6

1.44.4

5.34.3

1.74.3

3.下表中Y是人的收缩压,XI是体重,X2是年龄v要求:

(1)利用SAS求出Y对XI、X2的回来方程,并检验回来方程和回来系数的显著性;

(2)计算预料值、预料值的置信界限、残差,并生成永久SAS数据集。(资料略)

试验四:方差分析入门

一、试验目的

熟识驾驭相关分析方法。

二、试验类型(含验证型、设计型或综合型)

验证型。

三、试验内容与步骤

练习:练习方差分析例题。P.38-148

作业:要求练习编程并写出统计分析试验报告。

1.用4种饲料喂养大白鼠,每组4只,然后测其肝重占体重的百分比(见下表),试比

较不同饲料对于肝重百分比的影响,同时还要分析哪些组之间存在显著差异。(单因素

方差分析)

4种饲料喂养大白鼠肝重占体重的百分比(%)(表省略)2.为探讨雌激素对子宫发育

的作用,用4个种系的未成年雌性大白鼠各3只,每一只按一种剂量注射激素,过确定

时间取出子宫称重,结果见下表,试比较雌激素的作用。(双因素方差分析)(表省略)

3.以下是三个城市科研机构拥有高级技术人才数的抽样调查数据(单位:每千人拥有

数):

城市甲:6.57.37.33.07.35.67.3

城市乙::4.54.45.93.65.54.55.2

城市丙::3.53.63.72.64.33.75.0

(1)创建一个包含两个变量(城市和人才数)的SAS数据集;

(2)试用方差分析过程分析三个城市的科研机构平均拥有高级技术人才数是否有显著

差异(a=0.01)?

4.以下是4种不同改革试点方案在5个不同规模工厂中匚人收入的抽样数据:

方案1:1461584

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论