




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 复习提纲及考试安排 2005年5月28日 统计软件 2 统计软件SAS基础课程 一 SAS基础课程1 SAS的交互工作环境2 SAS对数据文件的管理3 对SAS数据集的处理 包括 浏览SAS数据集 生成SAS数据集 加工SAS数据集 合并SAS数据集 3 统计软件SAS基础课程 4 数据汇总和报表制作 5 SAS图形入门 包括第一章至第六章的内容 4 统计软件SAS基础课程 要求初步了解SAS系统的功能及特点 初步掌握启动SAS系统的一些方法 了解SAS系统的基本窗口和常用窗口 交互式运行环境 的功能 以及窗口间切换的方法 SAS数据集及有关概念 变量 观测等描述信息 SAS逻辑库 数据库 的类型及设定 用菜单或Libname语句 用VT界面或其它菜单系统浏览 加工SAS数据集 5 统计软件SAS基础课程 基本掌握用DATA步和菜单系统加工处理SAS数据集 涉及到的DATA步语句 DATA INPUT PUT SET BY DO循环 IF KEEP DROP FORMAT LABLE 仅限于课堂上用到的语句及数据集选项等 掌握如何导入文本文件 并转换为SAS数据集 以便用SAS系统对其进行分析处理 6 统计软件SAS基础课程 SAS变量及属性 名字 标签 类型 长度 输入 输出格式 SAS日期常数及常用的输入 输出格式 常见SAS函数 与正态分布 t分布 卡方分布 F分布有关的分位数函数和分布函数 的使用 设X t n X的分布函数F x P X x 给定p 若实数xp满足 P X xp p 称xp为p分位数 学会使用Help系统 7 统计软件SAS基础课程 掌握用SORT过程和菜单系统把数据集中数据按一个或二个变量的升 或降 序重新排序 掌握用DATA步和菜单系统对已存在的SAS数据集中的数据按要求计算新变量 规定变量的输出格式 标签等属性 8 统计软件SAS基础课程 掌握用PRINT过程产生所要求的详细报表 初步掌握用菜单系统和GPLOT过程制作散点图 回归线及置信限 9 统计软件SAS基础课程 不要求的内容 第一章至第六章 分析家 中的转换变量类型 重新定义记录值或记录范围 分析家 中数据集转置和堆叠列 format过程 Printto过程 Pattern语句 Axis语句及选项等 当型循环 直到型循环等 10 统计软件SAS与基础统计分析 二 SAS与基础统计分析1 计算描述统计量使用菜单系统和调用SAS的means和univariate过程来完成常用描述统计量 讲义 中提到的统计量 的计算 分组 如按性别分组 计算常用描述统计量 11 统计软件SAS与基础统计分析 2 频率分布 直方图和分布的拟合检验使用菜单系统和调用univariate过程来研究区间 连续 变量的直方图及分布的拟合检验 只要求正态分布 使用菜单系统和调用freq过程来研究列名 属性 变量的频率分布 12 统计软件SAS与基础统计分析 3 均值 标准差或方差的区间估计使用菜单系统和调用SAS的means和univariate过程来计算区间变量的均值 标准差或方差的点估计和区间估计 置信度为1 分组求基本统计量的置信度为1 的置信区间 13 统计软件SAS与基础统计分析 4 单总体均值 方差的假设检验问题假设检验的基本概念 原假设和对立假设 显著性水平 两类错误 显著性概率值 p值 使用菜单系统和调用SAS的means和univariate过程对单总体的均值和方差进行检验 显著性水平为 单侧检验和单侧区间估计不要求 14 统计软件SAS与基础统计分析 5 双总体 成对组或独立组 均值 方差的假设检验问题对于成对组使用ANALYST 或先化为单总体后用Insight 或用means univariate过程进行检验 对于独立组 使用ANALYST和Ttest过程对两总体的均值和方差的差异进行检验 显著性水平 15 统计软件SAS与回归分析 三 SAS与回归分析1 相关分析使用菜单系统或调用corr过程计算多个变量间两两的相关系数及检验相关系数为0的显著性概率值 P值 16 统计软件SAS与回归分析 2 简单回归 一个因变量与一个自变量的回归问题 使用菜单系统和调用Reg过程完成 散点图 建立回归模型 回归方程或回归系数的显著性检验 回归统计量的计算 进行预测 理解回归分析的基本输出结果 如方差分析表 汇总统计量 参数 即回归系数 的估计及检验结果等 17 统计软件SAS与回归分析 在Reg过程中使用Plot语句及选项来绘制回归直线及置信限的图形 或者使用GPLOT过程及Symbol语句的选项来绘制回归直线及置信限的图形 多项式回归 非线性的回归不要求 18 统计软件SAS与回归分析 3 多元线性回归使用菜单系统和调用SAS过程 如Reg 完成 建立多元线性回归模型 回归方程和回归系数的显著性检验 回归统计量的计算 进行预测 计算预测值及置信限 残差值 约束回归 加权回归不要求 变量选择使用菜单系统和调用Reg完成 用逐步回归方法建立 最优 回归模型 用所有可能回归法 按修正R2或RMSE准则找出最优回归模型 19 统计软件SAS与方差分析 四 SAS与方差分析1 单因素方差分析单因素方差分析的几种模型 均值模型和效应模型 模型的假设 误差的均值为0 同方差 正态 使用ANALYST菜单系统和调用SAS过程 如Anova ttest 进行方差分析 检验该因素对指标的影响是否显著 并给出各水平下指标均值的估计 20 统计软件SAS与方差分析 2 两因素方差分析两因素方差分析的模型 交互作用的概念 使用ANALYST菜单系统和调用SAS过程 如Anova 进行多因素方差分析 检验各因素及交互作用对指标的影响是否显著 并给出各因素不同水平下指标均值的估计 找出最佳生产条件 21 统计软件SAS与方差分析 3 均值估计单因素或两因素方差分析中各因子水平均值的估计值 有交互作用时 给出交叉水平均值的估计 使用ANALYST的选项和调用Anova过程的MEANS语句进行计算 多重比较 预定比较 非参数检验不要求 22 统计软件SAS与属性数据分析 五 SAS与属性数据分析1 属性数据及列联表分析使用菜单系统Analyst和Freq过程及选项生成符合要求的列联表 说明表中各项 行百分比 列百分比 单元百分比 期望频数等 定义 2 属性变量的无关联性检验使用Analyst菜单系统和Freq过程及选项 如chisq expected等对两属性变量进行无关联性检验 23 统计软件SAS与属性数据分析 有序变量的关联性分析 Logistic回归不要求 24 统计软件考试安排 考试时间 2005年6月11日 星期六 晚上7 00 9 00考试地点 3教204 205 25 统计软件考试安排 答疑时间 每次课后 6月11日上午10 00 11 30地点 理科1号楼1114室 26 统计软件复习题 一 SAS系统对数据文件的管理 中练习题1 3 4 5 见 讲义 中p17 用菜单方法或Libname语句建立新库 库标志名为dsta 此库包含本课程所使用的sas数据集 先浏览bclass中SEX 女 的观测及AGE 14的观测 然后浏览全部观测 4 浏览数据集class的描述信息和数据内容 5 浏览SAS永久库SASUSER的属性和内容 并浏览数据集AIR的描述信息和数据内容 27 统计软件复习题 二 生成SAS数据集 中的练习题2 3 见 讲义 中P21 2 使用Import窗口菜单系统 将DST目录下的 txt转换为sas数据集 3 用数据步生成sas数据集 可用以下数据 NAME 姓名 SEX 性别 HEIGHT 身高 WEIGHT 体重 BORN 出生年月 王仁志男15649 21994 2 6尤佳女14544 51993 12 10林国雄男15641 51994 3 23苏家国男14237 61993 9 26黄维男14643 21993 10 21李宏伟男15241 71994 3 18程杰女14039 21994 9 12何新女14438 81993 11 10 28 统计软件复习题 三 Insight的数据管理功能 中的练习题 见 讲义 中P29 1 浏览数据表 数据集BCLASS记录从某个学校随机抽取的40个中学生的基本数据 包含以下的变量 NAME学生的姓名SEX学生的性别AGE学生的年龄HEIGHT以厘米为单位的身高数值WEIGHT以公斤为单位的体重数值 1 用Insight打开数据集BCLASS 浏览该数据集的属性 该数据集有多少个变量 多少个观测值 变量是否使用标签 29 统计软件复习题 2 把变量WEIGHT移到数据表的第一列 而变量HEIGHT移到数据表的第二列 3 对以下变量确定其类型和测量水平 变量类型测量水平SEXAGEWEIGHT 4 在数据集BCLASS中对变量NAME加上标签名StudentsName 2 数据集排序 对数据集BCLASS 1 按AGE对数据集从大到小或从小到大重新排序 找出年龄最大的学生的身高和体重 2 按变量AGE和HEIGHT排序 找出15岁的学生中身高最大的数值 30 统计软件复习题 3 建立新变量 对数据集BCLASS 创建一个名为WHRATIO的新变量 其值等于体重与身高的比 并在其标签名中注明 体重身高比 4 建数据集的子集 将数据集BCLASS中的所有男生抽取出来 生成新的数据集 并把它另存为WORK MCLASS 31 统计软件复习题 四 分析家的数据管理功能 中的练习题1 2 3 4 见 讲义 51 1 浏览数据表 1 用分析家打开数据集BCLASS 浏览该数据集的属性 该数据集有多少个变量 多少个观测值 变量是否使用标签 2 把变量WEIGHT移到数据表的第一列 而变量HEIGHT移到数据表的第二列 3 在数据集BCLASS中对变量NAME加上标签名StudentsName 32 统计软件复习题 2 数据集排序 对数据集BCLASS 1 按AGE对数据集从大到小或从小到大重新排序 找出年龄最大的学生的身高和体重 2 按变量AGE和HEIGHT排序 找出15岁的学生中身高最大的数值 3 建立新变量 对数据集BCLASS 创建一个名为WHRATIO的新变量 其值等于体重与身高的比 并在其标签名中注明 体重身高比 4 建数据集的子集 将数据集BCLASS中的所有男生抽取出来 生成新的数据集 并把它另存为WORK MCLASS 33 统计软件复习题 五 SAS语言 的练习题 见 讲义 中P61 1 计算标准正态分布在x 3 2 1 0 1 2 3时的分布函数F x 和密度函数 x 的值 2 设随机变量 t n 计算t分布的分位数tp n 其中n 1 5 10 20 p 0 10 0 90 0 95 0 975 3 当日期值date 14DEC2001 d时 试问这一天是星期几 4 设随机变量Y F 5 12 计算概率值p p P Y 3 1 求实数x 使x满足P Y x 0 05 求实数z 使z满足P Y z 0 95 34 统计软件复习题 六 数据汇总与报表制作 中的练习题 见 讲义 中P82和P85 1 使用菜单系统Analyst List 以列表形式输出数据集FITNESS 不要输出变量group weight 对oxygen runtime求总和 把age放第一列 2 使用Print过程输出数据集Fitness 要求同上 35 统计软件复习题 七 SAS图形入门 中的练习题 见 讲义 中P95 1 使用菜单系统analyst或Insight绘制数据集air中各污染变量关于日期时间的连线图及各污染变量间的散点图 2 用gplot过程生成以上数据的连线图和散点图 36 统计软件复习题 八 直方图与分布的拟合 中的练习题1 2 见 讲义 110 P111 1 打开FITNESS数据集 并用菜单系统或编程方法完成以下分析计算 计算变量OXYGEN和RUNTIME的均值 方差 标准差 偏度和峰度 指定GROUP为BY变量后 分别计算三组数据的以上几个描述统计量 2 绘制OXYGEN和RUNTIME的直方图和盒形图 从中可否直观地看出它们的分布 3 从OXYGEN的盒形图中如何显示出均值 中位数等值 盒形图中有异常点吗 用INSIGHT 4 在OXYGEN的直方图中如何拟合一条正态分布曲线 这条正态曲线的均值和方差是多少 怎样改变拟合曲线的均值和方差 37 统计软件复习题 5 对变量OXYGEN 检验该变量的分布是否为正态分布 0 05和 0 15 6 对GROUP 0 1 2分别绘制OXYGEN的盒形图 这些盒形图中有否异常值 他们代表哪些人 从这三个并排的盒形图可直观地得出什么结论 7 变量RUNTIME的标准差和极差是什么 这些值说明什么 打开CLASS数据集 可类似完成题1中的练习 这里分类变量为SEX或AGE 数值变量为WEIGHT和HEIGHT 另要求 1 计算AGE的频数分布表 并要求输出按年龄由大到小的频数表 38 统计软件复习题 九 参数估计 的练习题 见 讲义 中P114 1 打开数据集FITNESS 用菜单系统或编程方法求变量OXYGEN和RUNTIME的置信度为95 和97 5 的置信区间 打开BCLASS数据集 并用SAS INSIGHT或分析家分别计算变量HEIGHT和WEIGHT均值的90 和97 5 的置信区间 39 统计软件复习题 十 假设检验 中的练习题1 4 见 讲义 中P121 用菜单系统或编程 1 打开BCLASS数据集 并用SAS INSIGHT检验 H0 50 公斤 对立假设H1 50 公斤 其中 表示WEIGHT的均值 显著水平 0 05 使用t检验时请验证数据是否为正态数据 4 打开BCLASS数据集 并用SAS INSIGHT 分析家或编程检验男女两组学生的身高和体重是否有显著差异 40 统计软件复习题 1 首先检验两组身高和体重的分布是否为正态分布 2 检验两组身高 或体重 的方差是否相等 即检验H0 2 男h 2 女h 对立假设H1 2 男h 2 女h H0 2 男w 2 女w 对立假设H1 2 男w 2 女w 显著水平 0 05 3 检验H0 男h 女h H1 男h 女h 显著水平 0 05 并根据 2 的结果确定使用哪项输出结果 4 检验H0 男w 女w H1 男w 女w 显著水平 0 05 并根据 2 的结果确定使用哪项输出结果 41 统计软件复习题 十一 相关分析 中的练习题 见 讲义 P126 对中学生数据 BCLASS 用SAS菜单系统或编程完成以下练习 1 计算AGE WEIGHT HEIGHT的相关系数 并写出最大相关系数及检验r 0的P值 3 用SAS INSIGHT绘制WEIGHT与HEIGHT的散布图 男女用不同颜色 不同年龄用不同的符号表示 42 统计软件复习题 十二 一元线性回归分析 中的练习题 见 讲义 中P131 讨论某种合成纤维的强度Y与拉伸倍数x的相关关系 数据见数据集DST regE21 试用SAS菜单系统及编程完成以下练习 1 建立 合成纤维的强度 与x 拉伸倍数 回归关系式 并给出回归系数的检验结果 2 给出当x 2 3 2 6 2和10 2时 合成纤维的强度的预测值及预测均值的90 置信区间 3 绘制Y对x的散点图 回归线及均值或预测值的95 的置信限 用二种方法 43 统计软件复习题 十三 多元线性回归分析 中的练习题 见 讲义 中P136 对不同类型汽车的价格和性能的数据 DST CARS 用SAS菜单系统及编程完成以下练习 1 建立MIDPRICE与citympg cylinder hwympg rpm egnsize revltns fueltnk和perform的多元线性回归关系式 并给出各个回归系数的检验结果 0 10 2 由回归系数的显著性检验结果 能否指出影响中间价格的主要因素是哪些 哪几个因素是不显著的 0 10 3 对92辆汽车的数据用以上拟合的回归式进行预测 并且给出均值的95 的置信区间 44 统计软件复习题 十四 变量选择 中的练习题 见 讲义 中P140 对不同类型汽车的价格和性能的数据 DST CARS 用菜单系统 分析员应用 及编程完成以下练习 1 用逐步筛选方建立MIDPRICE与citympg cylinder hwympg egnsize rpm revltns fueltnk和perform的最优回归方程 引入和保留变量的显著性水平为0 05 2 计算MIDPRICE 中间价 与citympg cylinder hwympg egnsize rpm revltns fueltnk和perform的所有可能回归式 对每种变量个数输出最好的三个回归子集 并输出统计量CP和RMSE 然后由输出结果找出按RMSE准则最优的回归模型 45 统计软件复习题 十六 SAS与方差分析 中的练习题1 2 见 讲义 P165 1 为研究广告的效果 考察四种广告方式 当地报纸广告 paper 当地广播广告 ratio 店内销售员 people 店内展示 display 该省共分为144个销售点 每种广告方式随机地在36个销售点实施 在每个销售点以千美元为单位计量其销售水平 要考察各种广告方式下其平均销售水平是否有显著差异 数据集ADS中包含这些变量的数据 AD广告类型SALES以千美元记录的销售水平 46 统计软件复习题 3 检验四种广告方式下销售均值相等的假设 原假设和备选假设是什么 4 R平方的值是什么 如何说明这一统计量 5 在 3 中这一检验的p值是什么 假设 0 01 可得到什么结论 7 查看残差的分布并作正
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030中国草本植物行业发展趋势分析与未来投资战略咨询研究报告
- 社区筛查工作总结
- 弱电负责人年度工作总结
- 离婚协议签订注意事项及子女抚养权及监护权协议
- 高净值人士离婚财产分割与子女抚养费约定合同样板
- 离婚协议中夫妻共同债务分割及追偿范本
- 社区社区活动场地租赁及社区文创产品推广合同
- 护理人员服装礼仪标准
- 离婚子女抚养费用调整及子女生活费用调整补充协议
- 2025至2030中国冻干粉针剂行业运营态势与投资前景调查研究报告
- 2025版防洪堤坝加固工程施工合同
- 2025年消防经济学试题及答案
- 2025-2026学年人教版(2024)小学美术三年级上册教学计划及进度表
- 智能培训系统构建
- 2025年秋期新教材人音版三年级上册小学音乐教学计划+进度表
- 2025广东广州越秀区矿泉街招聘禁毒专职人员1人考试备考题库及答案解析
- 14.守望生命 课件 九年级上册《心理健康教育》(鲁教版)
- 2025年医院安全员安全技能测试
- 网络安全技术培训
- 医学检验项目培训
- 2025年兽医实验室理论考试题库及答案详解【夺冠系列】
评论
0/150
提交评论