




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 生物统计学本科生sas软件高级编程教学的探索与实践 张汝阳+魏永越+赵杨+于浩+陈峰摘要:生物统计学专业旨在培养高素质的复合型统计应用人才。sas软件高级编程是优秀生物统计学人才的必备技能。因此,sas软件高级编程教学对专业人才培养至关重要。目前,国内开设生物统计学专业的医学院校屈指可数,且sas软件高级编程教学经验相对缺乏。本文以我校生物统计学本科生的课程教学实践为例,对课程设置、教学内容、授课方式、考核形式、参考教材、软硬件设施和教学效果进行了总结和思考,以期进一步提高教学质量、保障生物统计学本科生的职业竞争力。关键词:生物统计学;本科
2、生;sas软件高级编程:g642.0 文献标志码:a :1674-9324(2017)52-0114-032011年,经国务院学位委员会批准,统计学独立成为理学一级学科,下设两个二级学科:统计学、应用统计学。生物统计学是隶属于应用统计学之下的三级学科1。为适应我国生物医药领域对生物统计人才的需求,加快培养专业人才,南京医科大学在2012年正式开设全日制应用统计学专业(生物统计学方向),每年面向全国招收约30名本科生,四年制,授予理学学士学位2。该专业的总体目标是培养“具备系统的统计学知识、了解统计学理论、掌握统计学的基本思想和方法,具有利用计算机软件分析数据的能力,能在生物、医药等领域工作的高
3、素质、复合型的统计应用人才”3。sas软件是全球商业智能和分析软件与服务领袖。全世界超过6万家企业利用sas软件进行数据挖掘,以便准确地进行业务决策。在新药临床试验领域,sas软件更是使用最广泛的分析平台。根据培养目标,我們在第3学年的第1学期开设了sas软件高级编程课程。该课程是sas应用基础的进阶课程,旨在培养学生编程思维,传授编程技巧,提高数据管理和分析的技能,达到“技术高、速度快、失误少”的业务水平,满足相关领域专业人才的需求。由于我国开设生物统计学专业的医学院校屈指可数,缺乏健全的课程方案参考4。在兄弟院校、制药企业、我校公共卫生学院、教务处、研究生院等多方专家指导之下,我们结合用人
4、单位实际工作需要制定了课程方案。结合之前2003级五年制预防医学专业(生物统计学方向)的办学经历、近5年四年制理学生物统计学专业办学经验,我们已经持续10年对生物统计学本科生培养进行了一系列探索和改革。针对sas软件高级编程课程,我们也不断根据学生的教学意见反馈、雇主用工反馈等,将课程设置、教学内容、授课方式等逐年完善。我们在此对该课程进行总结与思考。一、课程设置sas软件高级编程是生物统计学专业的必修课程,学时设置为72。其中,理论学时24,实验学时48。学生通过考核,可获得4个学分。二、教学内容我们一共安排了18次课程。理论教学及实践操作内容包括:1.基础知识复习。复习先修课程sas应用基
5、础,承前启后。从教学内容和学生心理上,做好由“简”入“难”的衔接。另外,展示基于sas软件完成的项目,突出高级编程技能的作用和优势,激发学生课程学习的热情和积极性。2.宏变量及宏程序。介绍宏程序的基本结构、基本概念和语法、宏变量类型、宏变量的赋值与解析,让学生认识宏程序;介绍宏的创建、编译、保存、调用与更新,以及日志的解读和宏调试,让学生能够管理宏程序。3.宏的循环体介绍。介绍循环方式、条件判断、中止、跳转语句,让学生理解程序“批量处理”、“容错”、“自动化”等概念;介绍sql过程与data步与宏变量的交互方式、动态构造sas宏语句,让学生掌握“用程序写程序”的关键技能;介绍宏的嵌套、包装,让
6、学生理解“分而治之、逐个击破”的概念,掌握撰写复杂程序的技能。4.系统宏函数介绍。介绍字符函数、运算函数、引用函数、属性函数等用法,以及如何使用逃逸符赋值、解析特殊字符等,让学生全面掌握系统函数,撰写高效、简洁的宏程序。5.数据集函数介绍。介绍attrn、varnum、fetchobs、getvarn、open、close等数据集函数,使得学生能够快速获取数据集本身及变量的基本信息,以便高效地进行宏变量与数据集间的信息交互。6.data步使用技巧。介绍不同读取数据方式的效率、创建数据集的技巧、数据集横向与纵向拼接、记录的修改、循环语句、条件语句、retain语句、外部数据导入、记录导出、记录的
7、扩展、变量排序技巧、数据集转置,数组类型、变量格式化、自定义变量格式、格式互转等常见技巧,以期提高学生数据管理的软件技能。7.sql过程数据管理。介绍sql过程中表格与视图的差别、表格的创建、更新、拼接、删除、记录的查询、多重查询等。同时,比较data步与sql过程中相同功能的运算速度,给出实际应用的参考建议。8.iml矩阵运算i。介绍矩阵性质、矩阵元素、创建矩阵、运算符号、矩阵运算、下标运算、矩阵更新、缺失处理、矩阵函数等。9.iml矩阵运算ii。介绍iml程序设计语言(循环、条件判断、跳转、定义模块、调用模块)、矩阵与sas数据集相互转换(打开、显示数据集、转换为矩阵、读取记录、读取变量等
8、)、iml环境下对sas数据集的操作等。通过两次iml矩阵运算课程,使得学生可以利用sas软件实现指定的复杂统计算法。10.模拟试验i。介绍蒙特卡洛的典故、思想、步骤;介绍各种统计分布的随机函数;介绍产生纵向和横向模拟数据的方式、优缺点。以“分别从不同分布的总体中抽样,探讨不同样本含量、抽样次数对样本均数、标准差、标准误的分布的影响”为案例,介绍模拟试验的基本步骤:理解模拟试验目的建立模拟试验流程预估模拟试验结果调试各步sas的程序统筹撰写sas宏程序运行程序等待结果整理结果绘制报告。11.模拟试验ii。设计多种案例,供学生上机操作,巩固模拟试验技能。例如:从正态分布中随机抽取样本,根据样本估
9、计总体均数的95%可信区间。重复1000次,有多少次能估计到总体均数?不同的样本含量、不同的可信度对结果有什么影响? 12.ods输出传送系统。介绍ods的功能;介绍ods常用语句,包括:管理输出对象,打开、关闭、管理ods目标(输出为rtf文件、自定义文件的格式等)。13.dde文件交互技术。介绍excel文件数据导入为sas数据集、sas数据集输出到excel、整理或修改excel文件格式、sas数据集输出到word等。14.常见报表过程。着重介绍tabulate过程的选项、含义,以及自定义表格样式。15.综合案例i:撰写宏用于:(1)批量进行单因素或多因素的线性回归分析;(2)批量进行组
10、间均数、率或中位数的描述和比较;(3)评价fisher确切概率法和卡方检验的统计学性质。16.综合案例ii:撰写宏用于:(1)批量安装多个sas宏程序;(2)实现二分法搜索目标值;(3)自动生成mixed过程中contrast语句两两比较的代码。17.综合案例iii:(1)从同一个正态分布总体中随机抽取2个样本,设定检验水准0.05,对均数进行检验。重复1000次,拒绝h0的比例多大?改变检验水准、样本含量,比例有何变化?从均数不同、方差相同的两个正态分布总体中随机抽样。重复上述步骤,结果如何?(2)配对设计的两均数比较,如果不用配对t检验而采用成组t检验,对一类错误和检验效能有何影响?改变样
11、本含量有何影响?(3)多组均数比较,如果不考虑anova的结果,而直接用两两比较,对一类错误和检验效能有何影响?18.综合案例iv:(1)从二元正态分布中随机抽样,并对样本进行回归分析,画出回归曲线。重复上述过程100次,看到什么图形?(2)同时对两个假设进行统计学检验,若要控制总一类错误0.05,一般每个检验水准设为0.025。可否一个0.04,另一个0.01?(3)permutation检验可以利用手头样本来进行假设检验,对总体分布没有要求。请利用已有方法进行验证,并编写程序,对变异系数进行检验。三、授课方式根据教学内容,采用“量体裁衣”的策略进行授課。课程初期,采用“教师讲解示范、学生上
12、机操作、现场互动答疑”的形式,确保学生“听懂了、学会了”。课程后期,学生已经掌握大部分编程技能。授课方式改为“以学生为主体”,采用“教师学生互动交流”的形式,即:学生代表给出编程思路,其他学生给出补充意见,教师再次点评并完善编程思路。学生在课堂当场完成实践内容,并进行现场程序与结果的展示。我们期望发挥学生的主观能动性,提高教学效果。四、考核形式课程成绩由平时成绩(30%)和卷面成绩(70%)组成。课程结束后,教师通过南京医科大学elearning课程中心平台发放练习。学生通过平台接收题目、提交程序代码和图表结果。教师评阅打分后,折算平时成绩。期末考试为上机考试。以实际项目为考题,要求学生在指定
13、时间内完成编程,并提交代码和结果。教师评阅打分后,折算成卷面成绩。五、参考教材及软硬件设施由于缺乏合适的教材,我们目前采用内部自编讲义授课。内容主要参考以下白皮书sas macro programming made easy、sas macro language reference和sas sql procedures users guide。软件设施:我院生物统计学系拥有正版sas软件的授权许可。硬件设施:本课程涉及统计模拟试验、大型数据管理与分析等计算密集型工作。为提高学生上机体验,保证教学质量,我院搭建了高性能计算集成系统。该系统包括1个胖节点(1tb内存,8颗8核处理器)、18个刀片计
14、算节点(每个节点64gb内存,含2颗16核cpu)、2个管理节点和一个储存系统。该集群21个节点的总内存为2280 gb,cpu共704核,浮点运算能力理论峰值达到5.38千万亿次级。在此系统基础上,我们专门为生物统计学专业本科生部署了云端机房,可同时容纳约60名学生进行上机操作与考试。师资队伍:生物统计学系现有专任教师14人。具有博士学位的12人,高级职称的5人。8人具有海外留学经历。10人具有长期sas教学经验、sas技能竞赛导师经历。六、教学效果“汇丰杯”中国高校sas数据分析大赛是目前全国规模最大、认可度最高的sas软件技能大赛。我院生物统计学专业本科生积极组队参加大赛。2015年,我
15、院2支队伍分别获得全国第20名、29名的成绩。2016年,我院3支队伍从658支队伍中脱颖而出,分别获全国第6名、22名、46名的好成绩。全国大学生统计建模大赛由中国统计教育学会、中国现场统计研究会、中国数学与概率统计学会、中国卫生信息学会、中国市场信息调查业协会联合举办。我院首届生物统计学专业本科生组成的3支参赛队伍在2015年第四届大赛中,分别获得大数据统计建模类(本科生组)二等奖、三等奖、优秀奖的成绩。本课程研究生助教组成的队伍则获得大数据统计建模类(研究生组)一等奖第一名的优异成绩。此外,自2013年起,生物统计学专业的本科生连续获得勃林格殷格翰(boehringer-ingelhei
16、m)奖学金课题资助,运用编程技能,就临床试验热点问题开展理论与实践研究。七、体会与思考从课程设置上看,我们通过12的理论与实践比例,强化学生的动手意识,着重培训学生的操作能力。这也符合近年来国家一直倡导的“知行合一”的教学理念。从教学内容上看,我们从实际需求出发,传授编程技巧,培养优秀程序员的思维。模拟试验i的案例对应的是中心极限定理。模拟试验ii的案例对应的是可信区间。综合案例则涉及一类错误、检验效能、两两比较等统计学概念。学生既能综合运用编程技术解决实际问题,又能深刻理解理论知识,达到“实践出真知”。此外,从授课方式看,我们以具体案例为切入点,运用以学生为主体的教学方法,其本质也是“以问题
17、为导向的学习(problem-based learning,pbl)”方式,有利于保证教学质量5。尽管目前教学效果尚可,但仍有值得改进之处。就教学内容而言,部分现有案例的主题不够新颖,案例内容需要与时俱进6。例如,当下疾病研究热点是:从组学的角度探索影响其发生、发展的遗传因素。能否运用sas有效地进行高维数据挖掘值得思考。就授课方式而言,我们可以在课堂上开展小组竞赛,设置奖品,增加课程的趣味性,激发学生的积极性。sas软件高级编程是一门真正的“理论与实践相结合”的专业技能课程。经过本课程培训,学生能够达到统计知识与技能“综合运用、融会贯通”的水平,保障学生从事生物统计学相关工作的职业竞争力。参考文献:1袁卫.机遇与挑战写在统计学成为一级学科之际j.统计研究,2011,28(11):3-10.2赵丽萍,赵杨,于浩,胡志斌,陈峰.生物统计学本科专业人才培养方案的设置与思考j.中国卫生统计,2015,32(2):364-365.3中华人民共和国教育部高等教育司.普通高等学校本科
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国酶联免疫试剂盒市场分析及竞争策略研究报告
- 2025至2030年中国金属耐磨材料市场分析及竞争策略研究报告
- 甘肃瓷砖防滑施工方案
- 风亭基坑施工方案
- 对讲电话施工方案
- 定西微波塔施工方案
- 地铁的地面施工方案
- 安装防水施工方案范本
- 委托寄卖合同书
- app产品推广方案范文
- 人民检察院刑事诉讼法律文书格式样本2022
- (高清版)DZT 0216-2020 煤层气储量估算规范
- 人教版四年级上册语文第一单元测试题(含答案)
- 储能电站项目建设流程详解
- 供应商尽职调查模板
- 饮用水配送方案
- 妊娠滋养细胞肿瘤护理查房课件
- 磁粉检测课件
- 日本银行业历史复盘与启示
- 有效管理的5大兵法学习分享-20.2.4
- 2022年湖北统招专升本英语真题带答案
评论
0/150
提交评论