dps统计软件操作指导书.doc_第1页
dps统计软件操作指导书.doc_第2页
dps统计软件操作指导书.doc_第3页
dps统计软件操作指导书.doc_第4页
dps统计软件操作指导书.doc_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

dps统计软件操作指导书 DPS数据分析平台操作指导书杜双奎于修烛李志西张国权编西北农林科技大学二一二年七月说说明DPS是Data ProcessingSystem的缩写。 该系统采用多级下拉式菜单,用户使用时整个屏幕犹如一张工作平台,随意调整,自如操作,称其为DPS数据处理工作平台,简称DPS平台。 它是一款国产的数据处理软件,除了输出结果较为简单外,其功能十分齐全,是一个“通用多功能数理统计和数学模型处理软件”。 与国外同类专业统计分析软件(如SAS、SPSS、STAT、STATISTICA等)相比,DPS系统是独特的,它在使用时不必拘泥于一般电子表格的行列规定,行和列由系统辨认。 DPS在统计分析及模型模拟方面功能齐全,易于掌握,特别是对于广大中国用户更为方便。 DPS平台将数值计算、统计分析、模型模拟以及画线制表等功能融为一体,具体表现在以下几方面它提供了包括均匀设计、混料均匀设计在内的丰富的试验设计功能,并在均匀设计中采用了独创算法,实现了大型均匀设计表构造的重大突破。 完善的统计分析功能涵盖了几乎所有的统计分析技术,是目前国内统计分析功能最全的软件包。 其一般线性模型可以处理各种类型试验设计方差分析,特别是一些用SPSS菜单操作无法解决、用SAS编程很难实现的多因素裂区混杂设计、格子设计等方差分析问题,在DPS中可轻松搞定。 独特的非线性回归建膜技术实现了“可想即可得”的用户需求,且参数拟合精度高。 不断丰富的专业统计分析模块可适合各个学科的特殊需求,如先后增加了顾客满意度指数(结构方程)模型、数学生态学方法、生物测定、地理统计、遗传育种、生存分析、水文频率分析、量表分析、质量控制图、ROC曲线分析等内容,并且还在不断地扩充。 DPSExcel十SPSS。 它既有Excel那样方便地在工作表里面处理基础统计分析的功能,又实现了SPSS高级统计分析技术。 DPS提供的十分方便的可视化操作界面,可借助图形处理的数据建模功能为处理复杂模型提供最直观的途径。 这些功能是同类软件中所欠缺的。 有些不是统计分析的功能,如模糊数学方法、灰色系统方法、各种类型的线性规划、非线性规划、层次分析法、BP神经网络、径向基函数(RBF)等,在DPS里面也都可以找到。 根据用户要求,不断吸纳新的统计方法,如小波分析、偏最小二乘回归、投影寻踪回归、灰色系统方法、混合分布参数估计、含定性变量的多元逐步回归分析等,并在不断探索,吸纳更多功能,使系统更加完善。 当需要退出时,可以单击文件,选择其中的Exit命令,或者单击关闭。 标题栏菜单栏工具栏工作表工作表标签图1-1DPS窗口界面1.2DPS用户工作界面进入状态后,系统会出现如图1-1所示的用户工作界面。 DPS工作界面包含标题栏、菜单栏、工具栏、下拉菜单、工作表、当前工作表、活动单元格、工作表标签及文本区等部分。 (1)标题栏标题栏告诉用户正在运行的程序名称和正在打开的文件名称。 如图1所示,标题栏显示此窗口的应用程序为DPS,在DPS中打开的当前文件的文件名为“DPS数据处理系统(试用版)”。 (2)菜单栏菜单栏显示“文件”、“数据”、“数据分析”、“试验设计”、“试验统计”、“分类数据统计”、“专业统计”、“多元分析”、“数学模型”、“运筹学”、“数值计算”、“时间序列”及“其他”等菜单项。 当选中某一菜单项时,会引出一个下拉式菜单,可以从中选取相应的子菜单。 另外,在屏幕的不同地方单击鼠标右键时,“快捷菜单”将出现在鼠标指针处。 选取“快捷菜单”中的命令如同从菜单栏的菜单上选取相应命令的效果是一样的,但选取速度明显增快。 (3)工具栏12DPS提供了几种工具栏,这些工具可简化用户操作。 工具栏中的按钮都是常用命令,当鼠标指向某一按钮时,片刻后会在按钮右下方显示该按钮命令的含义。 工具栏的第一行是常用工具栏。 常用工具栏中为用户准备了使用DPS、处理数据最常用命令的快捷按钮,如“新建文件”按钮、“打开文件”按钮、“保存文件”按钮。 “格式”按钮处理那些和文本外观有关的命令,如字体、字号、对齐方式及其他选项。 工具栏的第二行是数据矩阵处理快捷按钮。 该工具栏处理当前活动单元格的数据阵列。 可以对活动单元格的数据进行矩阵相加、相减、相乘、矩阵求逆等运算,还可以解正规方程组。 (4)工作表工作表窗口可有多张独立的工作表。 开始时,窗口中显示第一张工作表“第l页”,该表为当前工作表。 当前工作表只有一张,用户可通过点击工作表下方的标签激活其他工作表为当前工作表。 工作表是一个由行和列组成的表格。 行号和列号分别用字母和数字区别。 行由上到下范围l-65535,列号则由左到右采用字母编号AIV。 因此每张表最大可为255列65535行。 在此范围内,工作表的大小可以由用户自己设定。 每一个行、列坐标所指定的位置称之为单元格。 在单元格中用户可以键入符号、数值、公式以及其他内容。 (5)工作表标签工作表标签通常用“第1页”、“第2页”等名称来表示,用户也可以通过用鼠标右击标签名来对其进行修改。 DPS一般同时显示工作表队列中的前三个标签。 利用标签队列左边的一组标签滚动按钮可显示队列中的后续工作表的标签。 工作簿窗口中的工作表称之为当前工作表,当前工作表的标签为白色,其他为灰色。 (6)滚动栏当工作表很大时,可以使用工作簿窗口右边及下边的滚动栏,使窗口在整张表上移动以方便查看表中的全部内容。 (7)状态栏状态栏位于DPS窗口底部,它的左端是信息区,右端是键盘状态区。 在信息区中,显示的是DPS当前的工作状态。 DPS软件除具备齐全的统计分析功能外,还提供了包括多种类型的试验设计技术。 如随机区组设计、拉丁方设计、正交设计、正交回归设计及均匀试验设计等试验设计技术。 由于DPS功能齐全,易于掌握,尤其是对广大中国用户,其工作界面友好,只需熟悉它的一般操作规则就可灵活应用。 1.3DPS的基本操作1.3.1文件操作 (1)新建文件进入“文件”菜单栏,选择“新建”即可创建一个新的DPS数据文件。 (2)打开文件进入“文件”菜单栏,选择“打开”子菜单,可在DPS中打开一个已经存在的数据文件。 它可以是DPS的数据文件,也可是文本文件或Excel数据文件。 (3)保存文件进入“文件”菜单栏,选择“保存”命令,可保存当前数据文件。 如果选择“另存为”,可将当前工作簿存为一个新的文件。 1.3.2数据的输入 (1)手动输入建立一个新的DPS文件之后,便可进行数据的输入操作。 DPS中以单元格为单位进行数据的输入操作。 一般用上下左右光标键,Tab键或用鼠标选种某一单元格,然后输入数据。 DPS数据通常可分为数值型、字符型、日期型3种类型。 DPS软件可根据输入数据的格式自动判断数据属于什么类型。 如日期型的数据输入格式为“月/日/年”、“月-日-年”或“时分秒”。 要输入数据由数字与小数点构成,DPS自动将其识别为数字型。 要注意的是,数据统计分析要求是数值型的,数值型数据字体显示是蓝色的,而字符型数据是黑色的。 (2)复制生成数据DPS数据也可由复制生成。 实际上,在生成的数据具有相同的规律性的时候,大部分的数据可以由复制生成。 可以在不同单元格之间复制数据,也可以在不同工作表或不同工作簿之间复制数据,可以一次复制一个数据,也可同时复制一批数据,为数据输入带来了极大的方便。 这和常用的Excel电子表格操作类似。 另外,数据的剪切、复制和粘贴,是和Windows其它应用程序共享数据的有力工具,可以通过这种方式和Word,Excel,SPSS等其它应用程序互相交换数据如可将数据从Excel表格里面复制过来,进行统计分析,然后将统计分析得到的结果通过复制的方式,放到Word里面形成统计报告, (3)公式生成数据DPS数据也可由公式直接生成。 例如在当前工作表中A1和B1单元格中已输入了数值数据,欲将A1与B1单元格的数据相加结果放入C1单元格中,可按如下步骤操作用鼠标选定C1单元格,然后输入公式“=A1+B1”或输入“=SUM(a1b1)”,回车之后即可完成操作。 C1单元格此时存放实际上是一个数学公式“A1+B1”,因此C1单元格的数值将随着A 1、B1单元格的数值的改变而变化。 DPS提供了完整的算术运算符,如(加)、(减)、*(乘)、(除)、(指数)和丰富的函数,在DPS公式输入的帮助中可以查到各类算术运算符和函数的完整使用说明。 1.3.3数据统计分析及其建模基本步骤1.数据统计分析基本步骤 (1)将数据之后,进行统计分析之前,须将分析数据定义成数据块。 在数据块中的数据一般是一行为一个记录(样本),每个记录有多个变量,各个变量因子可用x1,x2,x m表示参与运算。 图1-2为被定义的一个数据块,它有7个变量,21个样本。 图1-2数据与定义格式图数据块的定义最通用的方法是将鼠标位置移到数据块的块首,按下左钮并拖动鼠标到数据块的块尾位置,然后松开按钮,即可完成数据块的定义。 如在按下Ctrl键时再按下并拖动鼠标,则可定义第二个数据块。 此外,如果要选定某行或列的连续数据区域,还可单击区域的第一个或最后一个单元格,然后按下SHIFT键,并双击与选定单元格区域方向一致的单元格。 公式块的定义方法是将鼠标位置移到公式块的块首,按下右钮并拖动鼠标到公式块的块尾位置,然后松开按钮,即可完成公式块的定义。 (2)进入菜单选择相应的统计功能项。 (3)当光标位于菜单上相应功能项时点击鼠标按钮,系统即对数据矩阵块内的数据进行分析,并将分析结果返回到器中,系统也返回状态。 32数学模型分析的基本步骤 (1)在电子表格中和定义数据矩阵块。 数据格式一般以列代表变量,以行代表样本,并拖动鼠标定义数据块。 这时灰色背景部分即为可进行统计分析的数据矩阵块。 (2)在下部的文本器中和定义数学公式。 公式中用“x+数字”表示数据块中某列数据,用“c+数字”表示模型中待求参数。 例如,将测定的某种肉鸡在良好生长过程的数据资料,按图1-3方式,定义数据块,块中的第1列数据为测定时间(周),为自变量,第2列数据是体重(kg),为因变量。 若对这两列数据建立Logistic模型1a bxKye?,只需令c1=K,c2=a,c3=b,并在器中写入如下公式,再拖动鼠标定义公式块。 x2=c1/(1+exp(c2+c3*x1),式中x1和x2表示数据块中第 1、2列数据,c1,c2,c3表示模型的待求参数。 (3)进入菜单操作,在菜单下选择“数学模型”?“单因变量模型参数估计”?“麦夸特法”,即可求解模型参数及有关统计量的分析结果(图1-3)。 定义数据定义公式分析结果图1-3数据统计分析建模示意图4第二章基本统计分析2.1基本参数计算试验资料经输入到DPS电子表格之后,用鼠标选中数据,按下鼠标右按钮,即可计算一系列的统计特征数。 如图2-1所示。 最常用的统计特征数是和(sum)、平均数(mean)、方差(variance)、标准差(standard deviation)、斜差(skewness)、峰态(kurtosis)等。 图2-1基本参数运算该运算也可在快捷工具栏或菜单下完成。 先在DPS处理平台上,将资料定义成数据块,然后在工具栏中执行“基本统计参数”按钮,即可得到基本参数。 需要说明的是每次点击“基本统计参数”仅仅针对试验的某一个指标运算,而不能同时运算多个指标。 主要参数应用范围及注意事项 (1)算术均数适用于呈正态分布的资料。 对其他分布资料在用函数变换后,经正态性检验符合正态分布后亦可用。 (2)标准差常用于表示观察值间波动的大小,如精密度的大小。 当资料服从正态分布时,可结合均数估计正常值范围。 (3)标准误常用于表示抽样误差的大小,可结合均数估计参数的可信区间。 (4)变异系数常用于比较均数相差悬殊的几组资料的变异程度,或比较度量单位不同的几组资料的变异程度。 (5)标准差、标准误与样本含量的关系56S标准差随着样本含量的增多逐渐趋于稳定;标准误随着样本含量的增多逐渐减小。 如均数的标谁误,当标准差不变时,与样本含量的平方根成反比;当样本含量不变时,与标准差成正比。 2.2常用统计分布及DPS统计函数2.2.1正态分布norm(x)函数norm(x)即是计算正态分布的概率,亦即当随机变量x满足N(0,1)分布时,求出小于x值的概率。 例2-1设x服从N(0,1),试求 (1)p(x0.64); (2)p(1.53?x); (3)p(-2.12?x-0.25)。 目前在数理统计分析中,求解上述概率是要查正态分布表的,根据查表结果求出上述分布函数。 而在DPS平台上,可用函数形式直接求出。 例如对p(x0.64)=?(0.64),在DPS平台的计算状态下,输入“=norm(0.64)”,即可得到结果0.738914。 同理,p(1.53x)=1-p(x1.53)=1-?(1.53),输入“=1-norm(1.53)”即可得到其结果0.063008;p(-2.12?x-0.25)=?(-0.25)-?(-2.12),输入“=norm(-0.25)-norm(-2.12)”即可得到结果0.38429。 2.2.2二项分布bin(n,m,p)函数bin(n,m,p)可用于计算二项分布的概率,亦即进行n次独立实验中出现事件a不少于m次的概率。 例如,某种生活用品的检验合格率为96%,现随机抽样100份,试求合格品在97份以上的概率。 根据二项分布原理,现n=100,p=0.96,m=97,由此可在DPS处理平台上应用二项分布函数来求得。 在计算状态下输入“=bin(100,97,0.96)”,即可得到结果为0.42947557,即100份合格品在97份以上的概率为0.4295。 2.2.32分布函数probchi(n,x)例如,自由度n=20,卡方值为5时,其分布函数的计算只需在DPS平台上键入“=probchi(20,5)”,即可得到结果为0.000277。 如求它的上侧概率,即键入“=1-probchi(20,5)”,便可得到结果0.999723。 2.2.4t分布函数probt(n,x)例如,自由度n=4,t=1.5时的分布函数计算,只需在DPS平台上键入“=probt(4,1.5)”,即可得到结果0.7920。 如求它的上侧概率,方法是键入“=1-probt(4,1.5)”,便可得到结果0.2080。 2.2.5F分布函数probf(n1,n2,x)计算F分布概率所定义的函数中,n1是大均方自由度,n2是小均方自由度,x为随机变量,F分布的显著水平a=1-probf(n1,n2,x)。 如n1=4,n2=1,x=0.4,其分布函数的计算,只需在DP平台上键入“=probf(4,1,0.4)”,即可得到结果为0.189004。 第三章单样本和两样本统计假设检验3.1单个样本平均数和总体均数差异检验在实际研究工作中,往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否某一总体。 已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。 基于正态分布的单样本检验有2种情形 (1)总体方差已知情况下的单样本检验u(z)检验在总体方差已知时,构造u统计量,服从标准正态分布,采用u检验,u统计量计算公式为0xun?式中0为已知总体平均数,是总体标准差,n为样本含量。 (2)总体方差情况下的单样本检验t检验在总体方差时,对于小样本资料(n0.05(图3-1)。 表明当日装罐机工作是正常的。 当总体方差时,已知样本均数是181.52,而样本标准差是40,样本数是100。 经验已知总体均数是190。 当这些数据填入工作表(dps_test.cll)上部的相应输入框中,可立即得到t值为2.12,双侧检验p值为0.0365。 如果备择假设是样本均值是否小于总体,那么就需要看工作表中的单侧检验p值,这里是0.0183,见图3-1所示。 3.2样本率和总体率的比较二项分布的重要应用是样本率和总体率的比较。 比较的方法有基于正态分布的大样本方法,和小样本时的精确方法两种。 (1)正态理论方法当样本数量n较大,且P0和1-P0都不太小,nP0(1-P0)5时,利用样本率的分布近似正态分布原理,可对样本率P与已知总体率P0比较,其检验统计量公式为000 (1)/p pup p n?根据u值可计算其显著水平p值。 (2)精确方法正态理论方法仅当nP0(1-P0)5时才能应用。 当该条件不能满足时,可用基于二项分布的精确检验方法计算。 如记X是二项分布的随机变量,具有参数n及p。 令?p x是观察到的事件数。 那么双侧检验时的概率p值计算依赖于备择假设为x n?,?0p p?还是?0p p?。 如果?pp0,则p=2Pr(Xx)=min0002 (1)nk kn knkCpp?,1如果?pp0,则p=2Pr(Xx)=min002 (1)nk kn knkxC pp?,1在DPS系统中也是以工作表的形式提供给用户。 图3-2是DPS为用户提供的对样本率和总体率差异进行检验的工作表。 用户操作时,先打开单样本检验工作表(文件名dps_test.cll),然后在工作表中填入自己的数据,就可以立即得到统计量及其显著水平p值。 图3-2样本率和总体率差异检验工作表(文件名dps_test.cll)89对某疾病采用常规治疗方法的治愈率是45,现改用新的治疗方法,随机抽取180名该3-2所示输入各大于5时,应该用基于二项分布的精确检验方法。 例如,设某一核能布资料处理类似,参见3下部分的大样本方法进行检验。 例如,某溶液原来当样本数量n较大,nP0(1-P0)5时,可利用正态近似方法对样本率P与已知总体率P0比较。 例3-2疾病的患者应用新法进行治疗,治愈100人。 问新疗法是否比常规疗法更为有效?根据nP0(1-P0)1800.450.5544.555,故可用正态近似方法来检验。 当如图个指标后,即可得到样本率估计值等于0.556,统计检验的单侧备择假设p值为0.0022。 即新法比常规疗法效果要好。 当样本较小,nP0(1-P0)不工厂中5564岁男性中死亡13人而其中5人死于癌。 如果人口普查,死亡人中约20的死亡者能归因于某种癌而死亡,问该核能厂因癌而死亡与总体的20有无差异。 这里因样本较少,nP0(1-P0)2.1,小于5。 故应该用精确检验方法。 检验时,如图3-2所示,在图的上部分工作区域内输入各个指标后,立即得到样本率估计值等于0.3846,统计检验的双侧备择假设p值为0.1983。 即该核能厂中因癌死亡比例和一般人群相比,没有显著差异。 对于Poisson分布资料而言,进行样本均数和总体均数比较时,和二项分单样本检验工作表(文件名dps_test.cll)。 当样本观察数x较大(10)时,可使用图3-平均含细菌80个/mL,以某低剂量的辐射后取1mL培养得细菌40个,问该低剂量辐射是否有杀菌效果。 这里因为有杀菌效果,则细菌数有所下降,因此是单侧检验。 由于观察数较大,可用大样本方法。 在DPS工作表中,只要在观察数下面输入40,在总体下面输入80,即可得到卡方值等于20.00,显著水平p值等于0.0000(一般在文章中表达为p0.05,表明两种提取方法的茶多糖含量没有显著差异。 以上的t检验是比较两种处理的某种定量效应(两均数)是否存在差异的统计分析方法。 要求数据正态总体,两总体方差相等。 如条件不满足,可采用加权后的统计做适当转换,使转换后的数据满足条件,对变换后的数据做t检验。 或者采用两均数比较的非参数检验Wilcoxon-Mann-Whitney秩和检验方法。 两平均数t检验方法是建立在正态分布的基础上。 但对于两个样本率p 1、p2差别的假设检验,即H0p1=p2=p对H1p1p2,这里的p是常数(总体率来的百分率差异的显著性,也可以建立在正态分布近似二项分布的基础上。 基于这样考虑有两种常用的方法一个是基于两样本率差值的正态理论方法,另一个是列联表方法,这两种方法是等价的。 实际应用时可任意选用一种。 但是这两者方法的使用,因为是建立在正态分布13诉我们统计检验结果的显著水平,而不用再重复;著性(有时记为NS);有倾向性的统计显著。 学显著性;如果p0.05,则接受结果在科学上是多么重要,这种情形特别容易发生在大样。 此时,备择假设中包括了12或12两种可能。 它仅判断1和近似二项分布的基础上,这样要求用正态分布近似二项分布是有效的,所以不是任何情形都适用,特别是在小样本时。 详见有关书籍。 目前几乎所有的统计软件,在给出统计量的同时,还给出了精确的p值。 简言之,p值就是传统所说的水平(显著水平)。 p值可以精确地告采用不同的水平。 根据p值进行统计推断常用标准是如果0.01p0.05,则结果显著;如果0.00

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论