版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章属性数据分析与FREQ过程属性数据简介在一个有三个主要大型商场的商贸中心,调查476个不同年龄阶段的人首先去三个商场中的哪一个。
我们看到市场调查表中,所得到的信息一般是被调查对象的分类信息,而不是定量变量的具体值。
从例子中我们看到对观测对象通过商场和调查对象的年龄段进行了分类,得到一个二维表格。
那么从这个数据我们是否能看出顾客的年龄段与他所去的商场有联系吗?为了了解广告是否对消费者产生影响,某广告公司在某地区连续广告一个月,和在没有进行广告宣传的地区分别随机抽取了100名消费者(实际的或潜在的)进行问卷调查,得到下表:已购买打算购买不打算购买看过广告60337没看过广告154035变量的类型
按类型可以分为:字符型和数值型,按测量水平可以分为:区间型和名义型。
数值变量就是能用数字来计量的变量;而不能用数字来计量的变量则称为字符型变量,也称为属性变量。
区间型变量是指变量的取值可以为一个连续的数值区间,又可分为比率变量和间隔变量。名义型变量是指变量本身本质上不能用数值表示,用数字没有真正意义,又可分为分类变量和有序变量。
按类型可以分为:字符型和数值型,按测量水平可以分为:区间型和名义型。分类变量和有序变量统称为属性变量,也称字符型变量或定性变量。间隔变量和比率变量则称为数值型变量,也称为定量变量或连续型变量
分类变量和有序变量统称为属性变量,有时也称为字符型变量或定性变量;一般在属性数据分析中需要解决:
而间隔变量和比率变量则称为数值型变量,有时也称为定量变量或连续变量。
对属性变量进行的数据分析称为属性数据分析。(1)产生汇总分类数据——频数表;(2)属性变量之间的独立性检验;(3)在属性变量之间存在关联的情况下,计算他们之间的关联系数。属性数据分析中一些常见概念与检验统计量
双向表(二维表)由两个属性变量交叉分组所得到的表。
多向表(多向交叉表或多维表)由两个以上属性变量构成的表。
单向表(一维表)由一个属性变量进行分组构成的表。
双向表无关联性检验的统计量
双向表中行变量与列变量相关性的检验行列变量都是有序变量时主要功能FREQ过程是SAS系统中用于属性数据分析的主要过程之一,可以生成单向到N向的频率表和交叉表。对于双向表(二维表),该过程计算检验统计量和关联度。对于N向表,该过程进行分层分析,计算每一层和交叉层的统计量。FREQ过程FREQ过程的一般格式PROCFREQ
<option-list>;BYvariable-list;TABLESrequest-list</option-list>;WEIGHTvariable;OUTPUT<OUT=sas-data-set><output-statistic-list>;FREQ过程语句说明:(1)TABLES语句:一般格式:TABLESrequest-list</option-list>;若没有任何选项,则对tables语句中规定的变量的每个水平计算频数,累计频数,占总频数的百分比及累计百分数。
FREQ过程中可包含任意多个TABLES语句
若没有TABLES语句,则生成输入数据集中每个变量的单向频数表tables(abc)*d;等价于tablesa*db*dc*d;多项表由多个变量用星号连接产生如tablesx1*x2*x3;简洁表示形式:tablesa—d;等价于tablesabcd;tables(ab)*(cd);等价于tablesa*ca*db*cb*d;tablesa*(bc);等价于tablesa*ba*c;request-list:制表要求单向表由单个变量产生如tablesabc;双向交叉表用一个“*”
连接两个变量产生
如tablesa*b;</option-list>常见类型:(1)ALL:求所有由CHISQ,MEASURES和CMH选项给出的检验和度量;(2)CHISQ:要求对每层的齐性或独立性进行(3)CMH:计算Cochran-Mantel-Haenszel统计量,用于2维以上表检验行、列变量的相关。(4)EXACT:对于大于2×2维表进行Fisher精确检验。(5)MEASURES:计算相关度量和它们的渐进标准差。(6)ALPHA=P值:OUT=sas-data-set:规定输出数据集的名字output-statistic-list:输出统计量列表可用的统计量是有PROCFREQ产生的关于双向交叉表的统计量及概括性统计量。(2)WEIGHTvariable:每个观测对频数为对应权数变量的值。(3)OUTPUT语句:一般格式:OUTPUT<OUT=sas-data-set><output-statistic-list>;创建一个包含有PROCFREQ计算的统计量的SAS数据集。nocolnorow要求不输出行、列百分比应用举例例7.1广告是否会显著影响消费者的购买意向dataads;inputad$plan$number;cards;看过已买60看过打算买33看过没打算买7没看过已买25没看过打算买40没看过没打算买35;procfreq;tablesad*plan/chisqnocolnorow;weightnumber;run;输出1按是否看过广告和购买意向分组的消费者分布情况由卡方统计量,似然比卡方,以及M-H卡方统计量值对应概率都小于0.05,从而在0.05的显著性水平下有行列不独立,即广告对消费者的购买意向有显著影响。输出2广告是否会显著影响消费者购买意向检验结果
且由Phi系数、Cramer的V系数为0.4108,列联系数为0.38可知这种影响是正向的,即看过广告的消费者更可能购买。例7.2顾客年龄段对首先去的商场的影响
dataclient;doi=1to3;doj=1to3;inputf@@;output;end;end;cards;807045918615413810;run;procfreq;weightf;tablesi*j/expectedchisqnocolnorownopercentexact;run;其中用i=1,2,3分别表示顾客的年龄段为≤30,31~50,>51;用j=1,2,3分别表示顾客首先去的商场为商场1,商场2,商场3。
)例7.2顾客年龄段对首先去的商场的影响
dataclient;doi=1to3;doj=1to3;inputf@@;output;end;end;cards;807045918615413810;run;procfreq;weightf;tablesi*j/expectedchisqnocolnorownopercentexact;run;Expected要求给出期望频数Chisq
进行卡方检验Exact
进行Fisher精确检验Norow,nocol,nopercent
不要求输出行、列及累计百分比输出7.2(A)顾客年龄和首选商场分布情况由卡方统计量,似然比卡方,以及M-H卡方统计量值对应概率都小于0.05,从而在0.05的显著性水平下有行列不独立,即不同年龄段顾客对商场是有选择的。Fisher精确检验也说明了这一点(双侧检验的P值8.333E-04远小于0.05)。输出7.2(B)顾客年龄段是否会显著影响首选商场检验结果由于顾客年龄段和商场编号都是有序变量,故可利用Gamma(-0.1481)、Tau-b(-0.0930)、Tau-c(-0.0870)和Spearman(-0.1024)等级相关系数计算两者之间的关系,以上数值都是负的,表明两变量之间的关系是负相关的,即随着年龄的增大,会更倾向选择序号低的商场。输出7.2(C)顾客年龄段与商场编号之间的相关系数下表记录了某公司过去3个月中的顾客信息,包括顾客的性别、月收入、消费水平。试根据此表完成以下工作:(1)检验顾客月收入的高低是否显著影响顾客的消费水平,给出两者之间的关联系数;(2)以性别作为分层变量生成消费水平与顾客月收入之间的双向交叉表,并分析比较男女顾客收入高低人群的购买行为。表见P253例7.3顾客年龄段是否会显著影响首选商场检验结果datacustomer;inputincomepurchasesex$number@@;cards;00m3500f5501m801f3410m5810f4011m1511f3120m3720f4421m3821f36;procfreq;tablespurchase*income/chisqmeasurenorownocolnopercent;tablessex*income*purchase/chisqexpectednorownocol;weightnumber;run;Income收入,0,1,2分别代表低收入、中等收入和高收入Purchase消费水平,0,1分别代表消费额低于300元和消费额高于300元及以上tablespurchase*income/chisqmeasurenorownocolnope
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026河南新乡牧野区消防救援局招录政府专职消防员10人备考题库含答案详解(培优b卷)
- 2026中国安能一局辽宁公司校园招聘30人备考题库含答案详解(预热题)
- 2026青海黄南藏族自治州藏医院招聘5人备考题库附答案详解(巩固)
- 2026湖北十堰市房县风雅演艺有限公司演职人员招聘20人备考题库完整参考答案详解
- 2026广东惠州惠城区横沥镇大岚卫生院招聘村卫生站工作人员1人备考题库附答案详解(a卷)
- 2026广东肇庆市卫生健康系统事业单位招聘医护人员93人备考题库含答案详解(培优b卷)
- 2026浙江温州市苍南县人才发展有限公司招聘市场化工作人员1人备考题库含答案详解(研优卷)
- 2026青岛海洋文旅产业集团有限公司招聘24人备考题库及答案详解(历年真题)
- 2026浙江台州市荣远客运有限公司招聘备考题库有完整答案详解
- 2026福建漳州高新区区属国有企业招聘工作人员48人备考题库及答案详解(名校卷)
- 市政照明施工专项施工方案
- 光伏发电工程建设标准工艺手册(2023版)
- 广东省惠州市2025届高三化学下学期一模试题【含答案】
- 2025至2030电子束曝光系统(EBL)行业项目调研及市场前景预测评估报告
- 辽宁党校研究生法学考试真题(附答案)
- GB/T 20165-2025稀土抛光粉
- 国家药品监督管理局医疗器械技术审评检查长三角分中心2024年度公开招聘笔试备考题库及答案详解一套
- 小型光伏发电并网系统的设计与实现
- 学堂在线 唐宋词鉴赏 期末考试答案
- 中国移动集成公司招聘笔试题库2025
- 2024年贵州高考思想政治试卷试题及答案解析(精校打印)
评论
0/150
提交评论