




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
调查统计与分析技术
——《广告调查》附加部分0713111内容梗概市场调查与统计分析市场调查业务中的统计问题统计分析技术的重要作用基础统计原理基本概念统计分析的基本思路常用统计分析方法描述性统计方法推断性统计方法市场调查与统计分析调研流程中的统计分析技术确定调研目的生成调研计划选择调研方法确定抽样程序收集整理数据分析信息撰写报告提案1.为什么要抽样?2.确定怎样的抽样方案?3.选择哪一种调研方法?4.使用怎样调研工具?5.问卷的信度与效度如何?
6.数据如何整理分析?7.如何解读数据?
8.怎样做出正确的研究判断?市场调查与统计分析市场调查常见的研究主题——b.比较经常遇到的问题实质方法
A品牌在北京和上海的市场占有率是否相当?两个总体是否一致的问题利用样本差进行均值比较
A广告与B广告是否一样受欢迎?
A、B、C三位广告代言人的代言效果一样好吗?n个总体是否一致的问题单因素或多因素的方差分析数据描述基础上的进一步分析处理市场调查与统计分析市场调查常见的研究主题——c.影响经常遇到的问题实质方法
A歌手的粉丝年龄分布与演唱会出票情况是否存在关联?两个因素之间是否存在关系的问题交互分析,用卡方检验值进行判断
A品牌的广告投放量变化是如何影响它的市场占有率的?一个因素是否影响量一个因素的问题回归分析,用β值进行检验促销和广告之间的效果是如何相互影响的?两个因素间的相互影响的问题相关分析,用相关系数进行判断数据描述基础上的推断统计处理市场调查与统计分析市场调查常见的研究主题——d.综合分析LeaderChallengerFollowerProfessional洗发水市场中有海飞丝、潘婷、飘柔、力士、清扬、舒蕾、蜂花-------多个品牌,影响这些品牌的市场地位的指标包括:产值利润科技含量生产设备研发水平广告代理商销售渠道促销力度******贡献率较高的指标效益潜力营销因子分析以因子分析的结果为依据进行聚类分析,便可将多个品牌进行综合分类市场调查与统计分析统计分析的重要作用为调研方法的选择提供依据科学指导调研流程正确解读纷繁复杂的数据深入挖掘数据背后的意义准确预测和评价基础统计原理——基本概念频数表与直方图数据通常有三种表现形态:
0-1型数据:又叫开关变量,如:性别、婚否、购买经验等;离散型数据:多为定类、定序变量,数据编码间没有任一中间值,如:职业、学历、使用过的品牌等;连续型数据:多为高级别变量,数据的原始形态是连续的,全距中的任一值都是合理的,如:年龄、身高、收看电视的时间等。频数表与直方图适用于将杂乱的数据进行整理和分类直方图是标示频数分布的常用工具,还包括饼图、雷达图、气泡图、折线图等
处理0-1型数据时最适合使用饼图定类、变序的离散型数据适用分散性柱形图连续性数据分组处理后适用接连性柱形图或折线图,未分组处理可用曲线图基础统计原理——基本概念图1:研究对象的学历分布基础统计原理——基本概念valuerange(cm)valuerangelabelmeansofrangefrequencyf/n(%)154-1601157126.0160-16621634522.516651720178-1845181168.0184-190618763.0
确定数据的范围并决定分组数时应考虑数据单元与研究对象间的具体关系;组中值有助于描述分布的中心和形状;各组的上下限应明确规定,以免重复计算频数;组距不一定要完全相等,应根据不同的变量属性调整,如:收入;f/n是相对频率。基础统计原理——基本概念图2:研究对象的身高分布基础统计原理——基本概念分布的中心众数(mode):
在频数表整理后次数出现最多的变量值(连续性数据分组后即为组中值),分析过程中常取变量标签代替;最不稳定的描述分布中心的指标,有时不存在(平均分布)、有时不唯一(出现多个高点)、变量命名方式也会影响众数;但可用于各级别变量,且无须计算。中位数(median):第50百分位点上的数,用于连续型数据,故此不常用。均值(mean):易受极端值影响(去掉一个最高分,去掉一个最低分------)基础统计原理——基本概念均值(mean):用于定距变量、定比变量X=1/n∑X离散型数据
X≈1/n∑x·f
X≈∑x·(f/n)连续型数据
组中值身高分布的中心:X≈(157×0.06+163×0.225+169---------+187×0.03)=X
≈(157×12+163×45+169---------+187×6)/200=基础统计原理——基本概念valuerangefrequency16-19岁4620-24岁6625-29岁7930-34岁10635-39岁9540-44岁6645-49岁4950-60岁93习题1:左表是某次调研对象的年龄分布,请计算众数、均值,并绘制直方图。基础统计原理——基本概念分布的形状以上三张图反映的信息包括:样本量相同:n1=n2=n3
他们的均值(分布中心)相同:mean1=mean2=mean3=50他们分布的形状完全不同:其中1最集中,3最分散,1、2是对称分布,3是不规则分布
40
50
60
30
40
50
60
70
20
40
60
80
901.2.3.基础统计原理——基本概念分布的形状极差(R):数据的全距;四分位间距(IQR):IQR=高四分位数—低四分位数方差和标准差(S2&S):原始数据公式S2=∑(X-X)2n-1以上三项指标都可以反映数据的分布形状,他们的解读方法也相同,即:值越大,分布越分散。∑(X-X)2·fn-1分组数据公式S2≈(X是组中值)基础统计原理——基本概念valuerangefrequency16-19岁4620-24岁6625-29岁7930-34岁10635-39岁9540-44岁6645-49岁4950-60岁93习题2:下表是某次调研对象的年龄分布,请计算极差、方差和标准差。组中值XX-X(X-X)2(X-X)2·f17.5-18.31335.2615421.7822-13.81190.7212587.2627-8.8177.626131.6732-3.8114.521538.71371.191.42134.53426.1938.322528.864711.19125.226135.595519.19368.2634247.82S2=78726.22/599
=131.43S=11.46基础统计原理——基本概念概率分布随机地掷一个色子各面数值投掷10次投掷20次的f/n投掷100次的f/n投掷∞次的f/n频次f相对频率f/n111/102/2010/1001/6211/104/2012/1001/6333/103/2022/1001/6422/107/2015/1001/6522/103/2017/1001/6611/101/2024/1001/6基础统计原理——基本概念
使用二项分布概率公式Pr(X=k)=Cn×πk
×(1-π)n-k(
π=成功的概率;k=0,1,2…n)
1
杨辉三角是求解Cn的简易方法
1
1
1
2
1
二项系数=
1
3
3
1
1
4
6
4
11
5
10
10
5
1kkn(n-1)(n-2)…(n-k+1)k(k-1)(k-2)…1
X=k=0,1,2,3;π=1/2XP(X)01/813/823/831/8习题3:假定购买农夫果园的消费者中男女性别比例为3:7,现在随机抽取三位消费者,设随机变量X=样本中的女性观察量,求X的概率分布并画出分布图。基础统计原理——基本概念习题3:假定购买农夫果园的消费者中男女性别比例为3:7,现在随机抽取三位消费者,设随机变量X=样本中的女性观察量,求X的概率分布并画出分布图。基础统计原理——基本概念
X=k=0,1,2,3;π=0.7;1-π=0.3∴XP(X)00.02710.18920.44130.343基础统计原理——基本概念
X=k=0,1,2,3,4,5,6;π=0.6;1-π=0.4∴Pr(X≥3)=Pr(X=3)+Pr(X=4)+Pr(X=5)+Pr(X=6)=0.8208虽然总体中有超过60%的观众对该片持有肯定的态度,但在小样本的随机抽样中仍有近18%的可能会抽到否定意见居多的观众代表群,因此,在议程控制上应注意:准备充足的问题;注意会场气氛;必要时应采用转移话题、研讨具体细节、穿插游戏等方法,积极正面的引导双方良性交流,保护双方利益与情感.XP(X)00.004110.036920.138230.276540.311050.186660.0467
X=k=5,6,7,8,9,10;甲:π=0.2;1-π=0.8;乙:π=0.5;1-π=0.5∴Pr(X甲≥5)=0.0328Pr(X乙≥5)=0.6230
连续型数据的概率分布问题基础统计原理——基本概念例:某次调查中上海地区18-25岁男性青年的身高(154-194厘米)的原始数据未收集,如果在数据处理的过程将组距定为10厘米,则数据被分为4组,若以5厘米为一组,则分为8组,若以1厘米为一组,则被分为40组,如此细分下去,柱型图将可拟合为曲线图,若此项指标抽样未见异常,则应近似的符合正态分布。不同的近似正态连续分布会形成不同的线形,缺乏可比性,为计算带来不便,因此,首先模拟一条标准正态分布,然后将一般正态分布换算成标准正态分布计算即可。基础统计原理——基本概念这是一个分布中心为0,离散水平为1的拟合的标准正态分布,也叫Z分布。随机变量Z的值是离开均值的标准差的倍数。以Z=1.4为例,即表示该点在在数轴上处于平衡点μ的右侧,而且与平衡点的距离正好等于总体标准差σ的
1.4倍。μ=0
σ=1介绍使用标准正态分布右侧尾部积累概率表习题6:请运用标准正态概率表计算以下题目:
Pr(Z>1.96)=
Pr(Z<-1.96)=
Pr(-1.96<Z<1.96)=
Pr(1.64<Z<1.96)=
Pr(-1.0<Z<1.5)=Pr(0<Z<2)=基础统计原理——基本概念基础统计原理——基本概念习题6:请运用标准正态概率表计算以下题目:
Pr(Z>1.96)=0.025
Pr(Z<-1.96)=0.025
Pr(-1.96<Z<1.96)=0.95
Pr(1.64<Z<1.96)=0.0255
Pr(-1.0<Z<1.5)=0.7745Pr(0<Z<2)=0.4772描述指标样本总体均值Xμ比例Pπ方差S2σ2标准差Sσ一般正态分布向标准正态分布的转换习题7:如果家乐福内每一位顾客的平均购物时间近似的服从μ=60分钟,标准差σ=7分钟的正态分布,那么该卖场中购物时间超过74分钟的顾客比例是多少?习题8:再次假定家乐福的顾客每次平均消费近似的服从μ=175元,标准差σ=35元的正态分布,求花费在下列范围的消费者的比例是多少?超过220元;少于150元;
VIP(超过300元);家乐福将在近期调整VIP的会员条件,按新一年的物价水平和薪资水平核算,向15%的高消费者让利5%是可以保证盈利的促销手段,那么,单次消费的底限是多少钱?
基础统计原理——基本概念抽样分布基础统计原理——基本概念以班上的同学身高为例,如果将各位视作独立样本,即n=1,这时分布的形状相当分散,全距约为()厘米;如果我们将两个同学作为一个小组,那么n=2,用组内的均值作为样本值,这时的分布将不会那么分散,全距约为()厘米;如果我们将全班同学随机的分成两组,那么n=19,用组内均值作为样本值,则这种分布就会相当集中,甚至重合。蒙特卡洛法在一个总体中,X的波动相对大,但X的波动小;不管总体自身是否服从正态分布,其中的均值X的分布是渐进正态的;基础统计原理——基本概念样本均值X的抽样分布抽样分布的中心就是原总体的中心μ,也可以说成是:X的期望值=μ抽样分布的标准误差比原总体的标准差σ小,而且样本量越大,标准误差越小,表现为:X的标准误差抽样分布是趋于正态的样本均值抽样分布正态近似定理:在容量为n的非常简单随机样本中,样本均值X以的标准误差围绕着总体均值μ波动。随着n的增大,样本均值的分布也就围绕其目标μ波动的越来越小,它也就越来越接近于正态。例:上海市民的个人年收入近似的服从正态分布,其均值是13100元,标准差为8750元,求:随机的抽取一人,其收入超过18430元的概率;随机的抽取一个含有10人的样本,求其平均收入超过18430元的概率。基础统计原理——基本概念样本比例P的抽样分布抽样分布的中心就是原总体的中心π,也可以说成是:P的期望值=π抽样分布的标准误差比原总体的标准差σ小,而且样本量越大,标准误差越小,表现为:P的标准误差抽样分布是趋于正态的样本比例抽样分布正态近似定理:在容量为n的非常简单随机样本中,样本比例P以的标准误差围绕着总体均值π波动。随着n的增大,样本均值的分布也就围绕其目标π波动的越来越小,它也就越来越接近于正态。一般正态分布向标准正态分布的转换一般抽样分布向标准正态分布的转换习题9:北京奥运村所使用的电梯是按照极限负重1000公斤设计的,声称可以容纳13人,假定利用该电梯的游泳运动员楼的运动员们的平均体重为70公斤,标准差为12公斤,那么一个13人的随机样本的重量超标的概率是多少?习题10:上海新生儿男女性别比例相当,但就每天的具体情况而言,确实容易让人产生性别偏斜的感觉,在3月8日出生的前10个婴儿中,男孩等于或大于7的机会是多少?可以用二项分布准确的回答;也可以用正态近似定理;使用连续性修正。基础统计原理——基本概念基础统计原理——基本概念变量及测量等级频数表与直方图分布的中心众数中位数均值分布的形状极差四分位间距方差和标准差概率分布二项分布标准正态分布一般正态分布抽样分布蒙特卡洛法样本均值的抽样分布样本比例的抽样分布正态近似定理基础统计原理——基本思路置信区间与假设检验是统计分析过程中最为根本的基础性思路,主要表现为:置信区间接受在由样本推知总体时的误差;采用一个区间去标明这种误差;置信区间的大小受到样本量和置信水平的影响;有关总体的结论应该表现为区间的形式。总体样本一般特殊演绎样本总体特殊一般归纳大概或者也许是,不过我们不敢说,可是学校总以为,恐怕仿佛不见得。要想把某声明表达得更有把握,就必须使其更含混不明确。凡人皆死,张三人,张三死。凡天鹅皆白。总体均值μ的置信区间
μ=X±(一个小的误差)
μ=X±Zα/2·SE基础统计原理——基本思路α即错误水平,1-α就是置信度
μ是常数,变化的是样本分布的中心,变化的幅度是2Zα/2·SE;
n越大,变化的幅度就越小,误差范围也就越小;错误水平降低,置信度就增高,误差范围随之扩大。在抽样调研中,总体指标是不可能得到的,所有有关总体的指标必须用样本指标进行估算,这样必然加大误差的范围,因此,总体均值的置信区间公式也要相应作出调整,将Z分布值用t分布值代替,从而建立一个更为合理的描述总体指标的区间。μ=X±tα/2·SE
练习查t分布的临界值点表,并与Z分布表的结果进行比对例:当样本量n=6的时候,Z0.025与t0.025的结果分别是多少?当样本量n=60的时候,Z0.025与t0.025的结果分别是多少?总体比例π的置信区间π=P±(一个小的误差)
π=P±Zα/2·SE
π=P±tα/2·SE基础统计原理——基本思路两个总体均值之差(μ1-μ2)的置信区间比较两个总体通常是估计他们的差μ1-μ2,而样本均值之差是一个合理的估计量d·f=(n1-1)+(n2-1)两个总体比例之差(π1-π2)的置信区间比较两个总体通常是估计他们的差π1-π2,而样本比例之差是一个合理的估计量d·f=(n1-1)+(n2-1)基础统计原理——基本思路习题11:2007年度《舞林大会》在举办期间曾在某居民点随机抽取5位居民,他们对该栏目的评分分别是:65,70,85,80,75,
2008年度《舞林大会》作出一定程度的内容与形式的调整,改版后从另一个居民点随机抽取了6位居民,他们对该栏目的评分分别是:70,75,80,85,85,85。计算(μ1-μ2)的95%置信区间,并分析这个结果。基础统计原理——基本思路习题12:在某次广告文案的专题研究中,研究者首先就下面的问题征询了全球1650名雅诗兰黛的用户的意见,“在使用该产品三个月后,我的色斑明显改善”一周之后,又调查了另外一个含有1650名用户的独立样本,问题同上,只是措辞改称“在使用该产品三个月后,我的色斑淡了很多”,结果如下:表态的人中赞成比例(π1-π2)的95%置信区间是多少?要想了解消费者的真实态度,用那种措辞更好?基础统计原理——基本思路反应措辞赞成反对不表态明显改善46%39%15%淡了很多41%49%10%配对样本基础统计原理——基本思路例:减肥训练班中的5位学员,训练前的体重为(单位:斤):
130,152,120,143,135,经过一周的训练,体重分别为:
120,152,111,132,130。计算训练期间所减少的平均体重的
95%置信区间。X1X2D=X1-X2D-D(D-D)213012010391521520-749120111924143132114161351305-24D=35/5=7习题13:为了研究M-Zone广告代言人的促销效果,从上海市区中随机的抽取了n=25个售卡摊点,调查了代言广告播出前后的100元面值的日销量,数据如下:求:代言前后平均日销量变化的95%置信区间。基础统计原理——基本思路代言前223716341634812代言后233319151817332415代言前817810121243425代言后18239132333435316代言前86651222代言后1567815813基础统计原理——基本思路假设检验
所谓统计上的假设,是关于总体的某个描述或判断,他是可以通过抽取随机样本来进行检验的;假设检验的两种基本方法:利用置信区间进行假设检验陈述原假设H0,也叫零假设:在特定的置信度下,研究的总体无变化/两个总体无区别--------构造相应的置信区间考查原假设在置信区间中的位置得出结论:接收原假设/拒绝原假设
利用概值进行假设检验同上计算相应的样本指标利用t统计量得出总体概率根据概值得出结论:接收原假设/拒绝原假设基础统计原理——基本思路例:减肥训练班中的5位学员,训练前的体重为(单位:斤):
130,152,120,143,135,经过一周的训练,体重分别为:
120,152,111,132,130。计算训练期间所减少的平均体重的
95%置信区间。X1X2D=X1-X2D-D(D-D)213012010391521520-749120111924143132114161351305-24D=35/5=7在d·f=4的前提下,t=3.46,概值P<0.01,原假设成立的可能性太小,因此要拒绝原假设,即确认减肥训练班的效果。常用统计分析方法描述性统计分析分布的中心:众数、均值、中位数分布的形状:极差、方差、标准差、四分位间距概率分布:二项分布的概率问题、标准正态分布、连续型数据的一般正态分布向标准正态分布的转换抽样分布:样本均值的抽样分布近似正态定理样本比例的抽样分布近似正态定理推断性统计分析——假设检验的思路、置信区间和概值的检验方法两个样本是否来自同一总体——两个样本之差n个样本是否来自同一总体——方差分析变量间的相互关系与影响程度——交互分析、相关分析、回归分析综合变量分析:主成分分析、聚类分析、因子分析常用统计分析方法——方差分析单因素的方差分析例:某次调查,在上海工程技术大学采用整群抽样的方法抽取了管理学院的n1=20,艺术学院的n2=20,材料学院的n3=20名样本,对北京奥运会的预期评分的均值分别为:X1=90,X2=84,X3=95,这是否能说明三个学院的学生对北京奥运会的预期效果有不同的认识呢?我们需要考虑的问题是:
这三个学院总体间的数据差别是真实存在还是仅只反映在这次随机抽样中;样本内的波动更大还是样本间的波动更大;如果样本内的波动更大,则不能表明三个样本间的区别。方差分析的步骤将抽取出的样本之间的区别定义为组间变差,考察组间变差的波动将各组的样本内部的区别定义为组内变差,考察组内变差的波动计算F比值通过F比值检验原假设查F分布表,分子方差的自由度(c-1);分母方差的自由度c(n-1)常用统计分析方法——方差分析常用统计分析方法——方差分析习题14:有关奥运福娃形象偏好的调查显示,三个不同年龄段的各六位中国孩子被要求为五个福娃分别打分(1-10),福娃整体形象由总分记,结果如下:6-12岁12-15岁15-18岁444645474541464444434542444343464143请就这些数据采用方差分析的方法检验原假设。常用统计分析方法——交互分析拟合优度的x2检验
交互分析用于研究两个变量之间是否相互独立,所依靠的检验方法叫卡方检验;拟合优度的卡方检验是一种最为简单的卡方检验手段,用于处理某些特别的研究主题;所谓拟合优度,就是研究这一数据与原假设之间一致的程度;其步骤如下:求H0为真时,发生在每一族的概率π;求H0为真时期望的频次fe;求观测频次f0与期望频次fe之间的偏差;求卡方统计量。观测频次概率期望频次偏差x2统计量f0πfe=nπf0-fe∑[(f0-fe)2/fe]常用统计分析方法——交互分析习题15:某福利彩票的摇奖办法士将刻有数码0-9的号球投入摇奖机,然后按照一定规则把摇出的数码组合而成对奖号码。某地将该奖项自开办以来的多期对奖号码进行了统计,数据如下,是否可以判断摇奖机在正常工作?在查卡方分布的临界值点的时候,df=n-1数码0
1
2
3
4
5
6
7
8
9
合计摇出的频次
21
28
37
36
31
45
30
37
33
52350常用统计分析方法——交互分析列联表与x2检验这是利用两个因素的交互列联表所进行的计算;其步骤如下:在给定的观测频次表中,计算两个边缘部分的总频次。在底部,还要进一步计算相对频率;用每一个相对频率依次去乘右边的总频次那一列,从而得到期望频次的对应列;最后利用x2统计量将观测频次和期望频次相比较,得:C为列数,r为行数,自由度df=(c-1)(r-1)常用统计分析方法——交互分析习题16:上海某次婚姻家庭调查中有这样一道题目:您认为是否可以同时和几个人谈恋爱?1、可以;2、说不上;3、不可以。请用交互分析的方法检验如下几个年龄段的民众在该问题上的独立性。年龄段频次答案18-35青年35-50中年50-65老年可以114155说不上122185不可以77422686常用统计分析方法——交互分析习题17:某次街头拦截式调查共访问了2000名消费者,将问卷中的q1和q3进行交互,数据如下:q1:请问您最近一个月是否吃过麦当劳的麦辣鸡翅?q3:请问您最近一个月是否看过麦当劳麦辣鸡翅的电视广告?以上数据说明什么?吃过吗?看过吗?吃过没吃过看过11415没看过12218常用统计分析方法——回归分析
在实践中,我们常常想要研究两个或两个以上变量之间的关系,但交互分析无法衡量变量间相互关联的程度,也无法区别关联水平的高低,因此,需要一种更明确的研究方法。简单的线性回归例:某次街头随机调研的研究对象是22-35岁上海青年的手提电脑的使用情况,通过交互分析发现,收入和教育程度两个人口变量都与是否拥有手提电脑有关,如何才能判断到底哪个因素对于手提电脑产品的推广更有价值?常用统计分析方法——回归分析采用最小二乘法拟和回归直线:y=a+bx最小二乘公式:X-X=xY-Y=y最小二乘准则:当所采收的样本呈现某种近似线性的趋势时,既可考虑采用此准则;用样本点拟合一条直线,让所有偏差都尽可能的小;为解决正负抵消的问题,即将偏差平方和降至最低。常用统计分析方法——回归分析习题18:康师傅方便面在华北地区的九个重要城市开展了一次促销广告回馈率的研究,结果显示,促销广告在一个地区的暴露水平的高低似乎与消费者的回馈率呈正比,拟合一条回归直线说明该结论。城市编号123456789促销广告的暴露指数X8.36.43.43.82.611.61.22.51.6消费者的回馈率(每万人)210180130170130210120150140常用统计分析方法——回归分析回归模型就像所有的样本推知总体时所遇到的问题一样,采用最小二乘法拟和的回归直线y=a+bx在什么样的程度上可以有效地描述总体呢?斜率b是总体的必然体现,还是一次随机抽样导致的呢?例:根据国际惯例,家庭月收入Y和选择金融产品X(单位:百元)的真实关系是:Y=300+6X(40≤X≤100),使用蒙特卡洛法,计算两组样本值,注意观察和理解样本与总体间的区别。回归模型的基本假定:所有的Y分布都有近似的形状;所有的Y分布的均质都正好在一条直线上;回归模型μi=α+βXi;随机变量Y=μ+E(E是由测量误差和不可避免的固有变化量共同构成)具体记作:Yi=μi+eσ常用统计分析方法——回归分析根据总体回归直线绘图;通过随机数字表查出两组e值;根据μi=α+βXi求出五个μ值;根据Yi=μi+eσ求出五个Y值;1.2-0.41.30.5-1.70.50.12.5-0.3-0.1常用统计分析方法——回归分析样本斜率的抽样分布定理
估计值b近似的服从正态分布
b的期望值=β
b的标准误差其中的x=X-X减少SE从而得到更精确地估计量的方法是:减少σ;增大样本量;增大x的标准差,即加大X值的变化范围,这是可以由调研者决定的。常用统计分析方法——回归分析总体斜率的置信区间和假设检验估计b的标准误差,抽样调研时必须用样本值替代总体值转化之后的公式形态,其中β的置信区间概值检验即:假设检验的方法不变。常用统计分析方法——回归分析习题19:针对大学毕业三年的4位学生的一个随机样本的月收入与月花费调查显示如下表(单位:千元),拟合一条样本的回归直线,构造β的95%置信区间,画图表示并用t值检验。样本编号1234月收入4.87.28.59.5月花费1.23.03.53.5常用统计分析方法——相关分析简单积距相关样本相关系数rr的直观意义总体相关系数ρ的检验:图解法t检验df=n-2习题20:华东地区的六个城市的一个随机样本数据如下,其中X=每年该市香烟的消耗量,Y=每年每十万人中死于肺癌的人数,求r,ρ的95%置信区间,并用t值检验。城市武汉合肥杭州南京上海苏州X340026002200240029002100Y242017192620常用统计分析方法——相关分析相关与回归的关系如此密切的联系使得b与r中有一方为0,另一方也跟着为0;检验β=0和ρ=0时考察“X与Y之间没有线性联系”的等价方法。常用统计分析方法——相关分析应用于相关、回归的的方差分析例:四周的一个投放周期内,产品的销售量的均值为Y均,某一特定时间的销售量为观测值Y,已知广告投放量与销售量间存在某种线性关系y=a+bx,通过广告投放量可以计算出对应的Ye,三者间的关系为:
Y均y=a+bxY-Y均Y-YeYe-Y均(Y-Y均)=(Y-Ye)+(Ye-Y均)总偏差=不可解释的方差+可解释的方差常用统计分析方法——相关分析应用于相关、回归的的方差分析例:四周的一个投放周期内,产品的销售量的均值为Y均,某一特定时间的销售量为观测值Y,已知广告投放量与销售量间存在某种线性关系y=a+bx,通过广告投放量可以计算出对应的Ye,三者间的关系为:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业员工保密协议条款说明书
- 中级经济师复习全书及试题答案
- 网络平台运营管理与服务优化方案
- 公共关系与组织行为学的结合试题及答案
- 钻孔机器人设计关键技术解析
- 信息技术的应用与发展计划
- 秋季教学活动总体规划计划
- 图书技师考试试题及答案
- 素描十级考试试题及答案
- 面对挫折教育
- 七年级下册《一元一次不等式的应用》课件与练习
- 档案安全知识培训
- 建筑公司礼仪培训
- 美国跨境电商市场情况
- 2025年江苏无锡宜兴市国有资本投资控股集团有限公司招聘笔试参考题库附带答案详解
- 江苏省苏州市吴中、吴江、相城、高新区2024-2025学年七年级上学期期末阳光调研道法试卷(含答案)
- 2024-2030年中国检验检测行业发展潜力预测及投资战略研究报告
- 融资融券与投资者行为
- 装配式建筑深化设计-1.2.3 装配式建筑深化设计拆分原47课件讲解
- 2025年中考数学二轮专题复习 题型五-几何探究题
- 【MOOC】园林植物应用设计-北京林业大学 中国大学慕课MOOC答案
评论
0/150
提交评论