第四章概括幷描述数值数据.ppt_第1页
第四章概括幷描述数值数据.ppt_第2页
第四章概括幷描述数值数据.ppt_第3页
第四章概括幷描述数值数据.ppt_第4页
第四章概括幷描述数值数据.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计学,第四章数据分布特征的测度Summarizing&DescribingNumericalData,学习目标LearningObjectives,1.解释数值数据的特征ExplainNumericalDataProperties2.综合度量描述DescribeSummaryMeasures集中趋势CentralTendency变异程度Variation分布形状Shape3.数值数据的综合度量分析,数值数据的特征和度量Properties&Measures,数值数据的,特征,均值,中位数,众数,值域中点,中轴数,集中趋势,全距,四分位间距,方差,标准差,变异系数,变异程度,偏态,分布形状,均值(平均数)Mean,1.用于度量数据的集中趋势(CentralTendency)2.是最常见的集中趋势的度量3.如同平衡点(BalancePoint)4.易受极端数值(ExtremeValues)影响5.公式(样本均值)(SampleMean),X,X,n,X,X,X,n,i,i,n,n,1,1,2,.,中位数Median,1.用于度量数据的集中趋势(CentralTendency)2.为排序序列的中间值(InOrderedSequence)如果n是奇数,即为序列的中间值如果n是偶数,则为两个中间值的均值3.中位数在序列中的位置4.不受极值的影响,定位点,n,1,2,众数Mode,1.用于度量数据的集中趋势CentralTendency2.为出现次数最多的数值ValueThatoccursMostOften3.不受极值的影响4.可能会出现没有众数或多个众数的情形5.对数值数据和类型数据均适用,值域中点Midrange,1.用于度量数据的集中趋势(CentralTendency)2.是最小和最大观测值的中点3.易受极值影响AffectedbyExtremeValues,值域中点,X,X,最小值,最大值,2,四分位数Quartiles,1.用于度量数据的非集中趋势MeasureofNoncentralTendency2.把排序数据等分为四个区间Quarters3.第i个四分位数的位置,25%,25%,25%,25%,Q1,Q2,Q3,定位点,Q,i,(n,i,1),4,中轴数Midhinge,1.用于度量数据的集中趋势(CentralTendency)2.是第一和第三四分位数的中点3.不受极值的影响NotAffectedbyExtremeValues,中轴数,Q,Q,1,3,2,思考题,你是Prudential-Bache证券公司的金融分析员。你已经收集了新发行股票的下列收盘价:17,16,21,18,13,16,12,11.试描述股票价格的集中趋势,集中趋势题解,均值(Mean),X,X,n,X,X,X,i,i,n,1,1,2,8,8,17,16,21,18,13,16,12,11,8,15,5,.,.,集中趋势题解,中位数(Median)原始数据:1716211813161211排序之后:1112131616171821位置:12345678,定位点,中位数,n,1,2,8,1,2,4,5,16,16,2,16,.,集中趋势题解,众数(Mode)原始数据:1716211813161211排序之后:1112131616171821值域中点(Midrange),值域中点,X,X,最小值,最大值,2,11,21,2,16,Q1原始数据:1716211813161211排序之后:1112131616171821位置:12345678,集中趋势题解,Q,位置,Q,1,1,1),4,1,(8,1),4,2,5,12,1,(n,.2,2,集中趋势题解,Q3原始数据:1716211813161211排序之后:1112131616171821位置:12345678,Q,位置,Q,3,3,1),4,3,(8,1),4,6,75,7,18,3,(n,.,集中趋势题解,中轴数(Midhinge)原始数据:1716211813161211排序之后:1112131616171821位置:12345678,中轴数,Q,Q,1,3,2,12,18,2,15,数值数据的特征和度量,数值数据,的特征,均值,中位数,众数,值域中点,中轴数,集中趋势,全距,四分位间距,方差,标准差,变异系数,变异程度,偏态,分布形状,全距(极差)Range,1.度量数据的离散程度MeasureofDispersion2.最大和最小观测值之差3.不考虑数据是如何分布的,全距,X,X,最小值,最大值,7,8,9,10,7,8,9,10,四分位间距InterquartileRange,1.度量数据的离散程度MeasureofDispersion2.也称为伸展中心Midspread3.为第三和第一四分位数之差4.此间距包括中间50%的数据5.不受极值影响,四分位间距,Q,Q,3,1,方差和标准差Variance&StandardDeviation,1.度量数据的离散程度MeasuresofDispersion2.是最为常见的度量3.考虑数据是如何分布的4.表现了相对于均值(或者)的变异,4,6,8,10,12,X,=8.3,样本方差公式SampleVarianceFormula,分母是(n-1)!(如果是总体方差就用N),S,(X,X),n,(X,X),(X,X),(X,X),n,i,i,n,n,2,2,1,1,2,2,2,2,1,1,.,样本标准差公式SampleStandardDeviation,S,S,(X,X),n,(X,X),(X,X),(X,X),n,i,i,n,n,2,2,1,1,2,2,2,2,1,1,.,变异系数CoefficientofVariation,1.度量相对离散程度(MeasureofRelativeDispersion)2.总是一个百分比3.表现了相对于均值的变异4.用来比较两组或更多组数据5.公式(样本),思考题ThinkingChallenge,你是Prudential-Bache证券公司的金融分析员.你已经收集了新发行股票的下列收盘价:17,16,21,18,13,16,12,11.描述股票价格的不稳定性(volatility).,变异程度题解VariationSolution,全距和四分位间距(Range&InterquartileRange)原始数据:1716211813161211排序之后:1112131616171821位置:12345678,四分位间距,Q,Q,3,1,18,12,6,全距,X,X,最大值,最小值,21,11,10,变异程度题解,样本方差(SampleVariance)原始数据:1716211813161211,S,(X,X),n,X,X,n,S,i,i,n,i,i,n,2,2,1,1,2,2,2,2,1,15,5,(17,15,5),(16,15,5),(11,15,5),8,1,11,14,其中,.,.,.,.,.,.,变异程度题解,样本标准差(SampleStandardDeviation)变异系数(CoefficientofVariation),S,S,(X,X),n,i,i,n,2,2,1,1,11,14,3,34,.,.,数值数据的特征和度量Properties&Measures,数值数据,的特征,均值,中位数,众数,值域中点,中轴数,集中趋势,全距,四分位间距,方差,标准差,变异系数,变异程度,偏态,分布形状,形状Shape,1.表明数据是如何分布的HowDataAreDistributed?2.形状的度量MeasuresofShape偏态与对称Skewvs.Symmetry,右偏的,左偏的,对称的,均值,=,中位数,=,众数,均值,中位数,众数,众数,中位数,均值,探测性数据分析ExploratoryDataAnalysis,筛选原始数据的技术:TechniquestoScreenRawData1.检查关于形状的假设Assumptions2.确定数据中的极端值的位置LocateOutliersintheData使用盒须图Box-and-WhiskerPlot,盒须图Box-and-WhiskerPlot,用5个度量值概括表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论