版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计数据的描述问题:莎士比亚的作品是否真的是莎士比亚写的?一般家庭有多少个孩子?男性的薪水是否一定比女性高?新娘和新郎在结婚时的年龄是多少?各种平均数平均数是一个数值,是对一个变量的观察值进行计算后得到的.我们常读到MBA的平均工资,平均房价,道琼斯平均价格,平均谋杀率等.你都理解这些平均数吗?让我们来看一下下面的句子:当代的平均人是女人,平均每个女人有2.1个孩子,且这些女人住在平均价值为$80000的住房中一、算术平均数㈠算术平均数的概念与用途㈡算术平均数的计算㈢算术平均数的数学性质Thisisthemostpopularandusefulmeasureofcentrallocation基本计算方法是各项数据之和与数据的个数之比。是集中趋势最主要的测度值。SumofthemeasurementsNumberofmeasurementsMean=PopulationmeanPopulationsize
Arithmeticmean算术平均数算术平均数:全部变量值之和与变量值个数相除所得的商。通常也称为平均数(average)或均值(mean)。算术平均数的概念与用途STAT算术平均数83名女生的身高变量一般水平、代表性数值分布的集中趋势、中心数值算术平均数一、算术平均数㈠算术平均数的概念与用途㈡算术平均数的计算㈢算术平均数的数学性质算术平均数的计算算术平均数=总体标志总量总体单位总数数据集数据个数N简单算术平均数“权”和"weight"的字义商务印书馆《古代汉语词典》1998.12版权:1.树名。2.秤锤,秤。3.称量。4.权力。5.权宜。6.副词,姑且。7.权摄,暂代官职。8.周列国名。9.通“颧”,面颊。牛津大学出版社《牛津现代高级英汉双解词典》1985Weight/n1.gravitationalforce引力,重力,地心吸力2.Howheavyathingis.重量3.Loadtobesupport负担4.importanceorinfluence重要,影响力5.pieceofmetalofknownweightusedinscalesforweighingthings秤锤6.systemforunits,scaleornotation,forexpressing计重法
vt1.放砝码於…上2.使负重担3.用矿物质处理(织物)使之显得更结实杆秤合称“权衡”,秤砣为权,秤杆为衡“权”的概念旨在刻画对有关假设的整个局面的知识的增长陈克艰《上帝怎样掷骰子》四川人民出版社,1987,54页秦权铜诏铁权秦秦量吴昌硕临秦权文字
身高组中值人数比重(cm)(cm)
(人)(%)
150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25
总计83100某年级83名女生身高资料组距数列次数f频率f/Σf变量值x加权算术平均数例题:二、交替标志的平均数在社会经济统计中,有时把社会经济现象的总体单位,分为具有某种标志的单位和不具有这种标志的单位两组。统计中,用“是”、“否”或“有”、“无”来表示的标志,称为交替标志,也称是非标志。交替标誌
Qualitativevariables-proportions
定性变量-比例Qualitativevariablesaresummarizedbyatableofproportionsorpercentages.Whiletherearetheconceptsoflocationandvariabilityforsuchvariables,therearenosinglenumbersummariesforthelocationandvariability.Generallythelocationissummarizedbygivingthepercentagesinthemostcommongroups.交替标誌or是非标誌分组单位数变量值具有某一属性不具有某一属性10合计—为研究是非标誌总体的数量特征,令指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫是非标誌交替标誌是非标誌总体的指标具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数指是非标誌总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数是非标誌总体的均值均值1.简单几何平均数几何平均数(又称“对数平均数”)计算时要进行对数变换,即:几何平均数(geomean(geomatricmean))是N
个变量值连乘积的N次方根。1601226莎士比亚的作品是否真的是莎士比亚写的?平均值6就用途而言,几何平均方法直接用于个体数量相乘等于总数量的现象的平均。分布的集中趋势、中心数值1582受极端值的影响较和小;162841变量值与中位数离差绝对值之和最小。在社会经济统计中,有时把社会经济现象的总体单位,分为具有某种标志的单位和不具有这种标志的单位两组。
就用途而言,几何平均方法直接用于个体数量相乘等于总数量的现象的平均。某产品的总合格率=各连续作业工序合格率之积若干年间总的1+利率(复利)=各年度1+利率之积第一道工序第二道工序全工序投入制品1000个900个1000个合格产品900个810个810个合格率%90908181%=90%90%向借款1000元,年利率(复利)为10%,则:第一年利息额100元,第二年利息额110元,两年合计210元。两年后还款本利和与借款额的比例为1.21。1.21=1.11.1例某机械厂有铸造车间、机加工车间、装配车间三个连续流水作业车间。本月份这三个车间产品合格率分别为95%、92%、90%,求平均车间产品合格率。解:这说明该厂车间产品平均合格率为92.31%2.加权几何平均数某笔的年利率是按复利计算的,25年的年利率分配是:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。本利率(%)X年数f本利率的对数lgXf·lgX10312.01282.012810542.02128.084810882.033416.2672110102.041420.414011522.06074.1214合计25-50.9002例这就是说,25年的平均本利率为108.6%,年平均利率即为8.6%。△几何平均数的特点如果数列中有一个标志值等于零或负值,就无法计算;受极端值的影响较和小;它适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。△几何平均数的特点如果数列中有一个标志值等于零或负值,就无法计算;受极端值的影响较和小;它适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。72法则计算翻一番需要的时间时,可以用72除以增长速度的数值,得到时期数比如,每年增长10%,则7.2年翻一番;每年增长3%,则24年翻一番1.1^7.2=1.991.03^24=2.03通常,年利率都是10以下,此法很准72法则同样还可以用来算贬值,设年通货膨胀率是8%,那么72/8=9,9年後你现在的一元钱就只能买五毛钱的东西了。以20天为週期对国际油价进行评估国际油价连续20天日均涨幅或跌幅超过4%,就应考虑对国内成品油价格进行调整1.04^20=2.190.96^20=0.44该准则意味着:在连续的20天之内,如果油价上涨超过1倍,或下跌了一半以上,就要考虑调整国内油价三、次序统计量(位置平均数)㈠众数㈡中位数㈢四分位数和百分位数众数(mode):出现次数最多即出现频率最高的变量值。身高人数(CM)(人)152115421552156415711582159216012161716281634身高人数(CM)(人)1643165816651673168716911705171217231741总计83152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174众数的确定方法某年级83名女生身高资料
身高人数(CM)(人)152115421552156415711582159216012161716281634
身高人数(CM)(人)1643165816651673168716911705171217231741总计83
身高人数比重(CM)(人)(%)150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25
总计83100某年级83名女生身高资料众数的确定方法概约众数:众数所在组的组中值,在本例为162.5cm众数的原理及应用83名女生身高原始数据83名女生身高组距数列
当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数。在数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。众数的原理及应用出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200413名学生出生时间分布直方图众数的原理及应用没有突出地集中在某个年份192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100众数的原理及应用413名学生的身高分布直方图出现了两个明显的分布中心413名学生身高分布条形图413名学生身高分布叠加线图STAT
在研究身高时,男生与女生不能合成一个总体,而是应当作为两个总体分别进行统计。
当数据分布呈现出双众数或多众数时,可以断定这些数据来源于不同的总体。众数的应用可以用来平均名词型变量:如性别变量只有两个值,男和女.在妇女比男子多.所以可以说平均人口是女人.一项对大学生的研究包括了10个心理学专业的学生,20个英语专业的学生和5个数学专业的学生.我们就无法计算这些专业的平均数的中位数,但我们可以指出众数是英语专业,因为它是出现频数最多的那个块专业.众数用来描述分类变量,特别是许多个值的分类变量.例如在某一特别的街区,宗教的众数是穆斯林,人种的众数是亚裔,而社会阶级的众数是”中上等”三、次序统计量(位置平均数)㈠众数㈡中位数㈢四分位数和百分位数
中位数(median):位于变量值序列中点的数值中位数中位数的确定方法对于未分组数据:中位数位置为某年级83名女生身高资料
身高人数累计(CM)(人)人数152111542315525156491571101582121592141601226161733162841163445
身高人数累计(CM)(人)人数
164348165856166561167364168771169172170577171279172382174183
总计83中位数的确定方法某年级83名女生身高资料中位数的作用及用法中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。566668920中位数为6中位数的作用及用法中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。566668920中位数为(6+6)/2=6中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。中位数的作用及用法中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。中位数的作用及用法中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。中位数的作用及用法中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。中位数的作用及用法中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。中位数的作用及用法
变量值34556910中位数5平均值6与中位数离差-2-100145与平均数离差-3-2-1-1034绝对数值之和1314中位数与累计次数分布在累计次数分布曲线上,纵轴上50%所对应的点,其横轴坐标就是中位数。结婚年龄中位数HK三、次序统计量(位置平均数)㈠众数㈡中位数㈢四分位数和百分位数(四)箱线图百分位数:提供了数据值如何在最小值至最大值之间分布的信息.对不含多个重复数值的数据来说,第P个百分数把数据分成两部分:大约P%的观察值小于第P个百分数;大约(100-P)%的观察值大于第P个百分数
四分位数(quartile
将数据等分为4部分)和百分位数(percentile将数据等分为100部分)。中位数也是一个分位数(二分位数,将数据等分为两部分)。MeasuresofRelativeStandingandBoxPlots
相对位置的测定和箱线图PercentileThepthpercentileofasetofmeasurementsisthevalueforwhichatmostp%ofthemeasurementsarelessthanthatvalueatmost100(1-p)%ofallthemeasurementsaregreaterthanthatvalue.ExampleSuppose600isthe78%percentileofaGMATscore.Then60020080078%ofallthescoresliehere22%第一个四分位数Q1
第二个四分位数Q2
第三个四分位数Q3
分位数的确定及用途分位数的确定及用途25%25%25%25%75%即四分之三的数据小于等于Q3三、次序统计量(位置平均数)㈠众数㈡中位数㈢四分位数和百分位数(四)箱线图BoxPlots箱线图Thisisapictorialdisplay画图thatprovidesthemaindescriptivemeasuresofthemeasurementset:L-thelargestmeasurementQ3-TheupperquartileQ2-ThemedianQ1-ThelowerquartileS-ThesmallestmeasurementSQ1Q2Q3LAnadjustmenttothisgeneraldescriptionofaboxplotmaybeneededinthepresenceofoutliers.Seethenextexample.由於箱型圖可用來幫助判斷資料是否有無離群值存在,因此,須將簡易箱形圖的繪製步驟加以修改。1. 須規定判斷離群值的內限與外限的範圍資料分佈之內限上界=Q3+1.5
IQR,其中IQR=Q3-Q1資料分佈之內限下界=Q1-1.5
IQR資料分佈之外限上界=Q3+3
IQR資料分佈之外限下界=Q1-3
IQR如下圖:圖3-16離群值的判斷Example4.12-GMATscoresCreateaboxplotforthedataregardingtheGMATscoresof200applicants(seefileXm04-12)440670S410Q1530Q2560Q3590L700IQR=Q3-Q1=590-530=60Fences={Q1-1.5(IQR),Q3+1.5(IQR}={440,670}Theoutliersare700,and410.Therefore,thewhiskerswillextendtothetwoextremevaluesthatarenotoutliers(440and670).Observe.440670InterpretingtheboxplotresultsThesc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 骨科护理安全管理经验分享
- 浙江安防职业技术学院《药理学实验》2024-2025学年第二学期期末试卷
- 重庆实验校2026届初三下学期第一次诊断考试化学试题含解析
- 辽宁省大连市西岗区重点中学2026年初三5月中考模拟试题化学试题试卷含解析
- 龙岩市五县重点达标名校2026届初三教学情况调研物理试题含解析
- 江西省石城县市级名校2026年初三下学期小二调考试数学试题含解析
- 福建省福州福清市2026年初三下学期第二次调研(二模)物理试题试卷含解析
- 儿科护理安全防护
- 医院预算绩效考核制度
- 医院外部审计工作制度
- 养老院安全生产教育培训内容
- 设备设施停用管理制度
- 学会宽容第3课时-和而不同 公开课一等奖创新教案
- 山东高考英语语法单选题100道及答案
- 职业道德与法治知识点总结中职高教版
- 2025年绿色低碳先进技术示范工程实施方案-概述及范文模板
- 2025上半年广西现代物流集团社会招聘校园招聘149人笔试参考题库附带答案详解
- 高值耗材点评制度
- 【浙科综合实践】四上第四课项目一、美味的中秋月饼
- 2025年上海市安全员C3证(专职安全员-综合类)证模拟考试题库及答案
- ASTM-D3359-(附著力测试标准)-中文版
评论
0/150
提交评论