




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
叙述统计统计量数平均数算术平均数所有观察值的总和除以观察值的个数算术平均数在数在线代表资料的平衡点
母体平均数i=1NXiµ=
N样本平均数X=nnxii=1
资料的平衡点18000200002500027000平均数2800050000中位数:数值大小顺序排列的观察值中央的那一个数值众数(Mode):观察值中其出现次数最多的那一个数值四分位数:将顺序资料分成四等分数值的分位数求下列二组资料之中位数与众数:(I):3,8,9,9,5(II):4,8,6,2Sol:
按大小顺序排列,找中间位置3,5,8,9,92,4,6,8(4+6)/2=5百分位数(Pk):将顺序资料均分为一百等分数值,取第k个等分点将顺序资料排列求位置指标
ii=n(k/100)
n:观测值个数
I:非整数Pk:下一个整数位置值
I:整数Pk:(第i+第i+1
位置值)/2
Ex:假定某一班级20位学生之统计学成绩如下:
4255667696806959462822445668788874635339计算平均数,中位数,P35,P68Sol:22283942444653
555659
63666869747678808896
中位数:(59+63)/2=61P35:i=20(35/100)=7为整数取第7与第8两位置之平均数
(53+55)/2=54P68:i=20(68/100)=13.6不为整数取第14位置值69
四分位距IQR=第3四分位数-第1四分位数=Q3-Q1全距
R=最大值-最小值Ex:病房中的两个病人,他们一天要测量脉搏三次,结果如下:A:727578B:4864113A=75=B请问:可否只从平均数据下结论?Ex:两个学生的各项成绩如下:甲:8076788383
乙:8560956595甲=80=乙请问:可否只从平均数下结论?平均分数相同能力或表现相同比较两组数值时,需要考虑每个数值的变异程度变异程度:全距
甲:83-76=7分乙:95-60=35分请问:从全距可否得到?信息变异数将所有数据都纳入考虑,来测量一组数据的变异程度,分布程度,离散程度,或一致性变异程度:测量各个数值和平均数的差距平均绝对离差:为了避免正负值相抵消
母体变异数
测量原始数值和平均数的相近程度式中:µ:母体平均数,N:母体个数。
甲的成绩xx-u(x-u)²807678838380-80=076-80=-478-80=-283-80=383-80=3
016499变异数:38/5=7.6母体标准差样本标准差平均绝对离差平均绝对离差母体:MAD=1NNi=1Xi-µ样本:mad=1NNi=1Xi-X平均绝对离差越大分散程度越大一组数据资料中的标准差越大,这些数的离散或变异程度越大标准差不只考虑到资料中的最大数和最小数,资料中的每一个数都有被列入计算平均数中央数.探讨各个数值分布在平均数的附近用标准差来精确叙述这种离散程度
变异数样本变异数式中:X:样本均数,n:样本数此离差为
(Xi-X);
一般而言,µ为未知,以样本平均数X来推估µ,故失去一个自由度一家银行有八台自动柜员机,在1小时中,各机器的使用次数如下:
2431201635282529试问每台柜员机使用次数的平均值和标准差
xx-u(x-u)²1616-26=-101002020-26=-6362424-26=-242525-26=-112828-26=242929-26=393131-26=5253535-26=9
81Total:260S²=260/8=32.5S=
=5.75每小时每台服务次数
32.5
相对差异量数:用来比较两种或性质不同,或单位不同的资料,或
单位相同但平均数相差很大Ex:两组测量同一批钢管长度的观测值:
I:
8,9,10,11,12(公尺)
II:800,900,1000,1100,1200(公分)变异数I:2标准差I:2变异数II:20000标准差II:1002柴比氏(Chebyshev)定理不论资料为何种分配,至少有(1-1/k)的资料落在距离平均数k个标准差的范围内K为大于1的任意数即k>1
由平均数和标准差柴比氏定理
资料的范围比例2根据柴比氏定理,当k=2时,至少有1-1/22=3/4=75%观测值落在平均数左右的两个标准差的区间内.即(x-2s,x+2s)k区间落于该区间的比例1(x-s,x+s)至少为02(x-2s,x+2s)至少为3/4or(75%)3(x-3s,x+3s)至少为8/9or(89%)标准差的显著程度若资料为钟形分配,则有68%的观察值落在内,有95%的观察值落在内,有99%的观察值落在内(S为标准差)Ex:随机抽出200名员工,发现每日支出平均为615元,标准差为135元.利用柴比氏,求每日支出落于(345,885)的区间人数假设呈对称分配,试利用经验法则求出落于(i)区间的人工员数Sol:x
=615,s=135345=615-k*135885=615+k*135k=2根据柴比氏,至少有1-1/22=3/4=75%的员工其每日支出落在(345,885)的区间内,即0.75*200=150个员工(ii)根据经验法则,约95%的观测值落在(x-2s,x+2s)的区间.故约200*95%=190个员工每日支出金额在(345,885)之内P:Me所在组的组下界q-p:
Me所在组的组距Fi:Me所在组的组次数
Fi-1:
Me前一组的累加次数中位数组别组界次数fi
以下累积次数Fi
120~30f1F1
2
30~40f2F2….….………
i-1h~kfi-1Fi-1ip~qfi
Fi假设中位数于此组i+1r~s
fi+1Fi+1
………Fk=n
内插法pFi-1
Men/2qFi
Me–pn/2-Fi-1
q-pFi-
Fi-1=众数粗略法众数皮尔生众数众数金氏法众数
式中:母体变异数与标准差样本变异数与标准差四分位数全部资料的前25%全部资料的第二个25%全部资料的第三个25%全部资料的末25%Q1P25
P50
P75Q2
Q3中位数?分位数分组资料的第?分位数
位置指标
i=n*(k/100)n:总次数
k:第k个百分位数计算以下累积次数,确定Pk组所在位置利用内插法求PkEx:某一班50位学生统计成绩次数分配如下:求中位数,第三四分位数与P70
组别组界次数以下累积次数
130~4011240~5023
350~60710
460~701020570~801838680~90846790~100450插入法?-该组下界?-在组中的的临界值顺位=该组的组距该组的总次数母体共变量样本共变量母体相关系数相关系数显示出两个变量的关系或趋势点分布图形……………....……....….….….....………..………….……............样本相关系数2.23
由导出的
,将C=0合并S:HW1)某研究针对某大学生每晚的睡眠时间进行统计,一个含20位学生的随机样本统计结果如下:
6,7,5,6,8,4,5,6.5,7,3.5,6,5,6,6,4.5,7.5,3,6,5,7
请求出这组资料的平均数,中位数,众数,变异数,标准差,及绘制箱图HW2)一所大学针对每天学生摄取卡路里数进行调查.结果得知平均数为1450卡路里,标准差为300卡路里.试问:(a)有多少比例的学生,其每天摄取卡路里数介于850~2050间?(b)68%的学生卡路里摄取数落在甚么区间中?HW3)一所大学对于其学生申请助学金的贷款进行统计,结果如下表:
贷款金额学生人数<9993001000~199918002000~299921003000~399911504000~4999
6005000~599950试估计学生贷款金额之平均数,标准差,中位数.
Ex:民国87年某人研究台湾地区骑机车未戴安全帽的比率,在台南市某交通要道观看半小时内经过之机车,得到如下资料:
未戴安全帽戴安全帽男52158女3085推估台湾地区未戴安全帽的比率:82325=5.23%此推估是否恰当?次数分配表:(FrequencyDistributionTable)
将一组数据分成“几个组”,然后再统计每一组的次数,做成一个表=>画图组距:取全部资料的Max&Min之
difference再除以组数,取
近似值一组资料的次数分配如下,由于受到污染,致使表中A.B二栏字迹不清,试求A、B值组别组中点(mi)次数(fi)mi*fi0~201033020~4030412040~6050945060~8070A?80~10090B?
Total402480求A、B值之Solution:3+4+9+A+B=40A+B=24=>A+B=2430+120+450+70A+90B=2480=>70A+90B=1880解联立方程序:A+B=2470A+90B=188070A=980,90B=900A=14,B=10职篮联盟的旗下计有25支篮球队,其比赛得分记录:74728679747291846475638078958286777369728185926290请编制此组资料的次数分配、相对次数分配、以下累积和以上累积的次数分配b.绘制长条图与绘制枝叶图c.中位数与标准差联篮联盟:a.将资料由小->大min:62Max:95定组距为4组别次数相对次数累积相对次数60~6433/25=.12.1265~6911/25=.04.1670~7466/25=.24.4075~7944/25=.16.5680~8444/25=.16.72组别次数相对次数累积相对次数85~8933/25=.12.8490~9433/25=.12.9695~9911/25=.041.00合计
251.00b.长条图:得分记录(分)次数c.枝叶图:依照a的组距62346*972223447*5789801248*56690129*5某电信局记录长途电话拨入时间的间隔(min)12.610.55.015.316.89.24.220.227.58.912.218.214.514.012.67.811.55.515.58.9a.试将资料整理成次数&相对次数分配表b.请绘制枝叶图,由枝叶图求Max、min&资料大多集中在?范围c.计算变异数与标准差电信局的solution:a.取5为单位,将资料由小大,最小:4.2最大:27.5(因有小数点,小心计算)时间间隔(x)次数(f)相对次数3≦x<844/20=.28≦x<1388/20=.413≦x<1855/20=.2518≦x<2322/20=.1023≦x<2811/20=.05Total201.00b.电信局枝叶图:以0.1(min)为单位425057889992105115一诊所完病人的等待急诊时间之资料搜集(近一个月),等待的时间:(分钟)251012445171189812216871383请以0为起始时间,并用5
min为分组宽度
a.列出次数分配表
b.相对次数分配表
c.累积次数分配表
d.绘出直方图急诊等待时间(solution):a.b.等待时间(x)次数相对次数0≦x<544/20=.2=20%5≦x<1088/20=.4=40%10≦x<1555/20=.25=25%15≦x<2022/20=.10=10%20≦x<2511/20=.05=5%Total201.00100%急诊等待时间c.等待时间(x)次数累计次数累积相数次数0≦x<544.205≦x<10812.6010≦x<15517.8515≦x<20219.9520≦x<251201.00次数分配直方图:T时间(分钟)次数f观念题:甲班与乙班成绩平均=60分但,甲班成绩分布呈对称乙班成绩分布呈右偏试问,那一班及格的人数较多?那一班的中位数较大?有100位学生,统计学的考试平均分数
=75,
=5试求,介于60分~90分有几位学生?65分~85分有几位学生?6065759065分:为x-3
(75-3*5=65)90分:为x+3
(75+3*5=90) 按照柴比氏定理,至少有1-321=1-98=89%的学生(89位)由柴比氏定理(用于任何型态)
不对称也可以
x-2sx-sxx+sx+2sK=2,1-1/k²=1-1/4=3/4=75%的观察值在(x-2s,x+2s)之内K=3,K=4,…分组资料的第3四分位数Q3=LQ3+3n/4—FQ3fQ3WQ3式中:LQ3:Q3所在组的组下界,fQ3:Q3所在组的组次数,WQ3:Q3所在组的组距,FQ3:Q3前一组的累加次数分组资料的百分位数Pi=Lpi+ni/100–FpifpiWpi式中:Pi:第i个百分位数,Lpi:Pi所在组的组下界,fpi:Pi所在组的组次数,Wpi:Pi所组的组距,Fpi:Pi前一组的累加次数分组资料的十分位数Di=LDi+ni/10-FdifDiWDi式中:Di:第i个十分位数,LDi:Di所在组的组下界,fDi:Di所在组的组次数,WDi:Di所在组的组距,FDi:Di前一组的累加次数试求下列(a)中位数Me(b)Q1(c)Q3(d)IQR分组别x:资料学生累积次数
30~4030≦x<40240~5040≦x<50350~6050≦x<601160~7060≦x<702070~8070≦x<803280~9080≦x<902590~10090≦x<1007(a)中位数:因为(1/2)×100=50,由上表得知,中位数落在第五组(看累积次数)Me-组下界组距n/2-前一组的累加次数所在的组次数=Me-701050-3632=Me=50-36
32
10+70=74.38(b)Q1:因1/4
100=25,由上表得知,Q落在第4组
Q1-6025-161020=Q1=64.5(C)Q3:因3/4
100=75,由上表得知,Q3落在第6组Q3-组下界组距=3n/4-前组的累加次数所在的组次数Q3-8010=2575-68Q3=82.8(d)I.Q.R:Q3-Q1=82.8-64.5=18.3GD#33)设XA为A组的平均成绩:80设XB为B组的平均成绩:74
X:全班平均成绩:∑Xi=30XA+20XB=77.65050
设SA表示A组的标准差:6设SB表示B组的标准差:8,S表示全班的标准差50i=1SA2=36.∑
Ai2-30·XA2∑
Ai2=193.080
3030i=130i=1SB2=64.∑
Bi2-20·XB2∑
Bi2=110.800
2020i=1i=12020∑Xi2=∑Ai2+∑Bi2=193.080+110.080=303.880502030i=1i=1i=1S2=∑Xi2-50X2=303.880–50*(77.6)2=55.84505050i=1S=55.84=7.47n=1100135175215215=175+4*10,175-4*10=135由柴氏定理得知:最多有1/42的报考人数的分数会落入(-∞,135)(215,∞),1100*1/16=68.75
最多68人的分数会高于215分,所以考生会录取柴氏定理至少有(1-1/k2)的资料会落在距离平均数K个标准差的范围内最多有(1-1/k2)的资料不会落在距离平均数个k个标准差的范围内或
会落在距离平均数个k个标准差的范围外
汽油组界次数0~4-.5~4.5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025安徽宣城市广德市国有资产投资经营有限公司下属公司招聘11人考前自测高频考点模拟试题及答案详解(必刷)
- 2025广西玉林市福绵区樟木镇人民政府招聘代理服务记账中心编外人员2人考前自测高频考点模拟试题附答案详解(完整版)
- 2025第十三届贵州人才博览会沿河土家族自治县县管国有企业引才17人模拟试卷附答案详解
- 2025春季福建农信招聘模拟试卷及完整答案详解
- 2025甘肃兰州中核五〇四医院招聘护理员模拟试卷及参考答案详解一套
- 浙江国企招聘2025宁波市镇海产业投资私募基金管理有限公司招聘面谈笔试及核减招聘指标笔试历年参考题库附带答案详解
- 2025陕西西安泵阀总厂有限公司招聘17人笔试历年参考题库附带答案详解
- 2025广东韶关市始兴县太平镇人民政府青年就业见习基地招募见习人员15人考前自测高频考点模拟试题含答案详解
- 2025重庆市南川区惠农投资有限公司招聘25人笔试历年参考题库附带答案详解
- 2025贵州黔西南州望谟县斌顺运输服务有限公司招聘11人笔试历年参考题库附带答案详解
- (正式版)SH∕T 3548-2024 石油化工涂料防腐蚀工程施工及验收规范
- 二次抵押贷款合同
- 健康指南绝经与乳腺癌的关联性
- 《家蚕小蚕期人工饲料饲养技术规程》
- 《税费计算与申报》第四版 教案全套 王荃 项目1-7 涉税工作基础知识-其他税种的计算与申报
- 植物内生菌与宿主关系研究进展
- 无仓储危化品经营单位应急预案
- 关爱生命-急救与自救技能知到章节答案智慧树2023年上海交通大学医学院
- GB/T 33881-2017罐车用铝合金板、带材
- GB/T 2951.2-1997电缆绝缘和护套材料通用试验方法第1部分:通用试验方法第2节:热老化试验方法
- 安全阀校验委托单
评论
0/150
提交评论