概率与统计下的新定义(五大题型)_第1页
概率与统计下的新定义(五大题型)_第2页
概率与统计下的新定义(五大题型)_第3页
概率与统计下的新定义(五大题型)_第4页
概率与统计下的新定义(五大题型)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题03概率与统计下的新定义

【题型归纳名目】

题型一:二项式定理新定义

题型二:排列组合新定义

题型三:概率新定义

题型四:统计方法新定义

题型五:信息牖问题

【方法技巧与总结】

解概率与统计下的新定义题,就是要细读定义关键词,理解本质特征,适时转化为“生疏”问题.总

之,解决此类问题,取决于已有学问、技能、数学思想的把握和基本活动阅历的积累,还需要不断的实践

和反思,不然就谈不•上“自然”的、完整的解题.

【典型例题】

题型一:二项式定理新定义

【典例(2025•湖南衡阳•二模)莫比乌斯函数在数论中有着广泛的应用.全部大于I的正整数”都可以

被唯一表示为有限个质数的乘积形式:〃=〃;>”••pf(攵为〃的质因数个数,P,为质数,

=),例如:90=2x32x5,对应攵=3,/人=2,p?=3,p==54==2,今=1.现对任意

1,/?=1

GN+,定义莫比乌斯函数〃(〃)="(T)'=Z2=",=ZA=1

0,存在7;>1

⑴求“(78),4(375);

(2)若正整数工,>互质,证明:〃E,)=〃(x)〃(y):

⑶若〃>1且记〃的全部真因数(除了1和〃以外的因数)依次为4,4,…M”,证明:

"⑷+〃(g)+…+〃(/)=-2.

【解析】(1)由于78=2x3x13,易知&=3,〃]=2,/%=3,〃3=13,4=1,G=1,

月亍以,(78)=(_1)3=_]:

乂375=3x5,由于5的指数3>1,所以〃(375)=0;

(2)①若工=1或y=l,由于"(1)=1,所以〃(Ay)=〃(x)4(y);

②若苍丁工1,且存在质数〃,使得%或丁的质因数分解中包含P'(r>l),则外的质因数分解中肯定也包含

所以〃⑻=〃(x)〃(y)=o,

③若x,"l,且不存在②中的〃,可设K=PI〃2…PQ=%%…%,

其中P|,〃2…0,4,%…%均为质数,则冷'=月〃2…P序%…%,

由于x,y互质,所以〃「〃2…凡4,%…%互不相等,

所以〃3)=(-1广,=(T),(一1)、=4(%)〃"),

综上可知〃(孙)=〃(x)〃(y)

(3)由于〃(〃)=1,所以可设〃=P1〃2…“,2为偶数,

”的全部因数,除了1之外都是四,〃2,…,P«中的若干个数的乘积,从攵个质数中任选比.=1,2产4)个数的

乘积一共有C:种结果,

所以〃。)+4(4)+〃(电)+…+〃(%)+〃(〃)

=n⑴+[〃(PJ+M〃2)+…+〃(凡)]+[〃(〃也)+〃(0〃3)+—+〃(〃1/〃)]+…+4(〃)

=I+C;(T)+或(-炉+…+c7(-1广+(_球=(1一以=0,

所以〃(4)+〃(令)+…+〃&)=。一〃⑴一〃(〃)=一2.

【典例1・2】(2025•安徽合肥•一模)“4-数”在量子代数争辩中发挥了重要作用.设夕是非零实数,对任意

〃wN"定义“一数"(〃L=l+q+…+/利用“4-数”可定义“4一阶乘”(〃儿=(Dg(2)g…且(0儿=1.和

仅[二(〃儿

“夕一组合数”,即对任意卜[一伙儿(〃一々儿

(5}

(1)计算:;

1力2

⑵证明:对于任意公〃wN*,A+”〃,:=:।〃心

X/q\/q\/

%+m+l)n

(3)证明:对于任意k,m€N,〃eN*,A+1V〃,

kk+\,

\+1/q\♦q

【解析】(1)由定义可知,

pl_(5)%_(1)2(2)2(3)2(4)2(5)2

[31[3)乂2)!2一口)式2从3)2第1)式2)」

_KM,_(1+2+22+2)(1+2+22+23+2。)_^5

-⑴2(2)2-lx(l+2)

(〃儿(〃)/(〃T儿

(2)由儿

伙儿(〃T儿

+"一]-("1儿I♦•(〃T儿

l]U厂(1儿(〃-出(由5-1儿

需尚*厅小iJ

又伏)g+/.(〃_A)g=]+q+・・,+qi+T(i+q+,一+q>J)

=1+什..+/=(〃L,

(八/〃一、

所以J=fIn-h+"我1

⑶山定义得:

D(〃、

对任意4€N,〃CN*MK〃,=

LK.〃K,

\\/q

结合(2)可知

〃+1n1

=/"

氏+1l-UJ,

上述〃2+1个等式两边分别相加得:

n+6+1

k+\

I-UJ,r=O\

【变式7](2025•高三・江苏苏州,阶段练习)甲、乙、丙三人以正四棱锥和正三棱柱为争辩对象,设棱长为

〃,若甲从其中一个底面边长和高都为2的正四棱锥的5个顶点中随机选取3个点构成三角形,定义随机变

量X的值为其三角形的面积;若乙从正四棱锥(和甲争辩的四棱锥一样)的8条棱中任取2条,定义随机

变量g的值为这两条棱的夹角大小(弧度制);若丙从正三棱柱的9条棱中任取2条,定义随机变量”的值

为这两条棱的夹角大小(弧度制).

⑴比较三种随机变量的数学期望大小;(参考数据

arctan石«0.3661,arctan闺x0.2677,arctan2夜x0.3918)

I\i

(2)现单独争辩棱长〃,记(x+l)xx+-x...xx+—(〃22且〃eN*),其开放式中含工项的系数为S”,

、乙/n)

含d项的系数为r..

①若二=卬/+加+C,对〃=2,3,4成立,求实数”,h,C的值;

②对①中的实数”,力,。用数字归纳法证明:对任意〃22且〃wN”,于=加+加+c都成立.

【解析】(1)如图所示:

由题意设O”为正四棱锥。-A8CE的高,G为A3中点,

由于正四棱锥的底面边长和高都是2,

所以4C=8E=2&,。产=2,所以人=指,

由对称性以及三线合一可知。G==y/5,

若甲从其中一个底面边长和高都为2的正四棱锥的5个顶点中随机选取3个点构成三角形,

贝IJX的全部可能取值为;x2x2=2,;x2x6=K,gx2&x2=2五,

且唳=2)=肾=*小=2@=>丁.=括)=*4

所以E(X)令2+32向|X14+2[+2凡4+2;+2X2=2,

若乙从正四棱锥(和甲争辩的四棱锥一样)的8条棱中任取2条,

则《的全部口J能取值为5,(),arctan瓜arctan,arctan2夜,

_,\n42/r16f加、4n-2

初Zt9=-x——+0x——+arctanV5x——+arctan——x—+arctan2V2x——,

2282828(2J2828

代人参考数据arctan岳工0.3661.arctan—k0.2677,arctan2上工0.3918,得E©=1.0890.

若丙从正三棱柱的9条棱中任取2条,

则3的全部可能取值为弓,*0,

13九.《—“_

£(〃)=二、电+工X"+0x9=——«1.1345,

\)2363363636

所以E(X)>E(〃)>E⑷.

(2)①由于(x+l)xx+;卜…xx+-中x项的系数为5”,

一般地,从(》>1+3卜…X(K+1)中的第2个因式中取一个大,其余因式中取常数即可得到一个人

项,

工、斗yx-v.万物,4,k1+2+・一+〃〃(/2+1)

而这一项的系数为I,S=----------=———->

川nn\2/1!

(iA(iA

由于(x+l)sxX+,X…Xx+—中一项的系数为r.,

一般地,从(x+l)x(x+[x…x(x+,中的第•工力个因式中各取一个X,其余因式中取常数即可得到

一个2.2项,

而这一项的系数为4,从而4=4Zij,

〃!n!14ivj4n

2x333x44x55

从加邑二心=展5广右

-2X4!"T2

1x2sIx2+lx3+2x311_Ix2+lx3+lx4+2x3+2x4+3x4_35

2!=鹏=~一口"24

T2

4a+2b+c=—=—

S23

9a+3b+c=^-=^-,解得〃=:,/?=-]",=一';

由题意得<

S364126

\()a+4b+c=—=—

S42

②用数学归纳法证明:〃22且〃wN*时,^-=an2+bn+c=—

1212

当〃=2时,S,一3一3-4126,故结论对〃=2成立,

-2

假设结论对〃=kN2«eN.成立,即,=3K;,2=(I)(;&+2),

“1212

k!Tk/,0

生=1+l)!G=女工+("1)(1+2+...+2)=4!7;+(女+1)20=叵+(+)

SA二(八1)区「(八1)!%"攵⑸+(k+l)一[+3

祭+(皿)(I)。八明⑺

______12

,&+1一.2

1+----------------1+-

1+2+•••+kk

(左-1)(32+2)+12&+12二3-+1次+10=(〃+2)(32+5)

W+j-*旷12(闻

”+1)-1][3(八1)+2]

12,

所以结论对n=k+\也成立,

故?=加+加+c=(〃-1)](;〃+2),对任意〃22,〃cN成立.

题型二:排列组合新定义

【典例2・1】(2025・高三•北京•阶段练习)设"为正整数,集合

A二3a二(KG,…4)},4e{01},A=1,2,…,〃.对丁集合A中的任意元素。一(小巧,…,怎J和

月=(%,%」.•,%),定义或。,6)=归一%|十|巧一%|+…+|二一”|.

(1)当刀=4时,若a=(0,1,0,1),6=(1,1,0,1),直接写出全部使"3力=2/(4y)=3同时成立的A的元素

7;

⑵当〃=3时,设8是A的子集,且满足:对于9中的任意两个不同元素久⑶d(a,0N2.求集合A中元素

个数的最大值;

⑶给定不小丁2的,J设3是A的了集,且满足:对丁6中的任意两个不同的元素生#,4%/?)22,写出

一个集合8,使其元素个数最多,并说明理由.

【解析】(1)•.•。二(0,1,0,1),"(%力=2

满足条件的/有

a0101

Y0000

0011

0110

1001

1100

1111

又/?=(1,1,0,1),J(A/)=3

「•满足条件的/有

fl1101

0000

Y0011

0110

re{(0,0,0,0),(0,0,1,1),(0」,1,0)}(2)列出集合4的元素

000

001

010

011

100

101

110

111

•••B是A的子集,且满足:对于8中的任意两个不同元素a,1d(a,fi)>2

••・满足条件的集合3的元素的个数的最大值为4.

001

010

100

111

(3)vd(a,fl)>2

•••8中的元素应当含有奇数个1

若片2,则含有奇数个1的元素有C;=2个;

若片3,则含有奇数个I的元素有C;+《=4个;

若片4,则含有奇数个1的元素有C;+C;=8个;

若『5,则含有奇数个1的元素有1+1+以=16个;

当后3时,B={(0,0,1),(0,1,0|,(1,0,0),(1,1,1))

【典例2・2】(2025・高三・浙江•开学考试)一般地,〃元有序实数对师生,…M”)称为〃维向量.对于两个〃维

向量4=(4,生,…,4),〃=(4也,…也),定义:两点间距离d=/一…+('-。”)2,利用

〃维向量的运算可以解决很多统计学问题.其中,依据“距离”分类是一种常用的分类方法:计算向量与每个

标注点的距离应,与哪个标准点F勺距离〃”最近就归为哪类.某公H对应聘员工的不同方面力量进行测试,

得到业务力量分值(%)、管理力量分值®)、计算机力量分值(6)、沟通力量分值3)(分值

《€1</£{1,2,3,4}代表要求度,|分最低,5分最高)并形成测试报告.不同岗位的具体要求见下表:

业务力量分值管理力量分值计算机力量分值沟通力量分值合计分

岗位

⑷3)3)⑷值

会计(1)215412

业务员

523515

(2)

后勤⑶235313

管理员

454417

(4)

对应的者的力量报告进行四维距离计算,可得到其最适合的岗位.设四种力量分值分别对应四维向量

£=(4,%,%,%)的四个坐标.

⑴珞这四个岗位合计分值从小到大排列得到一组数据,直接写出这组数据的第三四分位数;

(2)小刚与小明到该公司应聘,已知:只有四个岗位的拟合距离的平方月均小于20的应聘者才能被招录.

(i)小刚测试报告上的四种力量分值为瓦=(4,3,2,5),将这组数据看成四维向量中的一个点,将四种职业

1234的分值要求看成样本点,分析小刚最适合哪个岗位;

(ii)小明」经被该公司招录,其测试报告经公司计算得到四种职业1、2、3、4的推举率(p)分别为

141391(d2、

”木,・下)=/、,,",,.,试求小明的各项力量分邕

43434343(4+/+《;+";)

【解析】(1)将四个岗位合计分值从小到大排列得到数据12,13,15,17,

又/=np=4x0.75=3,所以这组数据的笫三四分位数为生尹=16.

(2)(i)由图表知,会计岗位的样本点为4=(2,1,5,4),则环=(2-4)2+(1-3)2+(5-2)2+(4-5)2=18,

业务员岗位的样本点为A=(5,2,3,5),则片=(5-4)2+Q_犷+(3-2>+(5-5>=3,

后勤岗位的样本点为A=(2,3,5,3),则4=(2-4-+(3-3尸+(5-2尸+(3-5)2=17,

管理员岗位的样本点为氏=(4,5,4,4),则点=(4-4>+(5-3)2+(4-2-+(4-5-=9,

所以出<&<4<4,故小刚最适合业务员岗位.

141297J2

(ii)四种职业1234的推举率(p)分别为GEAR且3

4D-DClI•CI十"彳■<

d;-

14

d;+d;+d;+dj一d;=—(d;+d;+d^+d-)

43

d;-13片=»(1:+%+4+4)

d-+d;+d;+d:

43得到

所以9

d;-一d;=Md;+d;+d;+d:)

d[+d;+d;+d:473

2

-43d:=—(J1+d;+d;+d:)

又d;(〃G{1,2,3,4))均小于20,所以d;+d;+d;+d:<80,且d;GN*(〃e{1,2,3,4}),

故可得到d;=14,片=13,片=9,d:=7,

设小明业务力量分值、管理力量分值、计算机力量分值、沟通力量分值分别为《4c,d,且a/,Gd€N"

I<a,b,c,d<5,

依题有(〃_2)2+S_l)2+(c―5)2+(d_4)2=42=]4①,

(«-5)2+(Z?-2)24-(c-3)2+(J-5):=J;=13@,

(a—2)2+S—3)2+(c-5)2+(d-3)2=d;=9③,

(4-4)2+(力-5)2+(c-4)2+(1-4)2=d:=7(4),

由①-③得,

2

(4—2)2+3—1)2+(C—5)2+(d—4)2一[(4—2)2+(Z,_3)2+(°-5)2+(67-3)1=14-9=5,

整理得:2b-(1=3,

Z?=2,J=1

故有〃=3,d=3三组正整数解,

b=4,d=5

对于第一组解,代入④式有(a-4/+9+(c-4)2+9=7,不成立;

对于其次组解,代入①式有(。-2『+(。-5)2=4,

a=4[a=2

解得〈或「代入②④式均不成立;

<?=5[c=3

对于第三组解,代入②式有(〃-5『+«-3)2=9,

a=2

a=2b=4

解得,。,代入①@③④均成立,故|;

c=3c=3

4=5

故小明业务力量分值、管理力量分值、计算机力量分值、沟通力量分值分别为2,43,5.

题型三:概率新定义

【典例3・1】(2025・浙江•一模)混管病毒检测是应对单管病毒检测效率低下的问题,消灭的一个创新病毒

检测策略,混管检测结果为阴性,则参与该混管检测的全部人均为阴性,混管检测结果为阳性,则参与该

混管检测的人中至少有一人为阳性.假设一组样本有N个人,每个人患病毒的概率相互独立且均为

N

目前,我们接受K人混管病毒检测,定义成本函数/(X)=^+KX,这里X指该组样本N

K

个人中患病毒的人数.

⑴证明:E[/(X)]Z2)-N;

(2)若0<“<KT4,l()WKK20.证明:某混管检测结果为阳性,则参与该混管检测的人中或许率恰有一人

为阳性.

【解析】(1)由题意可得X满足二项分布X~8(N,p),

由EeX+〃)=aE(X)+b知,E[f(X)]=q+K-E(X)=t+K-pNN2〃-N,当且仅当上=即时取等

KKK

号;

(2)记》=P(混管中恰有I例阳件I混管检测结果为阳忤).

…(混管中恰有,・例阳性)=C"(1-〃尸,i=0J…,K,

令力(x)=ev-x-l,-2x<xv2x1(厂3,

则〃(x)=e'-l,

当2x10-3,0)时,//(x)<0,〃(x)为单调递减,

当x«0,2xl(r3)时,/«x)>o,力⑴为单调递增,所以〃(x)N%(O)=O,

且A(—2xlO-3)=e-2"M'_(_2X1O-3)_]HO,//(2xlO_3)=e2x,oi-(2xlO-3)-l«0,

所以当-2xl(T3Vx<2x10-3,e,-x-la0即e'ex+1,两边取目然对数可得xuln(x+l),

所以当0<〃<10-4,10WKW20时,

所以(1一〃)"=/皿0通=\—Kp,

—PKp(l-/?)A'

则P=—―4-

1-(1-P)AI,」d(I)〃

故某混管检测结果为阳性,则参与该混管检测的人中或许率恰有一人为阳性.

【典例3・2】(2025•辽宁・模拟猜测)条件概率与条件期望是现代概率体系中的重要概念.近年来,随着人们

对随机现象的不断观看和争辩,条件概率和条件期望已经被广泛的利用到日常生产生活中.定义:设X,r

是离散型随机变量,则X在给定大事y=1y条件下的期望为

v

E(x|y=y)=力夕p(x=x/y='=%.P(JJ),其中国程…,■为X的全部可能取值集合,

f-1/-I一刀

「('=人丫=),)表示人事—二炉与人事"〉’=尸嘟发生的概率.某射击手进行射击训练,每次射击击中日

标的概率均为P(0</><1),射击进行到击中目标两次时停止.设4表示第一次击中目标时的射击次数,"

表示其次次击中目标时的射击次数.

⑴求夕(4=2,〃=5),尸何=5);

⑵求网司"=5),网轴=〃)(〃22).

【解析】(I)由题设,P(g=2〃=5)=("〃)〃(l-M(l-p)p=(S/,

"7=5)=C:(l-〃)”2=4(1-〃))2.

⑵由题设,.…)=玄.警祭…爷警U、警察

+3、4网/Mx%:"/)1235

=+++1=;

P(〃=5)P(fj=5)4442

同(1),。(,7=〃)=。3(1-〃)”»=(〃一1)(1一P(€卜7=〃)=(1—〃)I'"'P2,

所以七@77=〃)=»*勺”—?]=3+告+~+^^+1(〃-1)(沟十Dn.

MP(〃=〃)n-\n-\n-\=-----------------=~

【变式3・1】(2025•福建漳州•一模)在数字通信中,信号是由数字0和1组成的序列,发送每个信号数字之

间相互独立.由于随机因素的干扰,发送的信号。或1有可能被错误地接收为1或().

⑴记发送信号变量为X,接收信号变量为y,且满足p(x=o)=;,P(y=i|x=o)=|,

p(r=o|x=i)=l,求尸(y=0);

On

(2)当发送信号。时,接收为0的概率为定义随机变量〃的“有效值”为“(〃)=-X尸(〃=%)也夕("=须)

4I=I

(其中为是〃的全部可能的取值,i=12…发送信号“000”的接收信号为“y%%”,记g为弘,%,力

三个数字之和,求百的“有效值”.(lg3no.48,lg2«0.30)

12

【解析】(i)由题意可知:P(X=I)=I-P(X=O)=-,p(y=oix=o)=i-p(y=nx=o)=-,

23

所以p(y=o)=0(y=oix=o)p(x=o)+p(y=o|x=i)p(x=i)=:x!+:x;=3.

(2)由题意可知:当发送信号0时,接收为0的概率为3:,接收为1的概率为1:,

44

可知:J的可能取值有0,1,2,3,

则叫。)=用唱倒>1)=C砥W号

Pg)=C*xgj啥必=3)=(*4

“…,—,〃八f27.2727,279.91,1A

可得4的“有效值''"(4)=一Tv1gTT+TT^TT+TT^TT+TTteTT

(6464646464646464)

-54QA145

=-(3怆3-6182)+^^2183—6182)-^^2=-1g3+61g2

764T6464JI7o7

45

x0.48+6x0.30=0.45,

16

即《的“有效值”约为0.45.

题型四:统计方法新定义

【典例4-1](2025•全国•模拟猜测)某校20名同学的数学成果%(i=l,2,…,20)和学问竞赛成果

M(i=L2,…,20)如下表:

同学编号i12345678910

数学成果工100999693908885838077

学问竞赛成果£29016022020065709010060270

同学编号i11121314151617181920

数学成果工75747270686660503935

学问竞赛成果M4535405025302015105

计算可得数学成果的平均值是5=75,学问竞赛成果的平均值是9=90,并且2(%-胃)2=6464,

/=1

2020

£E-田2=149450,XG-可加-刃=21650.

r=l

⑴求这组同学的数学成果和学问竞赛成果的样本相关系数(精确到0.01).

(2)设NwN',变量X和变量》的一组样本数据为{a,X)l,=l,2,…,N},其中苍(,=1,2,…,N)两两不相同,

川=1,2,…,N)两两不相同.记阳在=2,…,N}中的排名是第舄位,升在{其|〃=1,2,…,N}中的排

名是第5位,i=l,2,…,N.定义变量工和变量y的“斯皮尔曼相关系数”(记为P)为变量X的排名和变量

y的排名的样本相关系数.

6N

⑴记4=R,—E,i=l,2,…,N.证明:P="附'

(ii)用(i)的公式求这组同学的数学成果和学问竞赛成果的“斯皮尔曼相关系数”(精确到0.01).

⑶比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.

Vfx,-J)(yz-y)

注:参考公式与参考数据.)右以―

76464x149450=31000.

也”那2人刃2』6

V1=1/=1

【解析】(1)

由题意,这组同学数学成果和学问竞赛成果的样本相关系数为

2("可(y-刃

』二|2165°—1650〜o'。

回Tlo"

可5(%一刃76^64x1495031000

Vr=lM

(2)(i)证明:由于{4}和{>}都是1,2,L,%的一个排列,所以

NN

之用=力S=N(N+1)

r=1r=12

»N弋=N»:=A(N+1)(2N+I)

i=ii=l~6~

N+l

从而{K}和{S,}的平均数都是R=S

N〜NNNN2

汇(凡N(A/+1)(2N+I)A/(/V+l)_N(N+1)(N-1)

因比,

i=\i=li=\i=lf=l6412

同理可得加f匕如空0.

i-l12

由于sj'z[(4-R-(s-9]=Z(K-町2Z(K-阴(s—亍)

i=lr=lf=1

=2.N(N+D("D_2次(a一斤心

12J=i

无心-9N(N+*”£d:6N

所以"离⑻序T二迎晋4=」研刁中,

(ii)由题目数据,可写出《与2的值如下:

同学编号i12345678910

数学成果排名凡12345678910

学问竞赛成果排名/p>

同学编号i11121314151617181920

数学成果排名叫11121314151617181920

学问竞赛成果排名加12141311161517181920

所以N=20.并且£寸=9x()2+4x「+3x2?+2x32+1x4?+1x8?=114.

1-1

因此这组同学的数学成果和学问竞赛成果的斯皮尔曼相关系数是

p=\——&―rxll4®0.91

20(202-1)

(3)答案①:斯皮尔曼相关系数对于特别值不太敏感,假如数据中有明显的特别值,那么用斯皮尔更相

关系数比用样本相关系数更能刻画某种线性关系;

答案②:斯皮尔曼相关系数刻画的是样本数据排名的样本相关系数,与具体的数值尢关,只与排名有

关.假如一组数据有特别值,但排名照旧符合肯定的线性关系,则可以接受斯皮尔曼相关系数刻画线性关

系.

【典例4・2】(2025•全国•模拟猜测)冰雪运动是深受同学宠爱的一项户外运动,为了争辩性别与同学是否

宠爱冰雪运动之间的关系,从某高校男、女生中各随机抽取100名进行问卷调杳,得到如下列联表

(/?Z<40,//ZGN).

宠爱不宠爱

男生80-/n20+/n

女生60+〃?40-m

(1)当相=0时,从样本中不宠爱冰雪运动的同学中,按性别接受分层抽样的方法抽取6人,再从这6人中

随机抽取3人调研不宠爱的缘由,记这3人中女生的人数为g,求g的分布列与数学期望.

(2)定义/=2(%一%)(24其3,24J<3j;jeN),其中心为列联表中第i行第/列的实际数据,叫,

%

为列联表中第i行与第/列的总频率之积再乘以列联表的总额数得到的理论频数,如4.2=80-/〃,

B2.:=—X—x200=70.基于小概率值。的检验规章:首先提出零假设”。(变量X,y相互独立),然

ZOU

后计算K2的值,当六之七时,我们推断”。不成立,即认为X和y不独立,该推断犯错误的概率不超过

否则,我们没有充分证据推断乜,不成立,可以认为x和y独立.依据K2的计算公式,求解下面问

题:

①当〃?=0时,依据小概率值。=0.005的独立性检验,分析性别与是否宠爱冰雪运动有关?

②当〃ZV10时,依据小概率值a=0.1的独立性检验,若认为性别与是否宠爱冰雪运动有关,则至少有多少

名男生宠爱冰雪运动?

附:

a0.10.0250.005

2.7065.0247.879

【解析】(1)当〃?=0时,用分层抽样的方法抽取的不宠爱冰雪运动的6人中,男生有2人,女生有4

人,

由题意可知,看的可能取值为1,2,3.

=1)=詈弓,―)率=|,%=3)=等4

%

。的分会列为

(2)①零假设为〃°:性别与是否宠爱冰雪运动独立,即性别与是否宠爱冰雪运动无关联.

当〃?=0时,4.2=80,%=70,4.3=20,5^=0.5x0.3x200=30,

A二=60,832=0.5x0.7x200=70,4”40,M3=0.5x0.3x200=30,

(80-70)2(20-301(60-70)2(40-30)2_200

―70+3070+30~~2A~«9.524.

9.524>7.879=x0005,

J依据小概率值a=0.005的独立性检验,我们推断,。不成立,即认为性别与是否宠爱冰雪运动有关联,

此推断犯错误的概率不超过0.005.

与“_(8°一+(20+〃?-30)2+(60+加一70)2+(40—〃?一30『_2(10-/«)2

‘-70+30+70+30-~21

由题意可知,2(1(;'〃)22.706,整理得(10—机)飞28.413.

又m€N,m<10,m<4,w的最大值为4.

乂80-4=76,・••至少有76名男生宠爱冰雪运动.

【变式4・1】(2025・高三•北京・期末)在测试中,客观题难度的计算公式为巳=备,其中2为第i题的难

N

⑵从抽样的20名同学中随机抽取2名同学,记这2名同学中第5题答对的人数为X,求X的分布列和数

学期望;

⑶定义统计量匕)2+/-6)2+—+(匕-月)2],其中邛为第i题的实测难度,C为第i题的预估难度

n1

(i=12…规定:若S<0.05,则称该次测试的难度预估合理,否则为不合理.推断本次测试的难度预

估是否合理.

4

【解析】(1)由于20人中答对第5题的人数为4人,因此第5题的实测难度为4=0.2,

所以估量240人中有240x0.2=48人实测答对第5题.

(2)X的可能取值是0,1,2.

P(X=O)=%=乜;p(x=l)=旦叁=%;P(X=2)=-^-=—.

C;o19,"CM95'iJ95

X的分布列为:

X012

12323

p

199595

123232

EX=Ox—+lx—+2x—=-.

1995955

(3)第I题的实测难度为为=().8,同理可得:第2题的实测难度为玲=0.8,

1414

第3题的实测难度为药=0.7,第4题的实测难度为元=0.7,第5题的实测难度为0.2,

222

故S=」[(0.8-0.9)+(0.8-OS)?+{0.7_07)z+(0>7_o.6)+(0.2-0.4)]=0.012.

5

由于5=0.012<0.05,

所以,该次测试的难度预估是合理的.

题型五:信息埼问题

【典例5・1】(2025・高三・河北•阶段练习)信息嫡是信息论之父香农(S加定义的一个重要概念,香农

在1948年发表的论文《通信的数学理论》中指出,任何信息都存在冗余,把信息中排解了冗余后的平均

信息量称为“信息燧”,并给出了计算信息端的数学表达式:设随机变量X全部可能的取值为

且P(X=i)=p,>0(i=l,2,・•・,〃),£〃,=1,定义X的信息嫡〃(X)=-£〃Jog2〃,.

(1)当〃=1时,计算“(X);

(2)若=…,〃),推断并证明当〃增大时,"(X)的变化趋势;

n

(3)若〃=2/〃(meN)随机变量y全部可能的取值为1,2,…㈤,且?(丫="=匕+0»1。=1,2,…,〃。,证

明:H(X)>H(Y).

【解析】(1)当〃=1时,则i=所以,(X)=-(lxlog21)=0

(2)"(X)随着〃的增大而增大.

当Pj=』(i=12…,江则〃(X)=一(一•log2一]x〃=-log2-=log,7?,

n\n"nJ~n

设f5)=log2〃,〃£N”,则y(/i+l)-/(n)=log2(«+l)-log2n=Iog2>0,

因此"(X)随着〃的增大而增大.

(3)证明:若〃=2〃G〃eN)随机变量y全部可能的取值为12…刈,且

尸"=")=〃,+〃2H()=1,2,…

2m2mi

"(X)=•log?Pi=•log?—

»=l/=lPi

,1.1,1.1

=P\'l°g2—+〃2'l°g2-+…+P2w-I.10g2-------+P2m.log2一.

PlPlPlm-\P2m

"(y)=(Pl+/%”).log2~~Z—+(〃2+〃2吁J.l°g2—7------+•••+(〃,”+P,”+J.log?-7—

+

PlPlmP2+P2a〃,”+P”,+l

由于°<月+P2”田T<1(i=1,2…m),故log?-J------->°

Pi

故”(丫)>8・log?—一+/AlOgj-------------+--+•l°g2-------------+.l°g2—;一,

P.+几,“Pl+Pl+Pln,-XPl+〃2,“

!

由于Pi>0(/=1,2,..-,2/77),所以,>————>0,

'7PiPi+P2m+I

所以>og2—>10g2----------------,所以2•log?—>A-log2----------------,

PiPi+P2tn+IP,P,+P2…

所以〃(x)>”(y).

【典例5・2】(2025・高三・河北•期末)在信息论中,燧(entropy)是接收的每条消息中包含的信息的平均

量,又被称为信息嫡、信源嫡、平均自信息量.这里,“消息''代表来自分布或数据流中的大事、样本或特征.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论