apstatistics知识点square_第1页
apstatistics知识点square_第2页
apstatistics知识点square_第3页
apstatistics知识点square_第4页
免费预览已结束,剩余8页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、apstatistics 知识点 square【篇一: apstatistics知识点 square 】part 1 exploring data(探索性数据分析 )frequency 频数relative frequency相对频数cumulative frequency累积频数symmetric distribution对称分布left-skewed distribution左偏分布right-skewed distribution右偏分布clusters and gaps集群和缺口outlier 异常值mean 均值median 中位数range 极差quartiles 四分位数inte

2、rquartile range四分位差percentile 百分位数standard deviation标准差standardized scores(z-scores)标准计分( z-计分)correlation coefficient相关系数pearsons correlation coefficient皮尔逊相关系数least squares regression line最小二乘回归线dependent variable因变量independent variable自变量predicted value预测值the coefficient of determination判定系数influ

3、ential observation有影响的观测值residual plot 残差图part 2 sampling andexperimentation(抽样和实验设计)population 总体sample 样本sample survey抽样调查census 普查experiment实验设计observational study观测研究biased sampling有偏抽样judgmental sampling判断抽样samples of convenience方便样本volunteer samples自愿样本simple random sampling简单随机抽样systematic sa

4、mpling系统抽样stratified random sampling分层抽样proportional sampling比率抽样cluster sampling整群抽样sampling error抽样误差response bias回答偏差no response bias无回答偏差under coverage bias覆盖不全偏差wording effect bias措辞偏差experimental unit实验单位observational unit观测单位confounding variable混淆变量factor 因子treatment处理control group控制组placebo

5、group安慰剂组single-blind experiments单盲实验double-blind experiments双盲实验randomization随机化blocking( block )区组replication复制,重复completely randomized design完全随机设计randomized block design随机区组设计matched-pairs design配对设计part 3 anticipatingpatterns(预期分布形式)probability概率sample space样本空间tree diagram树形图impossible events不

6、可能事件sure events必然事件complement of an event事件的补事件disjoint or mutually exclusive events互斥事件conditional event条件事件independence独立random variable随机变量discrete random variable离散型随机变量continuous random variable连续型随机变量probability distribution of a discrete random variable离散型随机变量的概率分布cumulative distribution func

7、tion累积分布函数expected value期望值,数学期望probability distribution of a continuous random variable连续型随机变量的概率分布parameter参数statistics统计量sampling distribution抽样分布central limit theorem中心极限定理part 4 statisticalinference (统计推断 )estimation process估计过程estimate估计值point estimation点估计interval estimation区间估计margin of erro

8、r误差界限confidence interval置信区间confidence level置信水平significance显著性statistical hypothesis统计假设null hypothesis零假设,原假设alternative hypothesis备选假设test statistics检验统计量type i error第一类错误type ii error第二类错误rejection region拒绝域non rejection region非拒绝域critical value临界值left-tailed test左尾检测right-tailed test右尾检测two-tai

9、led test双尾检测sample size 样本容量students t distribution学生 t- 分布chi-square distribution卡方分布goodness of fit拟合优度contingency tables联列表ap statistics你需要知道的所有公式!第一部分:必须自己记住的公式第一个是独立随机变量的组合公式,尤其需要注意的是下面那个标准差的公式必须在 x 和 y 独立的条件下才能使用。第二个是各种自由度的公式单样本均值 t 分布时, df=n-1;双样本均值差 t 分布时, df=min(n1-1,n2-1),就是 n1-1 和 n2-1 当中

10、较小的值;回归线的斜率 t 分布时, df=n-2;拟合度的卡方检验时,df=i-1 , i 是分类的总数 ;独立性和齐次性的卡方检验时, df= ( c-1 )( r-1 ), c 是行数, r 是列数;双样本比例差的假设检验中,由于 p1=p2 且未知,所以标准差的公式中,用到的比例 p 如下面第二行所示第二部分:考卷给出的公式(选择和解答都给出)第一页的公式主要是第一章的内容,重点是最小二乘回归线部分(有一些概念题),如果需要计算的话,都用计算器直接算出即可。第二页的公式前两个是概率的加法准则和条件概率的公式,乘法准则可以直接用条件概率的转换出来。三、四是随机变量均值和方差(标准差的平方

11、)的算法,这两个公式是普适的,任意随机变量都可以用。接下来的五、六、七都是二项式分布随机变量的公式,分别是概率分布的计算,以及均值和标准差。最后 4 个是单样本比例和单样本均值的抽样分布的公式。第三页是最重要的了,因为计算器的重中之重就是第四章统计推断部分。最上面的两个是假设检验和置信区间的核心公式,statistic样本统计量, parameter 总体参数, critical value 根据置信水平( t 分布中还要考虑自由度)算出的临界z score或者 tscore 。【篇三:apstatistics知识点square】ap 统计公式 +考点最全整理,背完5 分准到手!散文吧ap 统

12、计公式 +考点最全整理,背完5 分准到手!作为中国考生灰常热门的ap 科目之一, ap 统计牵动着千万考生的心,眼看着后天就要和大家见面儿了,小伙伴们复*的肿 么样啦?ap 统计知识点庞杂、公式繁多,这里给大家做了考前梳理,这么强的助攻贴也是没sei 啦,预祝各位小主儿考出新高度一、描述统计* 数据( data )分为定性数据(qualitative or categoricaldata)与定量数据( quantitativedate)。定性数据:按照类别进行划分,展示对象的属性;定量数据:展示对象的数值特征。* 图( graph ):分为 bar chart, pie chart, dotp

13、lot, stemplot, histogram, boxplot* 通过图形可以看出数据的分布特征:( 1)对称( symmetric )( 2)偏态( skewed )左偏( skewed to the left 右偏( skewed to the right (3)集中趋势(4)异常值)* histogram的画法:(1)以个数作为高度(2)以百分比作为高度(3)以百分比作为面积。* 概率密度( probability density function, pdf描绘以百分比作为面积的histogram的曲线。* 累积分布( cumulative distribution function

14、, cdf)以小于等于该数的数据所占百分比作为该数的纵坐标绘制出的曲线。* 数字特征( numerical value)( 1)描述集中趋势( 2)描述离散趋势( 3)描述位置( 4)标准化变量( z-score )* 众数( mode )一组数据中出现次数最多的数;* 平均数( mean )数据求和后除以数据个数。* 方差( variance )与标准差( standard deviation)衡量数据与平均值偏离程度平方和的平均值。* 标准化变量( z-score )计算方式是将原始数据减去平均数之后再除以标准差,用它可以展示不同度量单位数据的偏离程度。* 散点图( scatterplot

15、 )以一个变量作为横坐标、另一个变量作为纵坐标绘制出的图形,以散点的形式表现在坐标轴中。变量选用单位不同,会造成图形有差异。* 相关系数( linear correlation coefficient)衡量两个量之间线性关系的指标,介于 -1 和 1 之间,负数代表两个变量之间是反向变化的,正数代表两个变量之间是同向变化的,越靠近 0 代表线性关系越弱,越靠近 -1 和 1 代表线性关系越强。它只能衡量线性关系,不能衡量非线性关系;只反应关系,不代表因果。* 回归( regression )寻找代表变量之间关系的数学表达式。* 线性回归假定变量之间存在一次函数的关系(形如 y=kx+b )。此

16、函数在坐标系中图像是一条直线,因此称作线性回归。* 残差( residual )真实值与估计值之间的差。* 残差图( residual plot )以一个变量作为横坐标、该变量所对应的残差为纵坐标绘制出的图形。若两变量之间存在线性关系,则残差图应为无规则的散点。* 最小二乘法( least square )利用残差平方和最小求出直线斜率与截距( k 和 b)的方法。* 线性化( linearity )将非线性关系转换为线性关系的方法,常用有对数变换、指数变换等。二、抽样方法* 总体( population ):研究对象的全体。* 样本( sample ):总体中的一部分。* 参数( param

17、eter ):描述总体特征的指标,一般用希腊字母表示。* 统计量( statistics ):描述样本特征的指标,一般用拉丁字母表示。*普查( census ):对总体中的每一个个体都进行研究。*抽样( sample ):对总体中的部分个体进行研究。*实验法( experiment):对目标群体进行干预而得到数据。*观察法( observation):不对目标群体进行干预而得到数据。实验组( treatment group):对该组中的个体进行干预。*对照组( control group):不对该组中的个体进行干预。*影响因子( factor ):会对实验对象产生影响*变量混淆( confou

18、nded):无法分离因子的影响*协同作用( common response):多个因子共同造成影响*安慰剂():心理作用导致的变化*单盲试验( single blinding):实验者知晓每一个体是否受到预先设置的干预,而被实验者不知晓。*双盲试验( double blinding):实验者与被实验者都不知晓每一个体是否受到预先设置的干预。*简单随机抽样(simple random sampling):随机地从总体中选取个体,每个个体被选到的概率是相等的。*系统抽样( systematic sampling):首先将总体中的个体编号、排序,而后按照固定步长进行抽样。*分层抽样( stratif

19、ied sampling):首先将总体中的个体按照某一特征或标准划分为不同的层(而后从每层中进行抽样。特征是每个层中的个体具有相似性。*整群抽样( cluster sampling ):strata),首先将不同特征的个体划为分一个群(cluster),而后从每个群中进行抽样。特征是每个群具有多样性。三、概率* 频数( frequency):某一结果出现的次数。* 频数( frequency):某一结果出现的次数。* 频率( relative frequency):某一结果出现的次数占实验次数的百分比。* 概率( probability):某一结果出现可能性的大小,介于0 和 1 之间。不可能

20、事件( impossible event )的概率是 0,必然事件( certain event )的概率是 1,但反之不正确,概率为 0 的事件不一定是不可能事件,也有可能发生,概率为 1 的事件也可能不发生。* 大数定律( the law of large numbers):实验次数越大,频率越稳定,且取决于事件本身的概率。* 基本公式:* 条件概率( conditional probability):给定某一事件发生的条件下,另一事件发生的概率。* 随机变量( random variable):该变量的取值取决于实验的结果。*离散型( discrete ):随机变量的取值是一个一个的。*

21、连续型( continuous):随机变量的取值是连续不间断的。*分布( distribution):实验结果出现的规律。*均值( mean )与方差( variance ) :* 二项分布( binomial distribution):将具有两个结果的实验重复多次,求其中某一结果出现次数的概率。* 几何分布( geometric distribution):将具有两个结果的实验重复多次,求其中某一结果首次出现时实验次数的概率。* 正态分布( normal distribution):代表常规现象出现次数多、极端现象出现次数少这样一种规律。* 标准正态分布( standard normal

22、distribution):均值为 0、方差为 1 的正态分布。* 抽样分布(sampling distribution):多次抽样后,样本统计量的分布规律。* 标准误( standard error):统计量的标准差。* 单总体样本比例的抽样分布正态分布:双总体独立样本比例差的抽样分布:单总体样本均值的抽样分布:双总体独立样本均值差的抽样分布:四、统计推断* 参数估计( estimation):利用统计量去预测参数。* 区间估计( interval ):给出参数的范围。* 置信水平( confidence level):对参数多次进行估计得到多个区间,其中区间中包含真实参数的次数占估计次数的比例。* 单总体比例区间估计:* 双总体比例差区间估计:* 单总体均值区间估计:此时需考虑总体方差是否已知:(1)若已知则使用正态分布进行估计(2)若未知则使用 t 分布进行估计。* 双总体均值差区间估计:此时需考虑总体方差是否已知(1)若已知则使用正态分布进行估计(2)若未知a.总体方差不等( pooled=no )b. 总体方差相等(pooled=yes),则使用t 分布进行估计,但所用自由度与方差皆不相同。* 假设检验( hypothesis

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论