社会统计学笔记 (一)_第1页
社会统计学笔记 (一)_第2页
社会统计学笔记 (一)_第3页
社会统计学笔记 (一)_第4页
社会统计学笔记 (一)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章科学方法与社会研究历程

1•社会学研究:就就就是运用科学得方法来搜集和分析社会事实,以理解社

会现象之间得关系。

2・科学研究:就就就是运用客观得、逻辑得和系统得方法来搜集事实及分

析事实。

3•社会学研究得整个历程,大致上可以分为三个阶段:(1)筹划,(2)执行,(3)总

结。

4•初步探索步骤:⑴收集有关得文献,(2)咨询那些对列完得题目有经验、有知

识得人,进行了解,⑶观察个案。

5・假设:就就就是根据我们对问题得了解,假定现象与现象之间得关系,就

就就是假定某一现象得变化与另一种现象得变化具有某种关系。

假设得方式:函数式(要求变犷之魏会药■高依之初、W女以不存在高低之分)

6•较为常用得研究方式:实验法、社会调查法。〈皆可险证假设)

①实验法得逻辑:有意得改变A变项,然后看看B变项就就是否随着变化;如果

B变项显然就就是随着A变项得变化而变化,就说明A变项对B变项有影响“

②社会调查法特点:在研究过程中不改变社会现状,只求就地取材,然后以统计

方法推算变项与变项之间得关系。

7•能够有效地验证假设得实验法称为典型或理想实验法

8•社会调查法可以分为两大美一就就是叙述性调查(乖点,就咸定灰造疝会

事实,较少分析社会事实(即变项)之间得因果关系)「就就走岷粹性谪查(目得就就

是要证明不同得变项之间就就是否有因装关系)。

9•全体调查:就就就是从所有研究对象中搜集资料。

抽样调查:就就就是从全体得研究对象中科学得抽出一个数目较少得样

本,然后据此样本得资料推论全体得情况。

10•个案研究:就就就是选择一个或几个个案(中审变对象),作深入得接触和

观察,目得就就是对所研究得问题作深入得了解。

11•横剖研究:指得就就是在同一时期搜集资料,目得就就是理解各种社会现

象(少变现在某时期得相关情况得研究。

纵贯研究:就就是指在不同时期搜集得,目得在了解社会现象(中变则在

不同时期中得变动情况得研究。

12•纵贯研究分为两种:趋势研究、机组研究人指得就就是在不同时期调查相

同得样粕。

同组分析得问题:遗失个案得问题。同组研究要求调查相同得个案,但在

第一次调查得样本可能在第二次调查时一部分已丢失。

13♦指标合并方法:类型法、指数构成法、尺度法

①类型法:就就是将各指标交互分类。

②指数构成法:就就是用简明而合理得公式,来综合各指标。

③尺度法:就就是据各指标之间得关系来计算总值,使研究对象高低

有序。

14•个人变项:以个人为研究对象得变项。

群体变项:以地区或群体为研究单位得。

15•区群谬误:以群体研究单位研究得出得结论推论到以个人为研究单位时所

犯得错误。

微体谬误:以个人为研究单位,把研究结论推及于群体或整个社区时所

犯得错误。

16•定类层次:就就是指变项得值只能把研究对象分类,即只能决定研究对象

就就是同类抑或不同类,具有=与/二得数学特质。

定序层次:就就就是能确定值得次序,即变项得值能把研究对象排列高低或大

小,具有〉与v得数学特质。

定距层次:就就就是能确定值与值之间得距离,即变项之值与值间得距离就就

是可以知道得,因而具有加与减得数学特质。

定比层次:最高得测量层次,其数值中得零就就是绝对得、固定得,因而除了上

面讲得特质之外,也具有乘与除得数学特质。

17•界定母体:就就就是清楚说明研究对象得范围,即所研究得人物、时间和

地点。

18•统计方法分两类:叙述统计法(获劭商化笏野岸方法)、推论统计法(就,就就

是根据抽样取出得资料推论出母体得情况)。

19•试点研究:即拍取若干研究对象来试验整套计划就就是否可行。

20•搜集资料得方法:访问、观察和档案资料,

固定答题:就就是由研究员预先设计了若干可能得答案,由答者选择。

自由答题:就就就是让答者随着自己得意思回答,研究员不提供可能得答

案。

优缺点比较:固定答题得好处就就是便于统计分析,但所提供得答案不

一定适当。自由答题得好处,就就是让答者充分表达她得意思,较为准确,但答者可

能啰嗦和花样众多,访问时费时间且分析起来也不容易。

观察法:就就就是以耳闻目睹得方式,实地了解研究对象得行为。

观察法分为:参与观察法和非参与观察法。

①参与观察法:就就就是研究员要参加所研究得活动,从而获取资料,其身

份好像一位情报员。

②非参与观察法:就就就是研究员得身份就就是旁观者。

21•整理资料时,一般分为两步:校对(前就就光查看的政亲岸苑料有没有镯、

端琏式把资料作简明得记录和分类)Q

22•测量效度:就就是指所得得资料就就是否与测量得目标相吻合。

测量信度:就就是指用相同得方法重复测量变项时得资料就就是否吻

合。

信度高不等于效度高,因为重复得测量所得得资料和使就就是吻合得

(信发勖,却可能就就是重复得错误(效发匐。

第二章简化一个变项之分布

1•集中趋势测量法:就就就是找出一个数值来代表变项得资料分布,以反映

资料得集结情况。意义在于可以根据这个代表值(或裾典/©来估计或预测每个

研究对象(卒介狗得数值。

①众值:就就就是次数最多得值。1以长远来说,以众值做预测所犯得错误总数

就就是戢小得]

②中位值:就就就是在一个序列得中央位置之值,即高于此值得有50%得

研究个案,低于此值得也有5"/。。(长远来说,以中位值去估计定序变量得数值,所犯

得错误总数就就是最小得}

③均值:将变项得各个数值相加,求取一个平均得数值。[长远来说,以均值

估计定距变项得资料,错误最力

2•离散趋势测量法:就就是要求出一个值来表示个案与个案之间得差异情

况。

①离异比率:就就就是非众值得次数与全部个案数目得比率。

②质异指数:其作用就就是求出各个类别之间在理论上最多得可能差异

中实际上出现了多少差异。

③四分位差:就就是将个案由低至高排列,然后分为四个等分,则第一个四

分位置得值与第三个四分位置得值得差异。

3•离散趋势测量法与集中趋势测量法就就是有互补作用得。二法并用,就可

以一方面知道资料得代表值,有助于估计和预测得工作,另一方面可以知道资料得

差异情况,反映估计或预测时会犯得错误。

4•标准正态分布:以标准差为单位得正态分布。均值就就是0,标准差就就是

1

第三章简化两个变项之分布

1•相关:就就是指一个变项得值与另一个变项得值有连带性。换言之,如果一

个变项得值发生变化,另一个变项得值也有变化,贝!两个变项就就就是相关了。

正相关:就就是指一个变项得值增加时,另一变项也增加。

负相关:就就是指一个变项得值增加时,另一变项得值却减少O

2•不对称关系:X影响Y,而Y不会彩响X。

对称关系:不确定或不区分影响得方向。

3•交互分类:同时依据两个变项得值,将所研究得个案分类。

列联表:综合r两个变项得共同分布得统计表。

条件次数表得缺点:难于比较不同条件下得次数分布,这就就是因为作为

基数得边缘次数得值各不相同。因此,为求相互比较从而知道两个变项间得关系,

就必须将各个基数标准化。将所有基数都变成100,各个条件次数就随而变为百分

率。

4•在制定条件百分表时得准则:挣个表得顶端要有表号和标题。绘表时所用

得线条,要尽可能简洁。在表上层得自变项每个值之下得%号,表示下列得数值都

就就是百分率。表下层括弧内得数值,表示在计算百分率时所根据得个案总数。

表内百分率数值得小数位要保留多少,视乎研究得需要,但最好就就是有一致性。

以自变项作为计算百分率得方向,就就是社会学研究得常规。然而,也有例

外得情况:如果依变项在样本内得分布不能代表其在总体内得分布,则百分率得计

算要根据依变项得方向。

5・相关测量法:就就就是以一个统计值表示变项与变项之间得关系。这个值,

通常称为相关系数。

第四章相关测量法与测量层次

1•Lambda相关测量法,又称为格特曼得可预测度系数,基本逻辑就就是:以

一个定类变项得值来预测另一个定类变项得值时:如果以众值作为预测得准虬可

以减少多少误差。

Lambda相关测量法得特点就就是:以众值作为预测得准则,不理会众

值以外得次数分布。

2•级序相关法得基本逻辑就就是要求出:根据任何两个个案在某变项上得等

级来预测她们在另一个变项上得等级时,可以减少得误差就就是多少。

同序对:某对个案在两个变项上得相对等级相同。

异序对:若果不相同则称为异序对。

3•肯德尔得tau系数得基本逻辑:计算同序对数与异序对数之差在全部得

可能对数中所占得比例。

4・斯皮尔曼rh。系数得特点:就就是在计算每个个案在两个变项上得等级

时,不仅要区别二者得高低差异,而且还要计算二者差异得确切数值。

基本逻辑:求出在最大可能得等级差异总值中,实际得等级差异所占得

比例就就是多少。统计值就就是由-1到+1,其平均值有PRE性质。

5•简单线性回归分析法:根据一个直线方程式,以一个自变项得数值来预测

一个依变项得数值。

目得:就就是要找出一个错误最小得方法来预测依变项得数值。

回归系数b得大小,就表示X对Y得影响有多少。如果b=0,表示X对Y没

有影响,即X变但Y不变。如果b值越大,就表示X变化时所引起得Y变化愈大。

b值有正负之分:如果就就是正值就表示X对Y有正向效果,即X增大,Y也增大;

如果就就是负值就表示X对Y有负向效果,即X增大,Y却减少。

b值就就是表示自变项对依变项得影响得大小和方向。她就就是一个分析不

对称关系得统计法。

6-积矩相关系数r与b系数得不同:r系数假定X与Y得关系就就是对称得,

而且r得统计值就就是由-1到+1,同时r得平方值具有PRE性质。这个r平方值,

称为决定系数。

r系数得意义:r系数所要表示得,就就就是以线性回归方程式作为预测

得工具时所能减少得误差比例。囚此,如果1系数值愈大,就表示线性回归程式得

预测能力愈强。

7•相关比率(era/方京翔:就就是以一个定类变项为自变项,以一个定距变

项为依变项。她就就是根据自变项得每一个值来预测或估计依变项得均值。Eta

系数由0到+1,其平方值具有PRE性质。

8•区分系数(又新小em系翔其基本逻辑:根据各个个案在定类变项上所属得

类别来估计她们在定序变项上得相对等级,故此时属于不对称相关得测量法,其

系数值就就是由0到+1,没有PRE性质。

第五章抽样与统计推论

1•统计值:从样本中计算出来得数值

参数值:在总体中得数值。

代表性样本:样本得统计值近似总体得参数值,这个样本可以称为代表性

样本。

2・抽样步骤:①界定总体(总依序定义,忿滑走忿好。有样本所得得研究结果,

原则上只能推论到这个所界定得总体范的②稷宗全受白卑(必须审核其完整性

和准确怜•③法足秣底柱如"决定样本大小得一般准则:根据所能付出得研究代

分殍表大藤发荆坡成大殍存本);④选取样本个案;⑤在收集资料之后,评估样本之

正误。

3•抽样可以分为:随机抽样法与非随机抽样法,前者就就是随着一定得几率来

抽样,后者则不受几率得限制。两者之中,只有随机抽样法可作统计推论O

非随机抽样法:立意抽样法;偶遇抽样法;定额抽样法。

①立意抽样法(判定为樗涉:就就是依据研究员得主观见解和判断,选取

她认为就就是典型得个案。

②偶遇抽样法(方便孙存法):就就是选取一些偶然遇见得个案为样本。

③定额抽样法:就就是根据某些标准将总体分组,然后用立意或偶遇抽样

法由每组中选取样本个案。

4•随机抽样法得特点:就就是根据已知得几率来抽取样本个案。

①简单随机抽样:她要求每个个案被选取得机会就就是相同得。

②系统随机抽样:首先将全部个案排列起来,按抽样比例分成间隔,并在第

一个间隔内选取第一个个案,然后每经一个间隔就选取一个个案。

周期性偏差:当我们每隔若干个案便抽取一个时,这些被抽取得个案可能

具有某种特征,与不被抽取得个案有所不同。

解决方法:经过若干间隔以后,再用随机方式抽取个案,以新得秩序取代原

来得秩序。

③分层随机抽样:定比分层随机抽样;异比分层随机抽样。

定比分层随机抽样:首先将总体按某些标准分组,然后在每组中按照相同

得比例用简单随机或系统随机抽样法选取个案。

异比分层随机抽样:在不同得组中用不同得比例来抽样。I如果在总体中

某些组得个案数量特别少,按相同比例抽取得样本个案就会很少,以致影响统计分

析得准确性,此时采用异比分层随机抽枪

④集体抽样法:即随机得抽取若干集体,然后以她们所包含得全部个案作

为研究得样本。

评价:集体抽样得好处就就是代价小。特别适用于大规模得抽样调查。

然而,以集体作为抽样骞单位,所犯得抽样误差会比较大,样本得代表性通常就就

是比不上用简单或分层随机抽样法。一般来说,如果每个集体内得各个个案之间

得差异较小,而集体与集体之间得差异较大,则集体抽样法所犯得误差会较大,相

反得,如果集体内差异大,而集体间差异小,则抽样误差会较小。

⑤多段抽样:即先抽取若干集体,然后从所选取得集体中再抽取若干较小

得单位。

5•抽样分布:就就是根据几率得原则而成立得理论性分布,显示由同一总体中

反复不断抽取不同样本时,各个可能出现得样本统计值得分布情况。

6•均值得抽样分布得特征:①如果样本相当大,则抽样分布接近正态分布;②

抽样分布之均值就就就是总体之均值,抽样得分布得标准差称为标准误差。

7・统计推论分为:参数估计和假设检定

参数估计:根据一个随机样本得统计值来估计总体之参数值就就是对

少。

假设检定:首先假设总体得情况就就是怎样得,然后以一个随机样本得统

计值来检险这个假设就就是否正确。

参数估计与假设检定,虽然都就就是用来作统计推论,但在逻辑上略有不

同:前者就就是先看样本情况才问及总体得情况,后者则先构思总体得情况,然后

才进行抽样和检定原先得设想就就是否正确。

第六章参数值得估计

1•点值估计:以一个最适当得样本统计值来代表总体得参数值。

2•间距估计:以两个数值之间得间距来估计参数值。至于间距得大小,就要

取决于我们在估计时所要求得可信程度就就是多少。在样本大小相同得情况下,

如果要求得可信度愈大,则间距就会愈大。这个间距通常称为“可信间距”

间距得大小与可信度得高低成正比。

3•可信度已经确定得前提下,提高间距估计得精确性得方法就就是加大样本

容量因为随着样本容量得加大,S/,n将逐渐变小,因此间距估计得间距也逐渐

变小,而精确度则逐渐加大。

第七章假设检定:均值与百分率

1•研究假设:假设在总体中存在某些情况,如假定X与Y就就是相关得。

与研究假设相对立得假设,在统计学上称为虚无假设。

检定假设得基本原则:直接检定虚无假设,因而间接地检定研究假设,目得

就就是排除抽样误差得可能性。

2•否定域:抽样分布内一端或两端得小区域,如果样本得统计值在此区域范围

内,则否定虚无假设。

3•显著度:表示否定域在整个抽样分布中所占得比例,也即表示样本得统计值

落在否定域内得机会。

显著度愈小,便愈难否定虚无假设,也即愈难证明研究假设就就是对得。

4•甲种误差:就就是指否定虚无假设,但实际上虚无假设就就是对得错误可能

性。

乙种误差:就就是指不否定虚无假设,但实际上虚无假设就就是不对得错

误可能性。

甲种误差与乙种误差就就是对立得,成反比得。

5・统计法得检定力:就就是指该统计法能够准确得判断虚无假设得正误之

能力。

参数检定法得特点:就就是要求总体具备某些条件。

非参数检定法(分循方的检定法)特点:不要求总体数值具备特殊得条件。

6•检定假设得步骤:①根据研究假设成立于其对立得虚无假设。明确检定

得目得就就就是要否定虚无假设,从而知道研究假设就就是对得可能性;②选择适

当得检定统计法,并要列举其假定或要求;③确定抽样分布;④决定显著度,并依据

研究假设得性质选用一端或两端检定,然后从抽样分布中求出否定域得位置和大

小;⑤根据样本得资料计算检定值,从而作出决策。

7•假设得检定得基本逻辑:先设立虚无假设:进而以此为基础来确定抽样分

布。倘若我们所抽取得一个随机样本中得均值,在以虚无假设为基础得抽样分布

中出现得机会就就是很小得,那就理应否定虚无假设,改而接受研究假设。

8•自由度:就就是指有多少个个案得数值可以随意变更。

第八章假设得检定:两个变项之相关

1•预期次数(e):就就是指在总体中两个变项没有关系得话,表内没格所应有

得次数。简而言之,表内每格得预期次数(c),也就就就是相应得两个边缘次数得乘

积除以样本得大小。

2•单因方差分析中得F检定其目得:就就是要推算在各组总体中得均值就

就是否相等。

3•异:相关测量法,目得就就是要理解两个变项在“秣M1随机与非随机样

木均刃中得相关“强弱”程度。检定假设得方法,则就就是根据“随机”样本得

资料来推论两个变项在“总体”中“就就是否”相关。

检定假设方法得共同点就就是:只适用于随机样本,不能用于分析非道机

样本;其关心得都就就是总体得情况,而不就就是样本得情况;目得都在了解在总

体中就就是否相关,而不就就是相关得强弱程度。

4•任何得假设检定法,都就就是样本愈大就就是愈容易否定虚无假设。

两变项得测量层次相关测量法(PRE)假设得检定

定类——定类X,tau-yx2检定

定类——定序

定序——定序G,dyZ检定或t检定

定类——一定距EF检定或t检定

定序——一定距

定距一一定距r,b

第九章详析模式与统计控制

1•多变项分析可依研究目得分为三大类:详析分析;多因分析;多项相互关系

分析。

①详析分析所关心得就就是两个变项得关系,而引进其她变项得目得就

就就是为了加深了解这两个变项得相关性质。

②多因分析得目得:就就是要理解多个自变项对某个依变项得共同影

响与相对效应。

③多项相互关系分析得目得:则就就是为求简化众多变项之间得相互关

系O

2•详析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论