版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、以社会科学为主体,发展随机抽样 关键词:随机抽样;社会调查;总体;代表性;抽样框;抽样单位文献标志码:A 我国社会科学界的主流认识是:社会调查应该寻求对于总体的代表性,因此必须进行随机抽样(风笑天,1987,2005;袁方、林彬,1990;高嘉陵,1996;陶冶,1997;郑杭生,2001;胡仕勇、叶海波,2003;李金昌,2004),而随机抽样的原则与方法则全部来自于统计学,社会科学的分析与探讨仅限于如何更好地贯彻执行之(边燕杰等,2001)。 笔者的问题是:这样做就足够了吗?随机抽样并不是一个纯技术手段,而是一种认识论与方法论。我们社会科学必须
2、从这样一个高度上对它进行哪些反思?促进它向什么方向发展? 一、抽样终端:从“单独个人”走向“社会基本单位” 目前中国几乎所有社会调查中的随机抽样,其终端都是具体的个人,就是一个人一个人地抽取样本。只要我们严格按照各种随机抽样方法操作,那么抽取的结果就足以代表某个总体;这一点在社会科学界从未遭到过质疑(陈膺强,1993;Joseph Maxwell,1996;Marshall,MN,1996;谢俊贵,2000;车文辉,2002;边燕杰、李路路、蔡禾,2006)。 这一统计学论断的背后的元假设是:每个个人都可以而且应该是孤独地存在的,因此把其中的一些人分别地抽取出来之后,并不会影响他们的特质。这些
3、“单独的人”的相加结果仍然可以代表总体。这其实就是还原论(段培君,2002)的突出标本。 这当然符合以物为主要对象的统计学的道理与逻辑。可是,它符合我们社会科学主张的“人是处于环境、关系与历史之中的”这个基本信念吗? 因此,笔者的疑问是:如果明明是不可能孤独存在的个人却被当作单独存在的物体来分别地抽取,那么无论抽样的结果如何随机,它所代表的,究竟是一个在生活中足够真实的、只能存在于环境、关系与历史之中的“社会人”的总体,还是一个具有无法测定的抽象性与虚拟性的“总人口”?即使我们不厌其烦地进行过无数次随机抽样调查之后,我们对于任何“社会人”的了解恐怕也不会增加。 进一步说,定量研究的社会科学家最
4、应该关心的,恐怕既不是“总人口”,也不是“社会人”的总体,而是“中国社会”(刘少杰,1998;王小章,2002;骆玲,2005)。可是目前中国社会科学界通行的随机抽样的方法却恰恰无法反映更无法代表这样一个总体,这不仅仅是因为它的终端根本就不是任何一个层次上的“社会”,更是因为“生物人”的简单相加无论如何也不是一个“社会”。 再进一步说,我们使用随机抽样调查数据进行相关分析所获得的结果,恐怕既不是“社会之间的关系”,也不是“社会中人与人的关系”,而是“单独人之间的关系”。 国内新近流行起来的多层次统计分析的技术(Goldstein H.1995;Judith D.John B.,2003),虽然
5、可以帮助我们更多地了解所处的环境对于个人行为的影响,但是它仍然把个人作为抽样终端,所以仍然回答不了上述的疑问。换言之,如果不发展现有的随机抽样方法,那么再高级的统计技术也仍然无法弥补把“单独个人”错当作“社会中人”、把人的简单相加错当成“社会”这两大失误。 这其实是统计学的一个缺失,它还没有给我们社会科学家提供一个适用的工具,来反映我们所需要的“社会中人”与“社会”的可量化的抽样手段。但是反过来说,这也是因为我们社会科学的主流长期以来仅仅是跟着统计学的屁股跑,过于迷信随机抽样这个技术手段及其所谓的代表性,丧失了我们的主体性。结果,这两个学科共同陷入了固步自封。 我们为什么不可以按照家庭、亲友圈
6、、社区、群体、阶层、民族等等人类社会的其他单位来进行随机抽样呢?或者说,作为定量研究的社会科学家,我们认为究竟是什么样的基本单位共同组成了“中国社会”这个总体呢?至少在社会科学界,笔者没有看到“所有个人直接组成社会”这样的论述,因此如果我们坚持随机抽样到个人,实在是没有什么意思。 国际上有一些学者在调查家庭情况的时候,把家庭作为抽样终端,然后抽取其中的一个人来表述整个家庭(而不是仅仅他自己)的情况。这并不仅仅是由于他们的研究目标是家庭,而在于他们落实了“家庭是社会的细胞”这一社会科学的经典命题。这启发我们应该努力去寻找更加合适的终端以及寻找它们的随机抽样方法。 就此,笔者贸然提出自己的一些建议
7、,哪怕目前还做不到操作化也罢。 我们可以考虑把随机抽样的终端从“个人”扩大到各种层次上的“社会基本单位”,对某些“社会的总体”进行测量。沿着这样的视角,相信我们社会科学可以促进统计学去发展随机抽样的理论与方法,甚至社会科学自己领先一步也还是有可能的。 例如,如果我们希望调查“中国人的流动机制”这样一个问题,那么我们完全可以把随机抽样的终端确定为全国的数百个社区,在每个社区里不再随机抽取任何个人,也不再使用仅仅针对个人情况的问卷,而是使用专门为此而设计的问卷,找到数个“关键知情人”,请他们来讲述作为一个
8、整体的这个社区的人口流动的机制。 这样,我们通过统计分析这数百个社区的资料,同样可以得出具有代表性的量化认知。只不过这时候的总体已经不再是“中国总人口(所有个人)”,而是“中国的所有社区”。显然,后一个总体更加符合我们社会科学的研究需要。 二、抽样框:从追求代表性走向力争信息无限丰富 众所周知,中国目前现存的、足以据此划分人群的统计资料非常缺乏,再加上许多人群都是分散的或者隐蔽的,因此也就无法得到他们的抽样框,无法对他们进行随机抽样(边燕杰等,2001)。结果,我们现在所说的任何一个范围之内的随机抽样,实际上只不过是跟着现有的统计资料(例如人口普查数据)所拥有的那些指标走,其抽样结果及其代表性
9、都是人口学意义上的各式各样的“总人口”,而不是社会学意义上的阶层、群体、人群。 这种情况往往被视为随机抽样方法的局限性,甚至被反过来认为是社会学家的局限性,认为社会学家应该努力去建立这样的按照人群来 制定的抽样框。 可是,除了特定的人口学指标所代表的“总人口”之外,我们真的能够建立起对于任何一种符合社会科学定义的人群的抽样框吗?作为中国社会学的主要分支学科之一的社会分层研究,重要的产出之一其实就是要确定各种人群的分类指标,而这些新指标一定是各种现存的人口学资料里所没有的。所以,如果我们希望使用随机抽样的方法来调查任何一种社会人群,那么在逻辑上就讲不通。也就是说,虽然我们可以在人口学的抽样框中使
10、用随机抽样调查来确定我们希望了解的某个人群的分类标准是什么,却无法根据这样的分类标准去建立一个抽样框再进行随机抽样去调查这个人群。例如,我们可以随机抽样地调查出“当今中国的工人”究竟应该如何划分,却无法随机抽样地去调查我们所划分出来的“当今中国的工人”。 即使将来的总人口统计资料中的可分类指标无限地丰富了,也仍然解决不了这个逻辑上的矛盾。其中的道理只有一个:社会科学所要研究的一切目标人群,都不是天然地、客观地存在着,也不是自发地、人口学意义上地产生出来,然后等着我们去调查。它们其实只不过是我们社会科学的研究成果所建构出来的。 因此,现有的统计资料其实根本无法给我们提供任何可用的抽样框。或者反过
11、来说,只要我们仍然沿用目前的随机抽样的方法,那么社会科学就会永远跟着社会既有框架亦步亦趋。 最近在国际上出现而且正在引进中国的“被访者推动抽样方法”,就是试图解决“在没有抽样框的情况下如果抽取有代表性的样本”这个根本问题。 笔者不讨论这个具体抽样方法,而是从该方法中提出一个相反的思路:既然没有抽样框,那么我们社会科学家为什么一定要去追求“代表性”这个目标,而不是去寻求“某个研究对象的信息的无限丰富性”呢?也就是说,对于我们社会科学来说,最重要的认知是什么?仅仅是各种已知的情况在总体中究竟占了多大的比例,还是在总体中究竟存在着多少种与什么样的未知情况? 前一个目标仅仅是“测量”,后一个目标却是“
12、发现”。笔者以为,“发现”才是社会科学家更擅长完成的任务,也是社会科学区别于统计学的安身立命之本。 如果这一命题足以成立,那么我们社会科学家也许就可以这样做:在随机抽样的各个抽样层次中,坚持寻找抽样框,坚持使用随机抽样方法。但是在末端抽样层次上,我们改为使用“信息饱和”的抽样方法。 随着电脑辅助调查方法的日臻成熟,使得这种抽样方法的可操作性极大地提高了。 例如,在全国调查中,我们可以坚持随机抽样到社区,但是在社区内却并不一定要随机抽样到个人,而是使用“最大差异”“抽样法”来寻找被访者。如是,我们在数百个社区里所获得的信息,就足以汇总为具有全国地理分布代表性的“最丰富的信息”或者“相对饱和的信息
13、”,而不仅仅是各种绝对数与比例。这,可能才是社会科学最需要的。 笔者在这里仅仅是提出一个新的思路,因此就不在操作的层次上展开了。 三、代表性:从“抽象人”走向“社会人” “随机抽样足以代表总体”这个命题,其实是说,只有把所抽取的个人作为一个“抽象的人”(整体的计量单位)来统计的时候,这些人才能够代表总体。反之,如果我们把这些人进行任何一种分类,那么对于其中任何一个分类的统计结果就不再具有代表性了(卢山,2004)。 例如“性别”这个变量,在我们的随机抽样样本中与在中国总人口中,男女的比例都是大约各半。这当然足以代表中国总人口的状况。但是分别来看,其中的那大约50的男人或者女人,却并不能代表中国
14、所有的男人或者女人,因为我们并没有把男人与女人分开,单独地对每个性别进行随机抽样。 可是,社会科学里从来也不存在仅仅作为计量单位的“抽象的人”;从来都是把人进行各种分类之后再进行统计的。结果,当我们千辛万苦地做完随机抽样,追求到一个“总体代表性”之后却发现:不管我们说“男人是什么情况”还是“女人是什么情况”其实都是不具有代表性的,而且无论我们讨论哪个社会分层的情况都是这样的。 那我们为什么还要费劲儿地进行随机抽样呢? 尤其是,我们社会科学研究的本质特征不是单变量统计,而是进行相关分析。那么,我们怎么能
15、够认定我们所引入分析的那些相关变量中的各个分类也具有代表性呢?例如,我们的统计结果是“农民的性别与是否进城打工存在着相关关系”(男农民进城打工的更多),可是这一发现却既不能代表“男农民”这个总体,也不能代表“进城打工者”这个总体。结果,我们根本就无法论证我们所发现的这种相关关系具有任何普适性。 统计学的解决方法是进行分层抽样。在社会科学可操作的意义上,就是在末端抽样层次(通常是社区)中,我们应该努力地按照社会学最珍视的“五朵金花”(性别、年龄、文化程度、职业、收入),尽可能多地进行分层抽样而不是简单随机抽样。 可是,且不谈操作可能性,问题在于,即使这样分层抽样出来的样本,也仍然是仅仅在“抽象人
16、”的意义上具有代表性,只不过所代表的是一个分层的总体而不是更上一级的总体。可是在分层样本的任何行为或者事实的层次上,我们的调查结果仍然不具有代表性。也就是说,如果我们要调查的问题足够深入,又追求统计结果的代表性,那么我们就必须不断地分层下去,直到我们陷入“把调查目标作为自己的分层抽样指标”这样的泥坑为止。 总之,随机抽样其实只是使我们获得了调查地点的地理分布的随机性与该调查地点内的个人分布的随机性;可是在该调查地点内,我们社会科学所最需要的、调查样本的各种社会属性的代表性,却基本上无法获得。 因此,社会科学应该择其优而弃其劣。笔者提出一个新的思路,暂不做操作方法的展开。 在一个相当小的末级抽样
17、层次(例如万人口的社区)中,如果仅仅抽取很少的人(例如有的全国调查在每个社区仅抽取10人),那么我们采用细致的分层比例分配抽样法而不是随机抽样法,所损失的仅仅是“抽象人”对于末端抽样层次的完全代表性,所获得的却是具有分层属性的“社会人”的可保证数量,同时保留了调查地点的地理分布的随机性。 当然,统计学肯定有无数方法来论证这种抽样方法的“失”,但是社会科学也有充分的本学科理由来看重它的“得”。问题仅仅在于我们社会科学应该在这一点上与统计学展开充分对话,而不是削足适履。 四、代表什么?从“总体”走向“整体” 随机抽样的最大作用,就是足以代表某个总体,可是笔者对它的根本质疑也是由此而生。这可以分为两
18、个层次来看。 在技术的层次上,无论我们在上述的各个方面做出多么大的发展;我们所获得的所谓“总体状况”,其实还是把众多的局部情况进行相加而得到的。一切随机抽样技术与加权技术都不能改变这一性质。 可是,系统论认为“整体大于部分之和”,而且整体与部分之间的关系并不是简单相加,而是 有机合成(贝塔朗菲,1987;黄欣荣,2004)。因此,如果说随机抽样的结果确实足以代表客观事物的某个总体的状况,那么把它运用于任何由人类及其活动所组成的总体的时候,难道就不需要任何修订吗?或者说,如果系统论已经对随机抽样的理论根基提出了挑战,那么社会科学也就应该以反思与发展来代替对它的顶礼膜拜了。 进一步从认识论的层次来
19、看,社会科学最需要研究的恐怕并不是任何一种统计学意义上的总体,而是某个作为社会存在的整体。这仅仅是因为前者往往并不真实存在而仅仅是研究者的建构产物,而后者却是社会科学最主要的研究对象。 随着“整体研究”的视角在我国得到越来越多的介绍与提倡(郇建立,2001;王宁,2002;刘中起、风笑天,2002;刘军,2006;刘水林,2006;张天上,2006),我们社会科学不得不从系统论的高度来反思随机抽样。 社会科学家应该清醒地意识到:如果统计学暂时还不能给我们拿出一个系统论指导下的、足以反映整体状况(而不仅仅是总体)的随机抽样方法来(杨心恒、顾金土,2000),那么我们也就不应该简单地排斥各种非随机
20、抽样方法。我们恰恰应该反过来好好研究一下:非随机抽样中究竟蕴含了一些什么值得发掘的内容?它的抽样结果固然与“总体”无关,但是是否却有可能与“整体”有关呢? 例如,在关于“典型抽样”的争论中,我们社会科学不应该再把随机抽样奉为唯一的判断标准(王宁,2002),而是应该深入讨论一下:如果“典型”确实是出于对“整体”的准确认识而选定的,那么它对于“整体”的表现性是否反而更强一些呢?这种“表现性”是否可以进一步建构为“对于整体(而不是总体)的质的代表性”呢?如果回答都是肯定的,那么我们就可以进一步研究典型抽样与随机抽样之间的关系,无论是把两者组合、结合、整合还是融合,或者论证出其不可能,都将是社会科学的原创性的贡献。 五、小结与引申 本文不是为了颠覆,而是为了深入;说白了其实就是一句话:我们不是随机抽样方法的奴隶,而是它的园丁。 从技术的层次上说,社会科学应该创造出符合自己需要的新方法;从认识论的层次上,我们则应该把随机抽样灌输给我们的还原论的世界观与方法论,努力推向整体论与系统论的新阶段。笔者的价值取向也已经在本文中表露无遗:社会科学应该作为主体,发出基于自己立场与利益的“非科学的”声音。 操作的困难
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鼓胀护理病例讨论分析
- 输尿管双J管护理的质量控制
- 中医护理操作中的无菌技术
- 门诊护理工作流程解析
- 2026年月度业绩报告提醒函(3篇)
- 医院跌倒应急预案方案
- 高校学生心理健康教育与咨询指导书
- 下一季度技术研讨会邀请函(5篇)
- 高血压肾病的预防性护理策略
- 2026年市场营销师三级职业鉴定题库
- 广东广州2012-2024年中考满分作文130篇
- DGTJ08-2271-2018 工程物探技术标准
- 监狱安防报警管理制度
- 2024年中考科学易错点随身记(新统考)
- 2025年高考历史一轮复习“近代中国革命史”核心考点梳理
- 四川乐山市中区2025届高三下学期联合考试语文试题含解析
- 临床用血储备计划制度
- 2024年中国辅酶Q10胶囊行业投资分析、市场运行态势、未来前景预测报告
- 急救医疗管理系统(紫云)
- NB-T31111-2017风电机组高电压穿越测试规程
- 公园设施维修投标方案
评论
0/150
提交评论