版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、20130113B不同语言研究阶段的不同方法运用一.获得语料1. 通过观察获得语料的方法2. 通过实验获得数据的方法二.处理数据1. 描写统计语料的方法2. 推断统计语料的方法三.储存、查询语料1. 储荐语料的方法2. 查询语料的方法20130113B获得语料厦门大学中文系 苏新春 通过调查获取语料的方法20130113B 通过调查获取语料的方法1. 举例法2. 田野调查法3. 个案调查法4. 社会学调查法5. 不同语言成分鉴别法6. 抽样方法7. 语言态度调查20130113B举例法o 最常用、最普遍,也最经济、省力的方法,然而局限性也最大。主要局限:1. 主观性强;2. 缺乏普遍性;3.
2、以偏概全;20130113B田野调查法o 调查者将自己融入被调查者的群体生活中,真实地观察、记录被调查者的语言状态。1.方言调查。调查点、发音人2. 口语调查(陈建民的北京口语: 从70年代中期开始,陈建民开始对北京口语的研究,提着录音机到北京的工厂、农村、部队、学校和街道录取口语材料,先后写成了说和写(1979)、小学口语教学(1981),汉语口语(1984)则是这一研究的总结。 20130113B个案调查法儿童语言习得调查(李宇明):儿童语言的发展(95年6月)、语言的理解与发生(98年5月)。后者以汉语的问句系统为材料,综合运用群案横向实验和个案纵向观察的方法,深入考察了汉族儿童语言理解
3、和语言发生问题,概括出许多有关儿童语言发展的规律,并提出了一些富有启发性的语言学、发展心理学和认知科学理论问题。20130113Bo 病理语言学的病例研究:杨亦鸣(徐州师范大学)这方面的系列论文。基于神经语言学的中文大脑词库初探,语言文字应用,2000年第3期20130113Bo 杨亦鸣认为神经语言学的发展可以分为三个时期。o 1861年法国外科医生布罗卡发现了大脑中专管语言功能的布罗卡区,神经语言学的研究由此起步。早期关注神经语言学研究更多的是神经学家和心理学家,而且他们的研究并没有用语言的理论进行指导。o 在二十世纪初到二十世纪七十、八十年代神经语言学进入了独立发展的阶段,这时的神经语言学
4、研究具有了语言学目的。索绪尔的普通语言学教程提到了语言学的生理基础,涉及到了神经语言学的一些内容。布拉格学派的雅克布逊是最早用语言学理论观照神经语言学的人。o 从二十世纪末到现在,乔姆斯基的转换生成理论和新兴神经语言学的各种研究方法为神经语言学的成熟和发展做出了杰出的贡献。当神经学家,语言学家,心理学家和计算机学家等开始共同研究神经语言学的时候,神经语言学也发展到了它的较高水平。目前我国的神经语言学恰恰是处在这个阶段。 20130113B社会学调查法王立的“词”的社会学调查:汉语词的社会语言学研究,商务印书馆,2003基于的事实:对“词”的看法不统一;专家与百姓的看法差异巨大o 语感中的“词”
5、:o 社团对“词”的感知:o 社团对“字”与“词的感知:o 社团对构词范式的感知:20130113B检测一:“双音节动宾式结构”语料来源:初级汉语课本等六种。用汉语拼音书写,通过“连写”、“分写”、“或分或连”的形式来检查,按“连写/分写”频率分布的高低测量公众词感倾向的强弱。20130113B调查问卷o 请您用汉语拼音将下列句子拼写出来,请注意以词为拼写单位。1.今天上班,听说小李结婚,下班后,我和小张同路去她家。一转身,看到来讲学的王教授,请他一同去做客。他说晚上要开会,讨论飞船落地问题,只好明天再见面。2.小明每天睡觉前用凉水洗澡。20130113B词感倾向等级划分标准样本的成词频率词感
6、倾向等级40%以下非词倾向40-50%临界状态51-59%准词化倾向60-70%基本词化倾向71-84%显著词化倾向85-94%强烈词化倾向95%以上显著词化倾向20130113B调查对象o 调查样本是以整群抽样方式从武汉市的大中小学校抽取出来的,由10所不同学历层次学校的40个班级组成。20130113B调查结果o 95%左右的调查对象认为双音动宾结构为“词”,与专家的词感形成了明显的对比。专家的词感来源于理性判断,偏重于语法上的各种鉴定词的方法或者是意义的整体性,而汉语社团一般成员则主要依靠语言直觉来判断词与非词,这种“感知主要来自于对词的语音形式(节奏)的感知,判断同一结构形式是词或非词
7、,依据的主要是语流进行中音节间自然的停连,只要两个音节间无语音停顿,且语义上该两音节又可与其前后音节离析,一般人就将其视为词“。 P12720130113B检测二:对词的识别o 给出一些语料,请被访者进行“词”的识别。o 钢花、胡萝、高山、鹅掌、树洞、他人、河脚、外心、佳肴、本意、键关、多棱、土气、万物、班星o 不被认为是词:胡萝、河脚、键关、班星20130113B不同语言成分选择法语言因来源不同,口语-书面语;古词语-外来词;通用语-方言词,等都有所不同o 现代汉语语法研究王力的中国现代语法,选择的语料是红楼梦、儿女英雄传o “现代汉语口语语法演变史”选择的语料:老舍戏剧作品中的对白,而不是
8、叙述文。20130113B抽样方法随机抽取o 这里所说的“随机”并非指样本中的事件是偶然的、完全无序的,而是指按照步骤来构靠样本,使得总体中的每一元素都有一定的被选中的概率。o 防止实验偏倚的最佳方法是按照随机抽样的步骤去做。这样我们就有理由相信,从样本值到总体值的推断是合法的。反之,就无法确信我们从中得到的估计是否可能接近于所关注的总体值,因而任何概括都是值得怀疑的。20130113B意义与目的:o 要调查的总体数量太多太大,投入的成本有限,不可能也没有必要对总体的每个成员都作调查;尽量客观地通过有限的个体来发现普遍的规律;方法:要使获得数据具有代表性,就要做好以下三方面工作:1. 对样本总
9、体作出判断(确定获得数据的范围);2. 分层抽样;3. 获得样本个数的抽样;20130113B对样本总体作出判断(确定获得数据的范围)o 了解大学生的语言特点:选几年级的?哪个省的?住校还是走读?20130113B分层抽样o 了解大学生的语言特点:文理科分系选择;同系按年级选:每个年级按学号选;20130113B获得样本个数的抽样:1.等距法。步骤o excel-工具-数据分析-随机数发生器-分布:模式,产生10000个序数;o excel-工具-数据分析-抽样-周期:间隔5,产生等距随机数;20130113B2.随机数步骤:o excel-工具-数据分析-随机数发生器-分布:模式,产生100
10、00个序数;o excel-工具-数据分析-抽样,产生1000个随机数;o 检验方法:用数组方式:=frequency(),()20130113B3.随机数发生器公式o =rand()o =randbetween(bottom,top)20130113B例一:词的结构与载义量研究;20130113B例2:数据库中词长的总体数据与抽样数据对比:20130113B随机调查例中国社科院实验语音室林茂松、李爱军的方言普通话调查(2003-12)o 主要考虑年龄:o 在厦门居住年限:20130113B随机数与语料调查o l 条件概率:在有条件限制之后的某种情况出现的概率,叫作条件概率。o l 随机变量:
11、我们不能有把握地预期它的值,只能在抽样实验或某种游戏的结果出来之后才能确定它的值。一.分布 统计表 统计图20130113Bo 例:现代汉语词典的词长、义项数、每页词条数o 页距随机抽样;o 随机数抽样:o 页数、行数、字数抽样一.分布 统计表 统计图20130113Bo 统计分析内容主要分两部分:描写统计与推断统计。一.描写统计中,主要介绍资料的整理、分类和简化或特征研究。常用的方法有次数(频数)分布、统计图、统计表、集中趋势测量法、离散趋势测量法等二.推断统计中,主要介绍参数估计、假设检验、回归、方差、相关等。20130113B数据描写统计方法20130113B要点o 一.主要参考文献o
12、二.EXCEL和SPSSo 三.数据描写:20130113B一一.参考文献参考文献1.语言研究中的统计方法Anthony Woods Paul Fletcher Arthur Hughes著,陈小荷等译。北京语言文化大学出版社,2000,42.统计分析与SPSS的应用,薛薇,中国人民大学出版社,2001,113. SPSS for Windows从入门到精通,卢纹岱等,电子工业出版社,1997,6 20130113B二.主要学习软件: Excel和SPSSo Excel是优秀的电子表格软件,有着非常强大的计算功能,俗称“电算软件”。它内藏的运算函数非常广泛,分属于数学、统计、财务、货币、文本、
13、数据库、逻辑、工程等领域。对Excel的学习和使用,可以通过一些基本功能的掌握以达到入门级的应用,也可以进行很专精的功能挖掘与开发。o 已经成为与数字分析有关专业必须学习和掌握的应用软件。20130113BExcel主要功能o 计算功能o 文字处理功能o 图表能力(100多种图表)o 图形功能(绘图)o 数据分析o 链接与合并计算功能o 数据的地图化o 数据库功能o 宏语言20130113BExcel处理文字的独特功能o Excel有关文字的处理与Access相比,有许多不同之处,甚至是受到限制的地方。如容量太小,显示界面变化不多,但也有几点是有独特长处,甚至有替代性功能的。如o 可以方便地对
14、前后行进行调整;o 对调整后的行数可以很方便地用拖拉的方式进行新的排序;o 输入的文字如果是本次操作中前面已经输入过的文字,在录入时会自动显示,按回车就会自动输入到单元格;o 可以以单元格为单位对文字进行排版。 20130113BExcel函数:数百个函数:数百个o 财务:财务: 日期与时间:日期与时间:o 数学与三角函数:数学与三角函数: 统计:统计:o 查找与引用:查找与引用: 数据库:数据库:o 文本:文本: 逻辑:逻辑:o 信息:信息: 用户定义:用户定义:o 工程:工程:20130113Bo Excel以行、列的表格方式存在,单元格用于存放数值。单元格是Excel非常重要的一个组成部
15、分,是运算的基本单位,每一个单元格都可用专门的名称来定位。定位的方法好似地图上的经纬度。20130113Bo Excel文件以.xls后缀存放。每个工作表最多可有256列65536行。o 单元格:256*65536=16.777.216o “B2”表示的是B列第2行,“H5”表示的是H列第5行。在单元格上凝集了许多设定,只要录入了文字或数字,就可以进行运算。o 可对单元格进行数据类型的限定。需要设定时把鼠标移到该字段,点击右键,选择单元格属性。默认值可以设定,在菜单工具选项编辑中对选项做出选择。 20130113B公式的五种元素1. 运算符:2. 工作表函数3. 参数:4. 单元格引用:5.
16、括号:o o =SUM(A1:A10) 20130113Bo Excel的计算功能值得好好学习,也要费很大的气力去学习。掌握了它的强大而灵活的计算功能,用来支持对数据库的强大查询能力,把数据库中查询出来的数据放到Excel中来进行运算,就能很快获得计量结果。 o Excel是一个非常值得学习的计算软件,市面上有许多介绍它的书,简单的100-200页,详细的厚达800-900页。20130113BSPSSo Statistical Package for Social Science。o (社会科学统计分析软件包)o 目前人文科学研究中最具影响力的统计分析软件。 o 在我国,它在其强大的统计分析
17、功能、方便的用户操作界面、灵活的表格式分析报告及其精美的图形展现,受到统计分析人员的喜爱。成为统计学、财经学、管理学等学生的必修课。20130113Bo 目前:SPSS(Statistical Package for the Social Science)。它的单元格作用可能是没有Excel灵活与多样,对数据的增、删、调整也没有那么方便,对数据的处理与对数据的存储也不像Excel那么是合在一起,但对纯数字的数值关系的分析却极为强大。它是目前人文科学研究中最具影响力的统计分析软件。 20130113B三.数据描写:常用数据描写的函数常用数据描写的函数1.1. 最大数最大数:max:max2.2. 最小数最小数:min:min3.3. 总数:总数:sumsum4.4. 平均数平均数:average:average5.5. 众数众数:mode:mode6.6. 中数中数:median:median7.7. 计算有内容的单元格的数量计算有内容的单元格的数量:count:count8.8. 计算无内容的单元格的数量:计算无内容的单元格的数量:countblankco
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 景区门票退票手续规范制度
- 河南省新乡市2026届高二上生物期末达标检测模拟试题含解析
- 食品企业卫生监控制度
- 2026安徽蚌埠自贸区城发人力资源有限公司第一期招聘6人备考题库及完整答案详解1套
- 2026上半年重庆事业单位联考重庆市属单位招聘高层次和紧缺人才310人备考题库完整答案详解
- 2026广东深圳市福田区总工会招聘工会社会工作者6人备考题库及答案详解参考
- 2026对外经济贸易大学事业编专职辅导员、其他专技人员招聘备考题库及完整答案详解1套
- 2026内蒙古昌都市丁青县消防救援大队补招政府专职消防员4人备考题库及答案详解参考
- 2026四川巴中市通江产业投资集团有限公司及下属企业招聘11人备考题库及答案详解一套
- 银行票据管理财务制度
- 2026年杭州职业技术学院单招职业技能测试题库附答案解析
- 北京市丰台区2026届(年)高三年级(上)学期期末考试英语试题卷+答案
- 2026届山东省淄博市第一学期高三摸底质量检测历史(期末)(含答案)
- 2025年优待证自查自纠报告模板范文
- 2026年春教科版(新教材)小学科学二年级下学期教学计划及进度表
- 中国热带农业科学院热带作物品种资源研究所2026年第一批公开招聘工作人员备考题库及答案详解参考
- Ozon培训课件教学课件
- 2025年民航概论试题及答案判断
- 吸氢机销售课件
- DB1310-T 369-2025 化学分析实验室玻璃仪器使用规
- 2025年城市综合交通设施优化项目可行性研究报告及总结分析
评论
0/150
提交评论