版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、银杏专业载文核心期刊布鲁克斯误差分析与修正 摘 要:利用布鲁克斯(Brookes)图形法计算银杏专业核心期刊时,由于银杏专业属于农业类的狭窄专业,可采用的期刊实体样本空间狭小,且在实际统计中,期刊实体增量十分有限,即短期内通常不会有大量的新增实体样本出现,因而会产生较大的系统误差。本研究通过图形辅助分析法得到了可靠的银杏专业核心期刊布鲁克斯图形分界点,并利用这一分界点逆推得到布鲁克斯图形法误差修正系数。 关键词:银杏专业;核心期刊;曲线;布鲁克斯;修正系数 中图分类号:G350 文献标识号:A 文章编号:1001-4942(2010)03-0084
2、-06 以期刊载文量为基础来筛选核心期刊,对细分专业中的研究人员及基层信息服务部门获取信息具有很高的实用价值。文献统计研究是布拉德福(Bradford)文献分散定律产生和发展的基础1,该定律自20世纪30年代发布以来,已在多个领域的多个学科得到了实际检验以及后人的不断发展和完善。最重要的是布鲁克斯对它的发展,其分段函数式给予了布拉德福曲线更加全面和准确地描述2,并发展了图形法,在文献计量学理论和应用方面都占有极其重要的地位,专业核心期刊的统计就是其一项重要功能。从目前已发表的s值数据3来看,与引文法等评价方法一样,布鲁克斯图形法大多应用于专业范围较为宽泛的学科。s是标度学科专业范围大小的指标,
3、一般随专业范围的扩大而扩大,s1说明专业范围非常窄3。银杏专业亦是果树细分专业中典型的狭窄专业,但本研究发现,其s值大于1,为1.56,不具备非常窄专业的特征,从所采用数据样本来看,处于19942004年,其间经历了一个产业发展膨胀阶段,期刊载文数量也会产生相应的膨胀,但银杏专业特征并没有产生持续的变化,短期膨胀后,仍要回归狭窄专业特征。在这种情况下,如果简单套用布鲁克斯图形法,很难得到合理的计算结果,会产生很大的系统误差8。作为系列研究之一,本研究同样是在布鲁克斯图形法的基础上,采用了曲线8,9,即以布鲁克斯原模型为基础,按其值绘制曲线,然后利用该曲线上的合理分界点作为参考点,来获得误差变化
4、规律的曲线,从而得到布鲁克斯图形法误差修正系数x,以达到有效克服误差的目的。在目前国内发表的专业文献中,已有多篇论文47获得了该方法的支持并得到了合理的计算结果。本系列研究始于对杏专业载文核心期刊布鲁克斯误差根源的研究,并已在多个果树专业中进行了验证性研究,均取得了很好的结果。本文以银杏专业为采样数据进行研究,目的是为了进一步验证曲线的有效性。 1 模型与定义 模型:公式1为布鲁克斯两段方程式。 式中, s是一个与N呈正比的参数,同时与C呈正相关。=R(1),表示等级为1的期刊载文量,即载文量最多的期刊的载文量。C为核心区期刊数。为小于1的参数,是布鲁克斯图形曲线部分的曲率,与核心区期刊数量相
5、关。k为布鲁克斯图形中直线部分的斜率。N为期刊总数,n为期刊按载文量递减顺序排列的序号3,即期刊累积数。 在研究杏专业载文核心期刊的统计误差8时,已在该公式和与之对应的图形法的基础上给出了4个定义,同样适用于对银杏专业载文核心期刊的统计进行误差分析与修正研究。 定义1:曲线以布鲁克斯图形各点的值为横轴,以期刊累积数n为纵轴制作的曲线,又称图形。 定义2:合理分界点T在曲线中,曲率匀加速变化的线段与曲率趋向常数的线段之交点。 定义3:不合理分界点C在布鲁克斯图形中,如果分界点C不对应于曲线中的T点,则C为不合理分界点。 定义4:布鲁克斯图形法修正系数x在系统误差修正过程中对实体样本空间的最佳虚拟
6、变换倍数。 2 数据与图形分析 2.1 数据采用与处理 表1是一组有关中国银杏专业论文的统计数据4,其原始数据来源于中国期刊全文数据库和中文科技期刊全文数据库,这两个数据库几乎涵盖了国内所有的农业科技期刊。为便于数据引用和计算,将原创数据表中的常用对数值改为“期刊累计数自然对数值(lnn)”,表中引用的其它原始数据不变。根据该表中的数据在笛卡尔坐标纸上描图1,即为布鲁克斯图形,其分界点为C,由该点的横坐标可以求得布鲁克斯值n,即核心期刊值。 2.2 曲线的制作与应用 在布鲁克斯图形法的基础上研究对其值的进一步应用。由两段数学式(公式1)所得的布鲁克斯图形具有连续性,依此,亦具连续性,因而在应用
7、中可通过求取该图形曲线上各点的值并作图,判断布鲁克斯图形中直观获取的分界点的合理性,即图1中C点的合理性。布鲁克斯图形法是利用分界点上的纵横坐标值来求取核心期刊的值n,本研究就是要修正该点的计算结果。 分析发现,利用布鲁克斯图形法计算狭窄专业的核心期刊时,其图形分界点位置的判断会存在较大的误差,因而,需对分界点的准确位置作进一步的分析,以便找到缩小这类误差的途径,即从图1中第一个统计点开始,假设其后的每一个统计点都是一个分界点(同时满足公式1和公式1条件的点),这样就可针对每一个实际统计点利用公式1逐一计算其曲率,并制作曲线,即定义中的“曲线”。利用指数与对数法则将公式1转换为公式2: =lo
8、gR(n)R(1)n=lgR(n)R(1)lgn=lgR(n)-lgR(1)lgn=lgR(n)-lg84lgn (公式2) 将表1中各已知量代入公式2,得到对应的值(表2)。分别以n值和值为纵横坐标描图2。图形更加直观和清晰,容易找出值趋于一致的线段边际,因而能够更加准确地发现合理分界点的影射点,最大限度地避免仅仅依靠图1来确定分界点所带来的系统误差。 2.3 图形对比与误差分析 在研究杏8、山楂9、枣、核桃、猕猴桃10等细分狭窄专业的分界点时,发现如下规律:一是当专业发展比较稳定时,布鲁克斯图形的分界点位于图形中离核心区最近且匀加速变化阶段的线段上,此时可以确定该线段上方的端点即为合理分界
9、点;二是当专业发展急剧膨胀时,布鲁克斯图形的分界点位于图形中匀加速变化阶段的线段顶端或顶端以外趋向于垂直于横轴的射线上的近端点处,此时的分界点应视布鲁克斯图形曲线部分的状况而定。以上两种情况的图形均存在一条由多个统计点构成的规则斜线,即值匀加速变化的线段。对发展一直较为平稳的专业突然出现急剧萎缩的情况尚没有典型实例可供研究。银杏专业在统计期间也出现了膨胀式发展情况,即90年代中后期出现的众所周知的银杏热,如江苏姜堰近几年白果收购价格在5元/kg以下徘徊,2008年收购价甚至跌破了2元/kg10。直观上看,在图2中前5个统计点对应于图1靠近核心区的明显的曲线部分,因此,不管它们是否存在拐点均不予
10、讨论。ET是匀加速变化且离核心区最近的线段,T点明显地处于匀加速变化线段的顶端,可判定为核心区与发散区的分界点,这与本系列研究中以往的研究实例中出现的情况相符。 在图1中,布鲁克斯图形分界点为C,格鲁斯下垂区为273R(24)=84×24? 即,84×24?=839,则=log9.98824=lg9.988lg24=0.7242 此处<1,说明所采用的数据符合布鲁克斯公式的条件要求,而该点在图2中的影射点为C, 显然C已大大超出了匀加速变化区(ET线段),进入了文献发散区,这就难以判断C是否是合理分界点。从图1来看,从第11统计点T(对应于图2的T点)到C
11、点,已完全表现为一条规则的直线,其与布鲁克斯直线部分形成的剪刀差也正反映了本专业的发展出现过比较大的波动并在C点表现出来,由此可见,合理分界点应处于C点的下方, C则是“不合理分界点”。而图2中11.25n273.00范围内则是一条趋向垂直于横轴的直线,这在杏专业等核心期刊的误差研究中也得到了证实,因此,可以判定此范围对应于图1的直线部分,至此,可将图2中的曲率分界点T判定为“合理分界点”,该点有n=11.2511,从而确认了T点的纵坐标11.25即为核心期刊值,这与区域法47所获得的结果相符4。这样便可以通过公式计算找到传统布鲁克斯图形对应于T点的真实分界点,从而对布鲁克斯图形给出的结果进行
12、修正。在图1中,核心区与发散区的分界点除作图与判定误差外,对照区域法4计算结果,利用这一分界点所产生的系统误差则更大,是误差的主要因素。经试验证明,在该点通过对s值进行变换可以有效缩小对核心期刊统计的系统误差,由于N与s呈正比3,其数学意义是对实体样本空间进行了变换,这种变换是以图形中T点为依据的。 下面给出了两种情况下的相对误差: (1)假设样本空间足够大,则kN 3=474,C点有R(24)=839,由图1读取s=1.56,由公式1对其进行布鲁克斯求值得n=9.16,而该点实际的期刊数nc=24.00(表2),其相对误差nc=|nc-n |=|24.00-9.16|=14.84,相对误差率
13、为nc/nc=61.84%。 (2)图上读取相对误差:由图1读取C点的lnn=3.18,则n=24,二者进行比较后发现,n=|n-n |=|11.25-24.00|=12.75,相对误差率为n/n=113.33%。 第一种情况表明,对于该实例kN是不成立的,即N并不是足够大;第二种情况则显示了两个图形读取值的差别,两种情况下的n值实际上都已超出了误差涵义,显示了布鲁克斯模型在这个专业的应用中其传统的使用方法存在着缺陷,而出自同一模型的图形中T点的结果则表明布鲁克斯公式本身并不存在这样的缺陷,仅有作图及判断误差。这看起来似乎是矛盾的,实质上这正说明在两段数学表达式中不同的段代表着不同的含义,这种
14、显著的差异也正是在狭窄专业中段的使用不合理所造成的,从而使得修正原先的布鲁克斯模型使用方法有了依据。由于误差是系统性的,因而误差修正应基于公式的计算结果。 3 银杏专业核心期刊的计算与误差修正 3.1 k值的求取 s是标度学科专业范围大小的指标,一般随专业范围的扩大而扩大3。在图1中,沿直线作延长线交于横轴A点,A点所对应的自然对数值即为s,这里读取s=lnA=1.56。在误差修正过程中,一经读取就一直假设该值没有作图误差,是直线在横轴上的截距(平移量)。 k值即布鲁克斯图形中直线部分的斜率,由于误差因素,不能以任意统计点的纵横比来求取,而应求取直线部分的每个统计点的实际值,尔后再取其平均值,
15、这样会最大限度地缩小计算误差与作图误差。直观上看,图1中的第19统计点C是分界点,即k值的计算从第19统计点开始,到格鲁斯下垂的分界点为止。由直线方程式R(n)=k(lnn-s)求取直线部分各统计点的k值,列表3。k的平均值为: =33m=19k15=509.83 3.2 n值相对误差分析 当期刊总数N充分大时,有Nk3,而目前的N=474R(24)=84n0.7242 (1n24)ln(n/xlnA) (24n318)(公式3) 式中,x即为布鲁克斯图形法修正系数。本系数用于在布鲁克斯模型的基础上,对狭窄专业核心期刊的统计结果进行修正。由于公式3所对应的图形是布鲁克斯的曲线部分,正常情况下合
16、理分界点应是右边的端点,因此,计算只要使用公式3即可,也就是从不合理分界点C开始,按n的顺序进行。表4列出了通过公式3计算得到的部分布鲁克斯n值,s取0.801.90倍,对合理分界点的相对误差为:=n-n=11.25-n,利 用这一公式所获得的最小误差值所对应的n值就是逆向推理的依据,即利用图形所获得的结果确定公式1中n的结果,再利用这个结果反向求取该方程式的一个因子x,这个x必须对应于最小的 ,加入这一因子后,使布鲁克斯公式可以直接在银杏这个狭窄专业中应用而不致产生错误。适当加密x值描点作图3。 由表4和图3可以看出,在计算和作图误差范围内,当银杏专业载文期刊样本空间扩大为实体样本空间的1.
17、39倍(x=1.39)时,所产生的相对误差最小,为0.008755。 3.3 修正系数的应用 将x=1.39代入公式3进行应用计算,即可将核心期刊数n修正到n,即: lnn=R(24)+lns=R(24)+ln(xlnA)=839509.83+ln(1.39×1.56)=2.4196 得此时银杏专业核心期刊数为n=11.2411,这样得出的结果与区域法47所获得的结果相符4。 4 结论 本文通过对银杏专业载文核心期刊统计实例的研究,获得了图形辅助分析法并逆推获得了该专业布鲁克斯图形法修正系数x。从统计结束日开始,今后相当长的一段时间内,由于银杏专业载文实体期刊样本的增量极其微小,因而
18、在该时间区段内可将x视为一个常数使用,这为类似专业的应用计算提供了新的量化依据。同时也显示了曲线、合理分界点T、不合理分界点C和布鲁克斯图形法修正系数x这4个定义的必要性,可以将其推广到其它狭窄专业载文核心期刊的统计中去。本系列研究的成果已为多篇文献47的发表提供了支持,并得到了理想的统计结果,这些结果都得到了区域法的验证。作为系列研究之一,本研究并不涉及布鲁克斯模型本身是否存在缺陷问题,而只是研究了该模型在银杏这个狭窄专业载文核心期刊的统计中,其传统的使用方法因段的使用不合理所产生的问题,并给出了弥补的有效方法。同时,本研究也并不与现有的引文法等权威评价标准产生冲突,它只是为细分狭窄专业及基层信息服务部门的信息需求者提供了一个便捷的实用筛选工具。 参 考 文 献: 1 邱均平.信息计量学M. 武汉:武汉大学出版社,2000,315-316. 2 Brookes B C.Bradfords l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年教师资格证(小学)(教育教学知识与能力)考试题及答案
- 2026四川省人民医院专职科研人员、工程师及实验技术员招聘5人笔试参考题库及答案解析
- 2025四川绵阳市涪城区政务服务和行政审批局招聘编外人员3人模拟笔试试题及答案解析
- 2025下半年“才聚齐鲁 成就未来”山东高速集团有限公司社会招聘162人备考考试题库及答案解析
- 2026中国信达贵州分公司招聘备考笔试题库及答案解析
- 2025山西空港新城太平中学就业见习招聘2人模拟笔试试题及答案解析
- 2025甘肃临夏州临夏市人力资源和社会保障局招聘城镇公益性岗位人员1人备考笔试试题及答案解析
- 2025贵州安顺关岭自治县社会保险事业局招聘公益性岗位人员1人备考笔试题库及答案解析
- 2026浙江宁波市慈溪市招聘部分专业卫技人员134人参考笔试题库及答案解析
- 2025年哈尔滨方正县“归雁计划”备考笔试题库及答案解析
- 2025-2030中国除湿干燥机行业应用趋势与需求规模预测报告
- 2025广东高考物理试题(大题部分)+评析
- 2025年中国国际货运代理行业市场情况研究及竞争格局分析报告
- 家庭教育概论 课件 第5章 亲子关系:家庭教育的起点与结果
- 500千伏输电线路工程项目管理实施规划
- 哪吒主题课件模板文档
- 2025年鞍钢集团招聘笔试参考题库含答案解析
- 2024年客运资格证考试试题及答案解析
- JTS+155-1-2019码头岸电设施检测技术规范
- DL-T-1946-2018气体绝缘金属封闭开关设备X射线透视成像现场检测技术导则
- 血液透析中低血压的预防与治疗
评论
0/150
提交评论