




已阅读5页,还剩50页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,BIBEXCEL简介,福州大学情报学,1,-,目录Content,1,工作界面,2,概述,2,-,发展简史,Bibexcel是瑞典于默奥大学(UmeaUniversity)信息研究小组(TheInformationResearchGroup,Inforsk)欧莱皮尔逊教授设计开发的一款软件。Bibexcel的设计宗旨是辅助用户分析书目数据,或者格式相近的自然语言文本,最终产生的数据可导出至Excel或其他采用【Tab】键隔开数据的程序中。主要用于文献计量分析,并可为Pajek、NetDraw软件提供绘图所用数据,3,-,1,概述,主要特点,Bibexcel是一款供学术非营利使用的免费软件,其主要特点是小巧实用、功能丰富。,运行环境,Bibexcel.exe软件可以从Bibexcel官方网站(网址:www.umuse/inforsk)上进行下载。其帮助文档bibexcel.hlp和t也可以在该官方网站上进行下载。在Windows运行环境中,将下载后的EXE到任意目录下,双击即可运行。在安装过程中,如果提示需要安装附加内容,可按照提示在网上下载。,主要功能,Bibexcel软件主要功能包括文献计量、引文分析、书目耦合、聚类分析,为Pajek、NetDraw软件提供书目数据等。,4,-,下载,5,-,6,-,崔雷的博客,7,-,工作界面,8,-,9,-,界面左上部分显示了文件名称和路径,默认的路径是bibexcel.exe程序所在的目录。选中某个文件,单击下方的Viewwholefile按钮,就会在界面右下部分显示文件内容。,10,-,划分方法栏,CR表示参考文献Any表示按;(分号)划分整个字段JN-表示期刊Blank表示按空格划分整个字段Whole表示不进行具体的划分,整个字段是一个整体单元。,11,-,频数分布栏,后面进行某一字段的具体分析时会用到这个部分Sort表示降序排列Remove表示去重Make表示输出一个新的gut文件Fractionalize表示用频率表示,具体划分为很多字段,如所有字段、被引文献字段、被引作者字段、被引年字段、被引期刊字段等,12,-,标签栏,后面产生具体某一字段的out文件时会用到这个部分,也可以在转换文件格式时产生的doc文件中查看所有的标签,如TI、AU、GD等等。其中常用的标签有:TI表示标题,AU表示作者,CD表示参考文献,DE表示关键词。,13,-,BibexceJ有8个菜单,14,-,File菜单-文件,复制文件重命名删除文件新建目录删除目录某个文件合并到另一文件将所有被选择的文件合并到另一文件将列表保存到文件退出,15,-,Editdocfile菜单-编辑doc文件,生成新记录删除字段识别重复记录删除重复记录删除指定文字重命名字段标签将换行符替换成回车符从doc文件中选择文档号从out文件中选择文档号,16,-,Editdoc-files菜单,转换大小写创建多个out文件压缩out文件(每字段一行)转换以逗号分隔格式的地址压缩out文件压缩独立的空out文件删除低频项删除高频项从引文中抽取出版年给字符串编号增加分号保留0-9及A-Z的字符保留作者首字母保留前n个字符Levenshtein距离计算只列出out文件中的实词等,17,-,Adddataclassify菜单,给out文件添加分类一精确匹配给out文件添加分类一子字符串匹配给out文件添加分类一子字符串匹配给词频对文件添加分类利用Levenshtein距离添加分类为词频文档号-文档号添加标签为文档号文档号对添加标签二进制查找合并两个文件比较相似字符串将简写形式的期刊名与其全名进行匹配将简写形式的单词与其全名进行匹配在字符串中查找某个代码词在字符串中查找某个字符串在列表中查找某个单词,18,-,Analyze菜单,增加频次共现分析doc文件中的引用doc文件及单元格矩阵h指数成对单元格使用MDS生成矩阵生成包括零词对的词对列表从词对列表中选择词对选择最强联系共享单位耦合每记录的单位词对的滞后年等,19,-,Misc菜单-杂项,转换格式解压csvall格式为Diva原始数据解压标签格式数据为Diva原始数据按ISSN号进行SherpaRomeo检索按期刊名称进行SherpaRomeo检索,20,-,Mapping菜单,生成net文件生成vec文件生成clu文件从net文件中生成vel文件合并net文件生成地理图谱,21,-,Help菜单Help菜单可以调出Bibexcel的帮助文件帮助文件只有在Windows7以下版本的机器上才能打开,22,-,数据准备,“共词分析法”属于内容分析法的一种,主要统计一组词中两两同时出现于一篇文献的次数,以这种“共现”次数反映这些词之间的关联程度,两个词的“共词强度”(指两个词同时出现于一篇论文中的次数)越高,则这两个词之间的关联越紧密。,23,-,数据转换(.txt.txt2.doc),字段抽取(.doc.out),共现分析(作者、关键词).coc.ccc.ma2,可视化图谱Pajek、NetDraw,24,-,25,-,Notexpress等文献管理软件导出NE:导出题录(RIS格式)AU、DE等,不能分析参考咨询CD字段,26,-,操作中如无说明,弹出对话框一律选确定或是,27,-,.doc是Bibexcel可处理的格式,28,-,创建OUT文件是我们使用Bibexcel软件进行文献计量学分析的第一步。当我们创建OUT文件时,我们首先需要确定使用书目记录中的哪一个字段来创建OUT文件,也就是选择将要分析的字段(标识符)第一步在文件管理系统中选择DOC文件;第二步在“Oldtag”文本框中键入字段标识符,如AU、DE等。第三步在“Selectfieldtobeanalysed”下拉框中,选择识别字段内容的操作,如“Any;separatedfield”等。第四步点击“prep”按钮。就完成了OUT文件的创建。,29,-,AU、TI、DE等字段,以;隔开,点击,30,-,第一列文章编号第二列作者名,31,-,重命名,重命名,32,-,空格切分后的标题词,空格划分,33,-,第一步在文件管理系统中选择OUT文件。第二步在“SelecttypeofUnit”下拉框中,选择计数单位,如“wholestrings”。第三步在下方的多选框中,选择排序方式,如选择“Sortdescending”,即按降序排列。第四步在下方的多选框中,选择计算方法,默认的计算方法是“wholecounts”,可以改变为“fractionalcounts”。第五步点击“Start”按钮。将会生成*.cit文件。,34,-,选wholestrings并将序排列,降序排列的作者数字是文章数量,35,-,频数分布栏:分析作者共现,选择“Author”分析关键词共现,选择“wholestrings”分析机构共现,“wholestrings”分析被引期刊共现,“wholestrings”分析参考文献共现,“Citereference”,36,-,共现:两个或者两个以上标目在同一个字段中出现第一步在“Selectfilehere”中选中cit文件,点击“Viewfile”按钮,在TheList中显示cit文件的内容。第二步从cit文件列表中标记将要分析的单元,然后从菜单条中选择Analyze-Co-occurrence-Selectunitsvialistbox第三步在“Selectfilehere”标记OUT文件。注意:不要在TheList中显示OUT文件。第四步从菜单中选择Analyze-Co-occurrence-Makepairsvialistbox,37,-,选频次10次以上,38,-,共现标题词按频次降序排列,生成coc文件,39,-,40,-,数字代表该词在.coc文件中出现的次数,生成ccc文件,41,-,选中*.coc,打开*.ccc,42,-,标题词共现的三角矩阵,可粘贴至EXCEL继续可视化,43,-,44,-,创建供pajek软件使用的文件文件有三种类型:net、vec和clu,45,-,创建net文件第一步选择*.coc文件。第二步从菜单条中选择Mapping-Createnet-fileforpajek.,46,-,47,-,创建vec文件第一步选择*.cit文件。第二步从菜单条中选择Mapping-Createvec-file,48,-,49,-,4,Pajek可视化,50,-,51,-,52,-,53,-,总结,txt文件:从Wos中导出的数据文件;tx2文件:转换txt文件格式第一步生成的文件;doc文件:生成的Bibexcel可处理的文件格式;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海水淡化处理中的蒸发技术应用考核试卷
- 火力发电厂施工信息技术应用考核试卷
- 电机在实验仪器中的应用考核试卷
- 装饰材料企业产品创新与市场接受度考核试卷
- 营养食品在极端环境适应中的研究考核试卷
- 物联网智能电网数据分析考核试卷
- 轻质建筑材料制造续考核试卷
- 稀土金属提炼过程中的政策引导与市场机制构建研究分析考核试卷
- 肿瘤表观遗传学研究进展
- 情感出轨方独立承担担保责任及财产分割协议
- 2024-2025年辽宁省面试真题
- 2024年高考真题-地理(河北卷) 含答案
- 单位驾驶员劳务派遣投标方案投标文件(技术方案)
- 资本经营-终结性考试-国开(SC)-参考资料
- 2024年浙江省中考科学试卷
- 拆除工程地坪拆除施工方案
- 软件授权书范本
- 招聘笔试题与参考答案(某大型国企)2025年
- DB34∕T 2570-2015 祁红香螺加工技术规程
- 安徽合肥滨湖投资控股集团有限公司招聘笔试题库2024
- 2024年四年级英语下册 Module 4 Things we enjoy Unit 12 The ugly duckling第3课时教案 牛津沪教版(三起)
评论
0/150
提交评论