数学与生物信息科学交叉研究领域文献分析报告_第1页
数学与生物信息科学交叉研究领域文献分析报告_第2页
数学与生物信息科学交叉研究领域文献分析报告_第3页
数学与生物信息科学交叉研究领域文献分析报告_第4页
数学与生物信息科学交叉研究领域文献分析报告_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学与生物信息科学交叉研究领域文献分析报告邵伟文中国科学院国家科学图书馆冯雷中国科学院数学与系统科学研究院摘要:中科院“创新2020”方案中包括了筹建数学科学交叉应用研究中心这一重要内容,该中心将涉及到“数学与生物信息”这一重要交叉领域,为了对数学与生物信息科学交叉研究领域的发展状况有一个比较清晰的了解,我们从现有文献入手,拟对这方面的SCI收录文献做一个全面的分析整理,试图从国际范围内探索这一领域的发展趋势和前景。本报告详细分析了数学与生物信息科学交叉研究领域现有文献的状况,包括论文产出的增长趋势、论文被引用情况和增长趋势、论文产出的国家和地区以及科研机构、论文产出涉及到的交叉学科、论文登载的期刊情况,详细列出了这些项目的论文数量排名靠前的名单,另外也分析了中国学者在这一领域的研究情况,最后小结提出一些建设性建议。一、论文产出数量和增长趋势从ISI数据库检索到国际上“生物信息科学”领域中被SCI收录的相关文献22454篇,其中与“数学”学科具有交叉的文献3008篇,占这一领域文献量的13.40,这些文献与数学中各二级类别的交叉分布状况见表一:表一、数学与生物信息科学领域交叉文献中文名称英文名称篇数百分比数学与计算生物学MATHEMATICAL & COMPUTATIONAL BIOLOGY238010.5994 %数学MATHEMATICS240.1069 %应用数学MATHEMATICS, APPLIED287 1.2782 %数学跨学科应用MATHEMATICS, INTERDISCIPLINARY APPLICATIONS1180.5255 %运筹学与管理科学OPERATIONS RESEARCH & MANAGEMENT SCIENCE1270.5656 % 数学物理PHYSICS, MATHEMATICAL470.2093 %统计学与概率论STATISTICS & PROBABILITY9594.2710 %使用ISI分析工具,统计分析数学与生物信息科学交叉领域被SCI收录的3008篇论文的发表年代,可以清晰地看到该领域的论文的产出趋势:从1979至1997年,该领域的文献非常稀少,只是零星的有一些探索,自1998年以来,该领域的文献呈现线性增长趋势,这一阶段到2006之后突然出现一个三年的跳跃式增长,目前仍然在快速增长中(图一)。 图一、数学与生物信息科学交叉领域文献产出数量和趋势 该领域的3008篇文献至今已经被引用25553次,篇均被引8.5次,单篇最高被引685次,引文自二十一世纪以来呈现指数增长的趋势(图二),该领域的文献价值的影响力越来越大,说明这一交叉领域得到了科研人员较大的关注。另外表二列出了该领域被引Top25文献,中国学者有两篇论文进入top25文献。图二、数学与生物信息科学交叉领域文献引文产出数量和趋势表二、数学与生物信息科学交叉领域被引Top25文献序号文献信息被引次数年均被引1标题: Using Bayesian networks to analyze expression data 作者: Friedman N, Linial M, Nachman I, et al.会议信息: 4th Annual International Conference on Computational Biology (RECOMB 2000), APR 08-11, 2000 TOKYO, JAPAN来源出版物: JOURNAL OF COMPUTATIONAL BIOLOGY卷: 7期: 3-4页: 601-620出版年: 2000 685 62.272 标题: The systems biology markup language (SBML): a medium for representation and exchange of biochemical network models 作者: Hucka M, Finney A, Sauro HM, et al.来源出版物: BIOINFORMATICS卷: 19期: 4页: 524-531出版年: MAR 1 2003 540 67.503标题: Modeling and simulation of genetic regulatory systems: A literature review 作者: De Jong H来源出版物: JOURNAL OF COMPUTATIONAL BIOLOGY卷: 9期: 1页: 67-103出版年: 2002 503 55.894标题: FatiGO: a web tool for finding significant associations of Gene Ontology terms with groups of genes 作者: Al-Shahrour F, Diaz-Uriarte R, Dopazo J来源出版物: BIOINFORMATICS卷: 20期: 4页: 578-580出版年: MAR 1 2004 400 57.145 标题: Taverna: a tool for the composition and enactment of bioinformatics workflows 作者: Oinn T, Addis M, Ferris J, et al.来源出版物: BIOINFORMATICS卷: 20期: 17页: 3045-3054出版年: NOV 22 2004 330 47.146 标题: Evaluation of methods for the prediction of membrane spanning regions 作者: Moller S, Croning MDR, Apweiler R来源出版物: BIOINFORMATICS卷: 17期: 7页: 646-653出版年: JUL 2001 300 30.007 标题: Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences 作者: Li WZ, Godzik A来源出版物: BIOINFORMATICS卷: 22期: 13页: 1658-1659出版年: JUL 1 2006 249 49.808 标题: GOTree Machine (GOTM): a web-based platform for interpreting sets of interesting genes using Gene Ontology hierarchies 作者: Zhang B, Schmoyer D, Kirov S, et al.来源出版物: BMC BIOINFORMATICS卷: 5 文献编号: 16出版年: FEB 18 2004 218 31.149 标题: Investigating semantic similarity measures across the Gene Ontology: the relationship between sequence and annotation 作者: Lord PW, Stevens RD, Brass A, et al.来源出版物: BIOINFORMATICS卷: 19期: 10页: 1275-1283出版年: JUL 1 2003 190 23.7510标题: Reconstruction of metabolic networks from genome data and analysis of their global structure for various organisms 作者: Ma HW, Zeng AP来源出版物: BIOINFORMATICS卷: 19期: 2页: 270-277出版年: JAN 22 2003 159 19.8811. 标题: Prediction of MHC class II-binding peptides using an evolutionary algorithm and artificial neural network 作者: Brusic V, Rudy G, Honeyman M, et al.来源出版物: BIOINFORMATICS卷: 14期: 2页: 121-130出版年: 1998 152 11.6912. 标题: GMDCSB.DB: the Golm Metabolome Database 作者: Kopka J, Schauer N, Krueger S, et al.来源出版物: BIOINFORMATICS卷: 21期: 8页: 1635-1638出版年: APR 15 2005 143 23.8313 标题: Automated genome sequence analysis and annotation 作者: Andrade MA, Brown NP, Leroy C, et al.来源出版物: BIOINFORMATICS卷: 15期: 5页: 391-412出版年: MAY 1999 134 11.1714 标题: Phospho.ELM: A database of experimentally verified phosphorylation sites in eukaryotic proteins 作者: Diella F, Cameron S, Gemund C, et al.来源出版物: BMC BIOINFORMATICS卷: 5 文献编号: 79出版年: JUN 22 2004 127 18.1415 标题: Computational cluster validation in post-genomic data analysis 作者: Handl J, Knowles J, Kell DB来源出版物: BIOINFORMATICS卷: 21期: 15页: 3201-3212出版年: AUG 1 2005 120 20.0016 标题: Mining literature for protein-protein interactions 作者: Marcotte EM, Xenarios I, Eisenberg D来源出版物: BIOINFORMATICS卷: 17期: 4页: 359-363出版年: APR 2001 120 12.0017 标题: Inferring qualitative relations in genetic networks and metabolic pathways 作者: Akutsu T, Miyano S, Kuhara S来源出版物: BIOINFORMATICS卷: 16期: 8页: 727-734出版年: AUG 2000 118 10.7318 标题: Functional and structural genomics using PEDANT 作者: Frishman D, Albermann K, Hani J, et al.来源出版物: BIOINFORMATICS卷: 17期: 1页: 44-57出版年: JAN 2001 117 11.7019 标题: Combining phylogenetic data with co-regulated genes to identify regulatory motifs 作者: Wang T, Stormo GD来源出版物: BIOINFORMATICS卷: 19期: 18页: 2369-2380出版年: DEC 12 2003 116 14.5020 标题: Data mining in bioinformatics using Weka 作者: Frank E, Hall M, Trigg L, et al.来源出版物: BIOINFORMATICS卷: 20期: 15页: 2479-2481出版年: OCT 12 2004 111 15.8621 标题: A dynamic programming approach to de novo peptide sequencing via tandem mass spectrometry 作者: Chen T, Kao MY, Tepel M, et al.来源出版物: JOURNAL OF COMPUTATIONAL BIOLOGY卷: 8期: 3页: 325-337出版年: 2001 108 10.8022 标题: Mismatch string kernels for discriminative protein classification 作者: Leslie CS, Eskin E, Cohen A, et al.来源出版物: BIOINFORMATICS卷: 20期: 4页: 467-476出版年: MAR 1 2004 105 15.0023 标题: TAMBIS: Transparent access to multiple bioinformatics information sources 作者: Stevens R, Baker P, Bechhofer S, et al.来源出版物: BIOINFORMATICS卷: 16期: 2页: 184-185出版年: FEB 2000 104 9.4524 标题: EXACT AND APPROXIMATION ALGORITHMS FOR SORTING BY REVERSALS, WITH APPLICATION TO GENOME REARRANGEMENT 作者: KECECIOGLU J, SANKOFF D来源出版物: ALGORITHMICA卷: 13期: 1-2页: 180-210出版年: JAN-FEB 1995 104 6.5025 标题: A review of feature selection techniques in bioinformatics 作者: Saeys Y, Inza I, Larranaga P来源出版物: BIOINFORMATICS卷: 23期: 19页: 2507-2517出版年: OCT 1 2007 102 25.5026标题: Ensemble classifier for protein fold pattern recognition 作者: Shen HB, Chou KC来源出版物: BIOINFORMATICS卷: 22期: 14页: 1717-1722出版年: JUL 15 2006 102 20.40二、论文产出科研机构状况该领域产出的这些文献来自全球70多个国家和地区,在这3008篇文献中,美国学者以1205篇的数量高居榜首,其次是德国和英国,中国学者以227篇排名第四,意大利、法国、加拿大、西班牙和日本紧随其后,这九个国家和地区的文献产出超过整体产出的90,文献产出前20的国家和地区如图三所示(合作论文重复计算)。图三、数学与生物信息科学交叉领域文献产出前20的国家和地区同时这些文献来自全球一千四百多个科研机构,其中哈佛大学、曼彻斯特大学、加州大学圣地亚哥分校的论文产出排名三甲,中国科学院排名第五位,表四列出了全球该领域论文产出排名前30的科研机构。表四、数学与生物信息科学交叉领域文献产出前30的科研机构科研机构名称篇数百分比HARVARD UNIV581.93%UNIV MANCHESTER571.89%UNIV CALIF SAN DIEGO461.53%STANFORD UNIV381.26%CHINESE ACAD SCI361.20%MIT321.06%UNIV CALIF BERKELEY301.00%UNIV WASHINGTON301.00%EUROPEAN BIOINFORMAT INST290.96%MAX PLANCK INST MOL GENET270.90%RUTGERS STATE UNIV260.86%UNIV TOKYO260.86%COLUMBIA UNIV250.83%UNIV CALIF LOS ANGELES250.83%YALE UNIV250.83%NATL UNIV SINGAPORE240.80%TEXAS A&M UNIV240.80%UNIV QUEENSLAND240.80%UNIV BIELEFELD230.76%UNIV CAMBRIDGE230.76%CNR220.73%INDIANA UNIV220.73%UNIV BRITISH COLUMBIA220.73%UNIV MUNICH220.73%CNRS210.70%TEL AVIV UNIV210.70%UNIV ILLINOIS210.70%GEORGIA INST TECHNOL200.66%UNIV HEIDELBERG200.66%UNIV ROSTOCK200.66%三、学科分布和学科领域活跃学者情况全球在该领域从事研究的科研人员达到7000多人,目前,该领域最活跃的研究人员是YANG, JY、JIANG, T、VALENCIA, A、CHEN, L、MILANESI, L、WANG, Y等,同时,该领域牵涉到很多的交叉学科,表五和表六分布列出了论文产出排名前15的学者和论文产出排名前15的交叉学科。表五、数学与生物信息科学交叉领域前15个活跃学者作者篇数百分比YANG, JY441.46%JIANG, T160.53%VALENCIA, A160.53%CHEN, L130.43%MILANESI, L130.43%WANG, Y130.43%WEBER, GW130.43%AKUTSU, T120.40%KELL, DB120.40%NOBLE, WS120.40%WANG, LS120.40%WOLKENHAUER, O120.40%BOURNE, PE110.37%ZHANG, XS110.37%LENGAUER, T100.33%LI, X100.33%表六、数学与生物信息科学交叉领域前15个学科论文产出情况学科类别记录数百分比MATHEMATICAL & COMPUTATIONAL BIOLOGY238079.12%BIOCHEMICAL RESEARCH METHODS177759.08%BIOTECHNOLOGY & APPLIED MICROBIOLOGY143947.84%COMPUTER SCIENCE, INTERDISCIPLINARY APPLICATIONS97032.25%STATISTICS & PROBABILITY95931.88%MATHEMATICS, APPLIED2879.54%BIOLOGY1755.82%COMPUTER SCIENCE, INFORMATION SYSTEMS1535.09%OPERATIONS RESEARCH & MANAGEMENT SCIENCE1274.22%MATHEMATICS, INTERDISCIPLINARY APPLICATIONS1183.92%ENGINEERING, BIOMEDICAL1133.76%COMPUTER SCIENCE, THEORY & METHODS762.53%COMPUTER SCIENCE, ARTIFICIAL INTELLIGENCE742.46%CELL BIOLOGY712.36%COMPUTER SCIENCE, SOFTWARE ENGINEERING622.06%ENGINEERING, ELECTRICAL & ELECTRONIC612.03%三、论文产出发表的期刊该领域产出的文献分布在300多种期刊中,其中有超过80的论文集中发表在30种期刊中,表七详细列出了这30种期刊名称和论文数量。表七、数学与生物信息科学交叉领域论文发表前30期刊来源出版物记录数百分比BIOINFORMATICS67922.57%BMC BIOINFORMATICS67722.51%BMC SYSTEMS BIOLOGY1214.02%PLOS COMPUTATIONAL BIOLOGY1183.92%LECTURE NOTES IN BIOINFORMATICS993.29%JOURNAL OF THEORETICAL BIOLOGY852.83%JOURNAL OF COMPUTATIONAL BIOLOGY682.26%INTERNATIONAL JOURNAL OF DATA MINING AND BIOINFORMATICS612.03%IEEE-ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS571.89%CURRENT BIOINFORMATICS491.63%PROCEEDINGS OF THE 7TH IEEE INTERNATIONAL SYMPOSIUM ON BIOINFORMATICS AND BIOENGINEERING, VOLS I AND II391.30%IET SYSTEMS BIOLOGY371.23%DISCRETE APPLIED MATHEMATICS361.20%IEE PROCEEDINGS SYSTEMS BIOLOGY321.06%ALGORITHMICA280.93%EXPERT SYSTEMS WITH APPLICATIONS280.93%IEEE TRANSACTIONS ON INFORMATION TECHNOLOGY IN BIOMEDICINE240.80%COMPUTERS IN BIOLOGY AND MEDICINE230.76%SIAM JOURNAL ON COMPUTING190.63%EVOLUTIONARY BIOINFORMATICS170.57%PHYSICAL REVIEW E170.57%MATHEMATICAL BIOSCIENCES160.53%PATTERN RECOGNITION IN BIOINFORMATICS, PROCEEDINGS160.53%BMEI 2008: PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON BIOMEDICAL ENGINEERING AND INFORMATICS, VOL 1140.47%DATA INTEGRATION IN THE LIFE SCIENCES, PROCEEDINGS140.47%ALGORITHMS FOR MOLECULAR BIOLOGY130.43%FUNDAMENTA INFORMATICAE130.43%JOURNAL OF COMBINATORIAL OPTIMIZATION130.43%LECTURE NOTES IN OPERATIONS RESEARCH130.43%ALGORITHMS IN BIOINFORMATICS, PROCEEDINGS120.40%GENOME INFORMATICS SERIES120.40%JOURNAL OF MATHEMATICAL BIOLOGY120.40%四、中国学者该领域的研究状况目前,中国学者在该领域的论文产出以227篇的数量排名第四位,这些论文总被引用1529次,篇均6.74次,与国际篇均被引8.5次尚有一定的差距,单篇最高被引159次,与国际单篇最高被引685次差距较大。另外,中国学者与国际上15个国家和地区的科研人员有合作关系,合作论文138篇,其中主要合作的国家和地区是美国、加拿大、日本和英国,与这几个国家和地区之间的合作论文占总合作论文的79,同时这227篇论文发表在国际上65种期刊或会议录上,另外中国以下学者为高产作者ZHANG, XS、CHEN, L、WANG, LS、WANG, Y、CHOU, KC、LI, X,自2000年以来发表的论文数量在8篇以上,最多11篇。表八和表九分别列出了中国学者top20论文及发表论文较多的几种期刊。表八、中国学者该领域top20论文序号文献信息被引次数年均被引1标题: Reconstruction of metabolic networks from genome data and analysis of their global structure for various organisms 作者: Ma HW, Zeng AP来源出版物: BIOINFORMATICS 卷: 19 期: 2 页: 270-277 出版年: JAN 22 2003 159 19.882 标题: Ensemble classifier for protein fold pattern recognition 作者: Shen HB, Chou KC来源出版物: BIOINFORMATICS 卷: 22 期: 14 页: 1717-1722 出版年: JUL 15 2006 102 20.403标题: Using Chous amphiphilic pseudo-amino acid composition and support vector machine for prediction of enzyme subfamily classes 作者: Zhou XB, Chen C, Li ZC, et al.来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 248 期: 3 页: 546-551 出版年: OCT 7 2007 94 23.504 标题: SLLE for predicting membrane protein types 作者: Wang M, Yang H, Xu ZH, et al.来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 232 期: 1 页: 7-15 出版年: JAN 7 2005 77 11.005标题: Prediction of apoptosis protein subcellular location using improved hybrid approach and pseudo-amino acid composition 作者: Chen YL, Li QZ来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 248 期: 2 页: 377-381 出版年: SEP 21 2007 65 16.256 标题: Fuzzy KNN for predicting membrane protein types from pseudo-amino acid composition 作者: Shen HB, Yang J, Chou KC来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 240 期: 1 页: 9-13 出版年: MAY 7 2006 65 13.007标题: Predicting the cofactors of oxidoreductases based on amino acid composition distribution and Chous amphiphilic pseudo-amino acid composition 作者: Zhang GY, Fang BS来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 253 期: 2 页: 310-315 出版年: JUL 21 2008 48 16.008标题: Prediction of protein structural class with Rough Sets 作者: Cao YF, Liu S, Zhang LD, et al.来源出版物: BMC BIOINFORMATICS 卷: 7 文献编号: 20 出版年: JAN 14 2006 45 9.009 标题: Discovering disease-genes by topological features in human protein-protein interaction network 作者: Xu JZ, Li YJ来源出版物: BIOINFORMATICS 卷: 22 期: 22 页: 2800-2805 出版年: NOV 15 2006 43 8.6010 标题: Predicting membrane protein type by functional domain composition and pseudo-amino acid composition 作者: Cai YD, Chou KC来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 238 期: 2 页: 395-400 出版年: JAN 21 2006 43 8.6011标题: Predicting subcellular localization of proteins in a hybridization space 作者: Cai YD, Chou KC来源出版物: BIOINFORMATICS 卷: 20 期: 7 页: 1151-1156 出版年: MAY 1 2004 38 5.4312 标题: SPEM: improving multiple sequence alignment with sequence profiles and predicted secondary structures 作者: Zhou HY, Zhou YQ来源出版物: BIOINFORMATICS 卷: 21 期: 18 页: 3615-3621 出版年: SEP 15 2005 37 6.1713 标题: Predicting enzyme family classes by hybridizing gene product composition and pseudo-amino acid composition 作者: Cai YD, Zhou GP, Chou KC来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 234 期: 1 页: 145-149 出版年: MAY 7 2005 29 4.8314 标题: Novel scales based on hydrophobicity indices for secondary protein structure 作者: Kurgan LA, Stach W, Ruan J来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 248 期: 2 页: 354-366 出版年: SEP 21 2007 27 6.7515 标题: Edge-based scoring and searching method for identifying condition-responsive protein-protein interaction sub-network 作者: Guo Z, Li YJ, Gong X, et al.来源出版物: BIOINFORMATICS 卷: 23 期: 16 页: 2121-2128 出版年: AUG 15 2007 25 6.2516 标题: Predicting rRNA-, RNA-, and DNA-binding proteins from primary structure with support vector machines 作者: Yu XJ, Cao JP, Cai YD, et al.来源出版物: JOURNAL OF THEORETICAL BIOLOGY 卷: 240 期: 2 页: 175-184 出版年: MAY 21 2006 25 5.0017 标题: Discovering patterns to extract protein-protein interactions from the literature: Part II 作者: Hao Y, Zhu XY, Huang ML, et al.来源出版物: BIOINFORMATICS 卷: 21 期: 15 页: 3294-3300 出版年: AUG 1 2005 23 3.8318 标题: Towards precise classification of cancers based on robust gene functional expression profiles 作者: Guo Z, Zhang TW, Li X, et al.来源出版物: BMC BIOINFORMATICS 卷: 6 文献编号: 58 出版

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论