




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学中的分类学习问题 邹权厦门大学计算机科学系 2 提纲 DNA RNA层面上的分类学习问题蛋白质层面的分类学习问题新技术带来的分类学习问题 3 几个概念 基因 基因组 DNA 染色体 细胞 4 5 6 7 DNA如何影响生物的性状 什么叫表达 8 中心法则 9 ATTCACAGTGGA I H S G 10 是否所有的DNA都转录 人 仅仅1 是否所有的RNA都翻译 11 真核生物的基因结构 真核细胞基因结构示意图 12 13 问题1 识别编码区 ORF Snyder E E andStormo G D 1993 IdentificationofcodingregionsingenomicDNAsequences Anapplicationofdynamicprogrammingandneuralnetworks NucleicAcidsRes 21 607 613 问题2 辨别外显子 内含子T M Chen C C Lu W H Li 2005 PredictionofsplicesiteswithdependencygraphsandtheirexpandedBayesiannetworks Bioinformatics 21 471 482 问题3 识别可变剪切GideonD etal 2005 Accurateidentificationofalternativelysplicedexonsusingsupportvectormachine Bioinformatics 21 897 901问题4 识别调控元件JiangB ZhangMQ ZhangX 2007 OSCAR one classSVMforaccuraterecognitionofcis elements Bioinformatics 23 5 531 537 14 问题1 识别ORFNN GRAIL amulti agentneuralnetworksystemforgeneidentification HMM决策树 AdecisiontreesystemforfindinggenesinDNA JCB98 15 16 问题2 辨别外显子 内含子 外显子内含子的分界线 剪切位点也可以称为 识别剪切位点 特征 三连核苷酸 分类器 SVM NB HMM BPNN 17 问题3 识别可变剪切 18 参考 王峻 郭茂祖 转录因子结合位点识别算法的研究 电子学报 2007 35 12A 83 89 问题4 识别motifEM算法GibbsSampling 19 是否所有的DNA都转录 人 仅仅1 4个与机器学习有关的问题 还有更多是否所有的RNA都翻译 编码RNA与非编码RNA 20 21 22 MicroRNA参与调节的疾病举例 癌症 胸腺癌 肺癌 直肠癌 白血病 皮肤癌 成神经细胞瘤 鼻咽癌 卵巢癌 其它疾病 老年性痴呆 糖尿病 心肌肥大 AIDS 23 24 microRNA中的分类问题 挖掘 对前体的真伪辨别同源比对abinitio靶标 对靶标的真伪辨别 25 基于同源比对的方法 利用已知的microRNA信息BLAST逐步过滤参考 Wang X J etal 2004 PredictionandidentificationofArabidopsisthalianamicroRNAgenesandtheirmRNAtargets GenomeBiology 5 R65 26 27 microRNA的挖掘 abinitio方法 ChenghaiXue FeiLi TaoHe Guo PingLiu YandaLi XuegongZhang ClassificationofrealandpseudomicroRNAprecursorsusinglocalstructure sequencefeaturesandsupportvectormachine BMCBioinformatics 2005 6 310 他引167次 截至11 12 12 PengJiang HaonanWu WenkaiWang WeiMa XiaoSun ZuhongLu MiPred classificationofrealandpseudomicroRNAprecursorsusingrandomforestpredictionmodelwithcombinedfeatures NucleicAcidsResearch 2007 35 W339 W344 他引107次 截至11 12 12 28 29 30 31 microRNA中的分类问题 挖掘 对前体的真伪辨别同源比对abinitio靶标 对靶标的真伪辨别 32 靶标预测 参考 ImprovingthepredictionofhumanmicroRNAtargetgenesbyusingensemblealgorithm FEBSLetters581 2007 1587 1593 33 34 提纲 DNA RNA层面上的机器学习问题蛋白质层面的机器学习问题分类 鉴别结构预测相互作用预测新技术带来的机器学习问题 35 36 参考 LYHan JCui HHLin ZLJi ZWCao YSLi andYZChen Recentprogressesintheapplicationofmachinelearningapproachforpredictingproteinfunctionalclassindependentofsequencesimilarity Proteomics2006 6 14 4023 4037 37 TheProteinFoldingProblem Secondarystructures helixAverage10residues orthreeturnsGlutamine methionine andleucinefavor helixValine serine asparticacid andasparaginetendtodestabilizehelices sheetGenerally5 10residuesValine isoleucine andphenylalanineenhance SheetsProlinedoesn tfitwellinto SheetsLoopThesectionsofthesequencethatconnecttheothertwokindsofsecondarystructure 38 蛋白质二级结构预测问题 输入IRNSSNISPASMIFRNLLILEDDLRRQAHEQKILKWQFTLFLASMAGVGAFTFYELYF输出 HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH EEEEEEEE参考 Fusionofclassifiersforproteinfoldrecognition Neurocomputing68 2005 315 321 39 40 41 相互作用预测 相互作用网络相互作用位点预测参考 于建涛 郭茂祖 蔡禄 蛋白质相互作用及其网络预测方法研究进展 电子学报 2007 35 12A 1 7LiMinghui etal Protein proteininteractionsitepredictionbasedonconditionalrandomfields BIOINFORMATICS Vol 23no 52007 pages597 604 42 提纲 DNA RNA层面上的机器学习问题蛋白质层面的机器学习问题新技术带来的机器学习问题microArrayAssemblingSNP 43 44 45 46 microArray中的机器学习问题 样本分类 疾病诊断 高维 小样本代价敏感正反例不平衡属性缺失基因聚类层次聚类参考 时序微阵列数据中的同步和异步共调控基因聚类 计算机学报 2007 30 1302 1314对于基因表达数据的基于类别树和SVM的多类癌症分类算法 计算机研究与发展 2004 41 436 441 Hierarchicalclusteringofgeneexpressionprofileswithgraphicshardwareacceleration PatternRecognitionLetters 2006 27 676 681Acomprehensiveevaluationofmulticategoryclassificationmethodsformicroarraygeneexpressioncancerdiagnosis Bioinformatics 2005 21 631 643 47 测序技术的发展 1 已在市场上的下一代平台 GA Illumina SolexaSBS通过可逆荧光终止法 FISSEQ GSFLX Roche 454LifeSciencesSBS通过焦磷酸测序SOLiD ABI AgencourtSBL通过双碱基编码 48 三十年来测序的发展 49 测序技术的发展 2 2ndGenerationPerformance 50 51 重复区域 52 53 图模型下的片段组装 参考 Butler J Maccallum I Kleber M Shlyakhter I A Belmonte M K Lander E S Nusbaum C andJaffe D B ALLPATHS Denovoassemblyofwhole genomeshotgunmicroreads GenomeRes 2008 18 810 820 Zerbino D andBirney E Velvet AlgorithmsfordenovoshortreadassemblyusingdeBruijngraphs GenomeRes 2008 18 821 829 J T Simpsonetal ABySS Aparallelassemblerforshortreadsequencedata GenomeRes 2009 54 SNP 什么是SNP为什么研究它 55 56 SNP中的计算问题 疾病预测 人群分类参考 HaplotypePatternMining ClassificationfordetectingdiseaseassociatedSite CSB2003nsSNP参考 Findingnewstructuralandsequenceattributestopredictpossiblediseaseassociationofsingleaminoacidpolymorphism SAP Bioinformatics 2007 23 12 1444 1450tagSNP参考 JunWang Mao zuGuo Chun yuWang CGTS asite clusteringgraphbasedtagSNPselectionalgorithmingenotypedata BMCBioinformatics 2009挖掘SNP参考 JunWang QuanZou Mao
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华三考试题库及答案
- 森林火警法律知识培训课件
- 桩基全护筒跟进施工课件
- 桥脑病变MRI课件
- 桥梁隧道冲刺课件
- 2025年技能提升跨行业通-用招聘笔试模拟题及答案
- 2025年陪诊师考试知识点探讨与试题及答案
- 2025年验船师考试(C级船舶检验专业实务)复习题及答案二
- 2025年航空公司面试空中乘务员能力预测试题集
- 2025年物流经理专业面试题解答技巧
- 供应商改善计划表
- DLT 5285-2018 输变电工程架空导线(800mm以下)及地线液压压接工艺规程
- 中国省市县行政区划
- DB11-T 1253-2022 地埋管地源热泵系统工程技术规范
- 管道工程施工重难点分析及应对措施
- JBT 7043-2006 液压轴向柱塞泵
- 体育公园运营可行性方案
- 《直升机构造与系统》课件-直升机的类型
- 成都第四十九中学数学新初一分班试卷含答案
- 《平方根》(第1课时)示范公开课教学设计【北师大版八年级数学上册】
- 《信息检索与处理(修订版)》课件下 第2单元第二课 分析信息-第3单元 综合探究实践活动
评论
0/150
提交评论