利用生物信息学方法对基质细胞衍生因子1(SDF-1)进行基因序列和蛋白质序列分析毕业论文1.doc_第1页
利用生物信息学方法对基质细胞衍生因子1(SDF-1)进行基因序列和蛋白质序列分析毕业论文1.doc_第2页
利用生物信息学方法对基质细胞衍生因子1(SDF-1)进行基因序列和蛋白质序列分析毕业论文1.doc_第3页
利用生物信息学方法对基质细胞衍生因子1(SDF-1)进行基因序列和蛋白质序列分析毕业论文1.doc_第4页
利用生物信息学方法对基质细胞衍生因子1(SDF-1)进行基因序列和蛋白质序列分析毕业论文1.doc_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

利用生物信息学方法对基质细胞衍生因子1(sdf-1)进行基因序列和蛋白质序列分析毕业论文前 言动 动脉粥样硬化(atherosclerosis,as)是由多因素所致的血管炎症性疾病,其病变特点之一是动脉粥样硬化斑块部位有炎症细胞的浸润,巨噬细胞源性泡沫细胞是动脉粥样硬化早期的重要事件。实验报道,动脉粥样硬化病变部位的趋化因子较正常高。 趋化因子是由不同类型的细胞分泌的低分子量(8-10kd) 的与白细胞趋化和激活有关的蛋白质。到目前为止已发现50多种,按照nh2-半胱氨酸基序的不同,可将趋化因子分为4个亚家族,即c、cc、cxc和cx3c。趋化因子受体是gpcr(g-protein-coupled receptors)超家族成员,是一族与g蛋白偶联的、具有7个疏水的跨膜结构的受体。它广泛表达于各类淋巴细胞、内皮细胞、神经元等。趋化因子在动脉粥样硬化发生中起着主导作用,针对趋化因子及其受体的干预药物,应用于动脉粥样硬化的治疗将有着诱人的前景。基质细胞衍生因子-1(stromal cell-derived factor-1 alpha, sdf-1)及其特异受体cxcr4在胚胎发育、肿瘤细胞迁移及介导免疫缺陷病毒(hiv) 感染中发挥重要作用,最近又在动脉粥样硬化斑块中发现sdf-1高表达,sdf-1/cxcr4与动脉粥样硬化的关系已经引起重视,从生物信息学角度对其进行分析有重要的意义。生物信息学主要是利用生物学数据库,运用计算机、网络及生物学软件,对海量生物原始数据进行基因组序列注释,以作为科研的实验依据。从生物信息学研究的角度出发主要有三大类方法可用于大通量的基因组功能注释工作: 用最大相似的同源基因的功能注释咨询序列; 用模体(motif) 搜索,因为模体往往是功能相关的保守序列; 直系同源簇方法 (cluster of orthologous group, cog),即用不同种族的基因成对相似聚类法把它们划分成各种直系同源簇,从而可以用同一簇中的已知基因注释未知基因。同时结构基因组的研究使得三维结构模建和结构类的识别成为基因组功能注释的一个重要方面13。 我们选择该序列进行研究。从核酸和蛋白质两个方面对sdf-1进行详尽的生物信息学分析。核酸分析方面主要分析其核酸序列的基本性质,如限制性酶切位点,基因组在染色体上的定位。蛋白质分析方面,首先分析sdf-1序列的基本性质,包括氨基酸组成、分子量、等电点、亲疏水性、蛋白酶切位点、信号肽,分析其二级结构和三级结构,重点分析其保守结构、模体(motif),分子立体结构的裂口和穴,a、b链间的相互作用,配基,多重序列比对,进化分析等。 研究目的:通过以上过程,搜寻并整理网上储存的sdf-1信息,进一步熟练巩固生物信息学课程的理论与实践知识,熟练操作bioedit、dnaman等生物信息学分析软件,为生物信息学课程建设提供和补充新的血液,并以sdf-1为入口,学习与研究生物信息学方面的前沿知识和更新后的软件操作,得到sdf-1基因和蛋白方面的资料,配合正在开展的对sdf-1 基因的研究,分别从氨基酸序列和空间构象入手搜寻sdf-1的相似分子,为进一步研究该基因的调控及以此为靶点的药物筛选收集信息,并从分子水平分析sdf-1分子结构与功能的关系,重点研究其趋化功能相应的分子结构。一、 生物信息学分析(一)工具与方法采用bioedit7.0和dnaman3.0分析软件工具和在线有关蛋白质和核酸方面的分析软件,分别进行核酸和蛋白质两个方面的分析。核酸分析首先从pubmed核酸数据库中搜索到人的sdf-1a链核酸序列,分别进行序列的基本性质分析,限制性酶谱分析及其基因在染色体上的定位分析。具体操作方法将根据上述各个软件上“help”文件进行,基因在染色体上的定位分析根据网页上的操作说明进行。从pubmed蛋白质数据库中搜索到人的sdf-1a链、b链和整个前体sdf-1蛋白质序列,分别进行蛋白序列的基本性质分析(氨基酸组成、分子量、等电点),亲疏水性分析,蛋白酶切位点分析,信号肽序列分析,二级结构和三维结构分析,同源序列和进化分析。二级结构分析包括结构功能域、motif、保守位点、ab链间的相互作用及离子配基等,具体操作方法将根据上述各个软件上“help”文件和网页上的操作说明进行。(二)结果 pdb入口从下表可见,人的sdf-1有“a”、“b”两条链,其可形成2具体,但它的活性形式为单链,通常讲的sdf-1就是指其“a”链。另外表中还有pdbid(1a15)及系统入口编号(p48061)。pdb id:1a15name:chemokinetitle:sdf-1alpha structure:stromal derived factor-1alpha. chain: a, b. synonym: sdf-1. engineered: yes. mutation: n33asource: synthetic: yes. homo sapiens. human. other_details: chemically synthesizeduniprot: chains a, b: p48061 (sdf1_human) pfam表1.sdf-1蛋白数据库入口1核酸序列分析 sdf-1的核酸序列的基本性质分析:分析结果显示:我们获得sdf-1cdna序列长度为279bp,其分子量为:ssdna:84.55kda,dsdna:169.70kda.四碱基的含量分别为:a: 26.16%,c: 21.86%,g: 29.39%,t: 22.58%.origin 1 ccatggacgc caaggtcgtc gctgtgctgg ccctggtgct ggccgcgctc tgcatcagtg 61 acggtaagcc agtcagcctg agctacagat gcccctgccg attctttgag agccatgtcg 121 ccagagccaa cgtcaaacat ctgaaaatcc tcaacactcc aaactgtgcc cttcagattg 181 ttgcaaggct gaaaagcaac aacagacaag tgtgcattga cccgaaatta aagtggatcc 241 aagagtacct ggacaaagcc ttaaacaagt aagcacaaca gcccaaagga cttdna molecule: length = 279 base pairsmolecular weight = 84555.00 daltons, single strandedmolecular weight = 169700.00 daltons, double strandedg+c content = 51.25%a+t content = 48.75%nucleotide number mol% a 73 26.16 c 61 21.86 g 82 29.39 t 63 22.58图2-1 sdf-1cdna的碱基组成 限制性酶切分析 限制性酶切分析是分子生物学实验中的日常工作之一。 利用dnaman软件分析该基因cdna序列的限制性内切酶的酶切位点,分析结果如下:该基因序列含有24种限制性内切酶的酶切位点(这24种限制性内切酶为tspdti、mwoi、bpu10i、agei、hpyf10vi、bsemii、bspcni、bsawi、bsrfi、bceai、cac8i、apoi、bbvi、hphi、bsshii、hgai、alwi、psti、sfci、hpy188iii、haeii、acli、afei、drai)。同时,从图(2.2)中我们获得了这些内切酶在sdf-1基因上的具体酶切位点。restriction enzyme map:1 atgaacgcgaaagtggtggtggtgctggtgctggtgctgaccgcgctgtgcctgagcgatggcaaaccggtgagcctgag 801 tacttgcgctttcaccaccaccacgaccacgaccacgactggcgcgacacggactcgctaccgtttggccactcggactc 80 tspdti mwoi bpu10i agei bpu10i hpyf10vi bsawi bsemii bsrfi bspcni bsemii bspcni 81 ctatcgttgcccgtgccgtttttttgaaagccatgtggcgcgtgcgaacgtgaaacatctgaaaattctgaacaccccga 16081 gatagcaacgggcacggcaaaaaaactttcggtacaccgcgcacgcttgcactttgtagacttttaagacttgtggggct 160 bceai hpyf10vi cac8i apoi bbvi hphi mwoi 161 actgcgcgctgcagattgtggcgcgtctgaaaaacaacaaccgtcaggtgtgcattgatccgaaactgaaatggattcag 240161 tgacgcgcgacgtctaacaccgcgcagactttttgttgttggcagtccacacgtaactaggctttgactttacctaagtc 240 bsshii hgai alwi hpy188iii cac8i psti sfci 241 gaatatctggaaaaagcgctgaacaaacgttttaaaatg 279241 cttatagacctttttcgcgacttgtttgcaaaattttac 279 hpy188iii haeii acli afei drai 图2.2 sdf-1的cdna限制性酶谱分析(/mapview/map_search.cgi?taxid=9606&query=) 从ncbi查询sdf-1基因在人类基因组中的定位基因组的定位分析显示,该基因定位在第10号染色体长臂的第一区第一亚区,第2小区内。红色部分cxcl12指示sdf-1基因的具体位置。 图2-3:sdf-1基因定位:红色部分cxcl12指sdf-1 sdf基因表达调控(/cgi-bin/pub/databases/transpath ) 2蛋白质序列分析 利用expasy软件包对该基因进行氨基酸组成统计、分子量、等电点等分析(http:/www.expasy.ch/tools/)compute pi/mw:是expasy工具包中的程序,计算sdf-1蛋白质的氨基酸组成统计、等电点和分子量。分析结果显示该蛋白为分子量10665.85da,pi为9.92,为一碱性蛋白质。sdf-1的a链分子量7835.26da,pi为10.33(见图3-1,示其等电点和理论分子量,从图中可以清楚地看出不同ph值条件下其所带电荷,ph为10时,其还带正电荷,ph值为10.50时其已经带上了负电荷,故计算得其理论等电点为10.33),为一碱性蛋白质,b链分子量6718.98 da,pi为9.76,为一碱性蛋白质。sdf1_human (p48061)de stromal cell-derived factor 1 precursor (sdf-1) (cxcl12) (pre-b cellde growth stimulating factor) (pbsf) (hirh) contains: sdf-1-beta(3-72);de sdf-1-alpha(3-67).os homo sapiens (human).the computation has been carried out on the complete sequence. molecular weight: 10665.85 theoretical pi: 9.92 iep of fastasequence from 1 to 67 isoelectric point = 10.3329 ph bound charge ph bound charge 1.00 25.99 14.99 8.00 17.87 6.87 1.50 25.98 14.98 8.50 16.49 5.49 2.00 25.94 14.94 9.00 14.99 3.99 2.50 25.81 14.81 9.50 13.74 2.74 3.00 25.47 14.47 10.00 12.30 1.30 3.50 24.67 13.67 10.50 10.24 -0.76 4.00 23.39 12.39 11.00 7.80 -3.20 4.50 22.15 11.15 11.50 5.79 -5.21 5.00 21.38 10.38 12.00 4.24 -6.76 5.50 20.97 9.97 12.50 2.65 -8.35 6.00 20.55 9.55 13.00 1.25 -9.75 6.50 19.97 8.97 14.00 0.16 -10.84 7.00 19.34 8.34 7.50 18.74 7.74 图3-1 sdf-1的等电点分析利用bioedit软件进行其详细的理化参数分析:从表2和图3-2氨基酸组成来看,该蛋白序列含有较多的碱性氨酸,特别是赖氨酸(lys,占10.45)和精氨酸(arg,占7.46),其所含酸性氨基酸较少,如天冬氨酸(asp,占1.49)、谷氨酸(glu,占4.48),另外,其序列中含的非极性氨基酸最多的是亮氨酸(lue,占11.94),其次是异亮氨酸(ile,占5.97)为其二级结构的螺旋和折叠片的形成打下基础。序列中含有一定数量的带羟基的氨基酸,如丝氨酸(ser,占4.48),苏氨酸(thr,占1.49)和酪氨酸(tyr,占2.99),这为该蛋白的磷酸化修饰打下了基础。 amino acid number mol%met m 0 0.00 asn n 7 10.45 pro p 4 5.97 gln q 3 4.48 arg r 5 7.46 ser s 3 4.48 thr t 1 1.49 val v 5 7.46 ala a 5 7.46 cys c 4 5.97 asp d 1 1.49 glu e 3 4.48 phe f 2 2.99 gly g 0 0.00 his h 2 2.99 ile i 4 5.97 lys k 7 10.45 leu l 8 11.94 trp w 1 1.49 tyr y 2 2.99表2:sdf-1蛋白的氨基酸组成protein:length = 67 amino acidsmolecular weight = 7834.88 daltons图3-2 sdf-1a链氨基酸组成分析图 利用bioedit对蛋白进行亲疏水性分析基于bioedit软件的亲疏水性分析的计算方式,基线上方+1.5以上代表亲水性,基线下方-1.5以下代表疏水性。由此我们可从图3-3分析图中得知sdf-1的a链蛋白没有明显的亲疏水性区域。图3-3 sdf-1a链亲疏水分析图表3为sdf-1a链酶切位点分析图,可见该蛋白包含大部分蛋白酶的裂解位点,其中以蛋白酶k的裂解位点最多(proteinase k,43个),其次是嗜热菌蛋白酶(thermolysin,39个)、胃蛋白酶(pepsin,28个),其次有2个溴化氰的裂解位点。 蛋白酶切位点分析name of enzymeno. of cleavagespositions of cleavage sitesarg-c proteinase629 33 41 62 68 90asp-n endopeptidase219 72bnps_skatole178cnbr21 93chymotrypsin-high specificity (c-term to fyw, not before p)628 34 35 78 82 91chymotrypsin-low specificity (c-term to fywml, not before p)231 9 11 13 16 18 26 28 34 35 38 46 47 50 57 63 76 78 82 83 87 91 93clostripain629 33 41 62 68 90formic acid173glutamyl endopeptidase336 81 84iodosobenzoic acid178lysc104 22 45 48 64 75 77 85 89 92ntcb (2-nitro-5-thiocyanobenzoic acid)516 29 31 54 70pepsin (ph1.3)288 9 10 11 12 13 15 16 17 18 25 26 27 28 34 34 46 49 56 57 63 76 78 81 82 82 83 86pepsin (ph2)238 9 10 11 12 13 15 16 17 18 25 26 34 34 46 49 56 57 63 76 82 83 86proline-endopeptidase123proteinase k433 5 6 7 8 9 10 11 12 13 14 15 16 18 24 26 28 34 35 39 40 42 44 47 49 50 52 56 57 59 60 61 63 70 72 76 78 79 82 83 86 87 91staphylococcal peptidase i336 81 84thermolysin392 4 5 6 7 8 9 10 11 12 14 15 17 23 25 33 34 38 39 41 43 46 48 49 55 56 58 59 60 62 69 71 75 78 82 85 86 90 92trypsin154 29 33 41 45 48 62 64 68 75 77 85 89 90 92表3:酶切位点(these enzymes cleave the sequence)利用signalp软件对该蛋白序列进行信号肽分析 (http:/www.cbs.dtu.dk/services/signalp-2.0/)分析结果显示:由于sdf-1是成熟的分泌蛋白,单独的sdf-1其a链和b链都没有信号序列,只是在sdf-1全序列(93个氨基酸残基)在第20个氨基酸残基左右发现一个较强的信号肽信号(见图3-4),n端(第3第18位氨基酸之间)发现有一个信号(signal)序列(见图3-5),其存在的几率为1,且在第21位和第22位氨基酸之间有一个信号肽酶的水解位点,且较容易发生裂解(裂解几率为0.768)。signalp-nn result:图3-4信号序列-nn分析图sequence length = 93# measure position value cutoff signal peptide? max. c 22 0.643 0.32 yes max. y 22 0.709 0.33 yes max. s 13 0.989 0.87 yes mean s 1-21 0.937 0.48 yes d 1-21 0.823 0.43 yes# most likely cleavage site between pos. 21 and 22: sdg-kp图3-5信号序列-hmm分析图sequenceprediction: signal peptidesignal peptide probability: 1.000signal anchor probability: 0.000max cleavage site probability: 0.768 between pos. 21 and 22图3.4 sdf-1蛋白的信号肽分析结果(4-2)sdf-1基因的电子表达谱(e-northern)分析/page/tissuehome在此网站中进行的e-northern的结果,(图7)此基因在大部分组织器官都有表达,在淋巴网状内皮细胞中有大量表达,而在心脏、肺、肌肉等少数组织器官中有较多表达。在胚胎、胃肠道、肝、眼睛少数组织器官中一定量表达,只有在脑、胰腺、胎盘等少数几个器官中少量表达。图7 sdf-1基因的电子表达谱2.3.3亚细胞定位用pegfp-c1-sdf-1(orf)质粒dna用脂质体法转染人脐静脉内皮细胞株ecv-304细胞。48h后,经过dapi染色细胞核, 在荧光显微镜下观察并拍照。egfp蛋白被激发出绿色荧光。结果显示 egfp-hole融合蛋白主要在细胞质和细胞膜上表达(图13)。a b c 图13 sdf-1蛋白在细胞中的定位情况。 (a) 表示egfp- sdf-1融合蛋白在ecv-304的表达;(b)表示的是dap1染细胞核;(c)表示的是a和b重叠图。根据计算机软件对sdf-1蛋白的亚细胞定位的分析(图2-14)以及实验结果(图2-13), sdf-1蛋白可能定位在细胞质,又有一个信号肽,因此sdf-1蛋白可能是一个分泌蛋白。 results of the k-nn predictionhttp:/psort.nibb.ac.jp/k = 9/23 55.6 %: extracellular, including cell wall 11.1 %: vacuolar 11.1 %: nuclear 11.1 %: mitochondrial 11.1 %: endoplasmic reticulum prediction for query is exc (k=9)图14 利用在线工具psortii分析sdf-1蛋白的亚细胞定位 该蛋白序列的二级结构进行分析 利用nnpredict软件进行蛋白序列的二级结构分析(/tools/)从图3-6可见,螺旋共有2个区域,其中一个为3型,另一个为“h”型,8个转角,3条反平行a型片层,2个发夹结构(桥),分别在934、1150两个位点形成2对二硫键。完整的sdf-1有信号序列,sdf-1a链无信号序列。1 kpvslsyrcp crffeshvar anvkhlkiln tpncalqiva rlknnnrqvc s ss b g ggbseeeeee ettteeeeee eettt eee 51 idpklkwiqe ylekaln e tt hhhhh hhhhh s:strand;b:b-truns;g:hairpins;e:sheet;t:turn;h:helices.chain (67 residues) uniprot code: p48061 (sdf1 alpha_human) pfam structural classification (1domain) : domain links cath no. class architecture 1 0 = mainly beta barrel 图3-6:sdf-1a链二级结构示意图promotf: 1sheet,3strands, 2 helices, 8 beta turns,2 beta bulges,2 disulphide bridge.附:具体各项参数sheet no.strands type barrel topology- a 6 antiparallel no -1 -1 3 1 1strand no. start end sheet no.residues edge sequence- 1 23 31 a 9 no vkhlkilnt 2 35 42 a 8 no alqivarl 3 48 51 a 4 yes qvci helix number of unit residuesnumber start end type residues length rise per turn pitch deviation sequence-1 20 22 g 3 - - - - - ran 2 56 64 h 9 14.97 1.63 3.55 5.79 9.9 kwiqeylek i+1 i+2 - -start end sequence turntype phi psi chi1 phi psi chi1 cadist hbond-3 - 6 vsls iv -83.2 148.2 -178.2 49.3 38.8 -82.2 6.5 no 4 - 7 slsy iv 49.3 38.8 -82.2 -140.2 -25.5 56.6 6.7 no 9 - 12 cpcr viii -52.1 -36.6 -31.4 -125.5 136.2 -57.7 6.8 no 31 - 34 tpac i -54.8 -47.6 -34.2 -72.7 -27.1 - 5.4 no 32 - 35 paca i -72.7 -27.1 - -112.3 -9.8 -46.5 5.6 no 42 - 45 lknn i -79.8 -35.8 177.7 -71.1 -32.7 78.3 5.9 no 43 - 46 knnn iv -71.1 -32.7 78.3 -131.5 3.0 54.6 5.3 no 52 - 55 dpkl i -66.2 -28.3 -26.7 -69.3 4.0 -25.5 5.9 yes bulge type residue x residue 1 residue 2 residue 3 residue 4-antiparallel classic a 41 r a 24 k a 25 h antiparallel g1 a 42 l a 46 n a 47 r strand 1 strand 2start end length start end length class- 23 31 9 35 42 8 3: 3 35 42 8 48 51 4 4: 6 cysteine 1 cysteine 2 type chi1 chi2 chi3 chi2p chi1p cadist- a 9 a 34 lhs -68.4 -58.9 -85.4 -74.4 -46.5 5.5 a 11 a 50 lhs -57.7 -66.7 -87.8 -104.3 -60.0 5.9 蛋白序列的三维分子结构向pdb(protein data bank,蛋白质立体结构数据库)提交该蛋白质序列,利用rasmol软件显示sdf-1a链蛋白的三维分子结构。该蛋白的三维分子结构呈现一个典型的希腊钥匙状结构。明显可见2个螺旋区域,8个转角,3条反平行a型片层,2个发夹结构(桥)。其分子中心裂口里面部分有阴离子结合位点清晰可见。图3-7 sdf-1a链三维结构示意图 预测该蛋白的功能结构域 在ncbi中利用cdd(conserved domain database)预测该蛋白结构功能域从pubmed界面进入blastp部分,即可以进入cdd界面,分析结果显示(如图3-8所示):该蛋白序列含有4个相关结构功能域;即趋化因子cxc家族所具有的两个“c”残基中间被间隔开的本家族特征性标记。并且从图中我们可知道此蛋白含有趋化因子家族共同结构域gnl|cdd|27806,及intercrine alpha 家族的“scy”功能域,参与细胞特异趋化性介导细胞生长和炎性反应。另外还有il-8样功能域gnl|cdd|25372。 图3-8 sdf-1a链结构功能域预测gnl|cdd|27806, 趋化因子cxc:包括一系列生长因子和干扰素,参与分裂、趋化和炎症;其许多成员含有一个“rcxc”基序,可能是结合cxc趋化因子受体所需要的;“elr”基序为趋化中性粒细胞所需并参与血管生成,以单体或二聚体存在,但其功能形式为单体,仅仅在脊椎动物和少数病毒中发现。 cd-length = 64 residues, 100.0% aligned score = 52.2 bits (125), expect = 1e-08query: 6 syrcpcrffesh-varanvkhlkil-ntpnca-lqivarlknnnrqvcidpklkwiqeyl 62sbjct: 1 elrcrcikttsgfvhpksikklevippgphcpnteiiatlkng-rkvclnpeapwvqkii 59query: 63 ekaln 67sbjct: 60 kkllk 64gnl|cdd|27804:小分子趋化因子包括一系列生长因子和干扰素,参与分裂、趋化和炎症;因其受体而与其它细胞因子相区别,其受体与g蛋白偶联,根据n端2个“c”残基分为4个亚家族,一些成员能与多个受体结合,且多数受体能与1个以上的趋化因子结合,这种冗余精确调控免疫系统维持细胞的内稳态。 cd-length = 59 residues, 100.0% aligned score = 42.2 bits (99), expect = 1e-05query: 10 pcrffes-hvaranvkhlkilnt-pncalqivarlknnnrqvcidpklkwiqeylekal 66sbjct: 1 cclkytskpippkniksyrvqeagghcsipavifttkkg-rkvcadpkepwvkdliqkld 59gnl|cdd|25294:“scy”,intercrine alpha 家族(小分子细胞因子 c-x-c)。参与细胞特异趋化性介导细胞生长和炎性反应。 cd-length = 60 residues, 98.3% aligned score = 46.0 bits (109), expect = 1e-06query: 6 syrcpcrffeshvaranvkhlkilntpncalqivarlknnnrqvcidpklkwiqeylek 64sbjct: 1 plrcclsytskkipprriksyyritsshcpkpavifttkrgrkvcadpkakwvqryikk 59gnl|cdd|25372, 小分子细胞因子(intecrine/chemokine),interleukin-8样。包括一系列生长因子和干扰素,参与分裂、趋化和炎性活性。结构中含有2个高度保守的二硫键。 cd-length = 68 residues, 88.2% aligned score = 43.3 bits (102), expect = 7e-06query: 6 syrcpcrffeshvaranvkhlk-ilntpncal-qivarlknnnrqvcidpklkwiqeyle 63sbjct: 8 plrcclsytsrkippkriksyeviptsshcpkpavifttkng-revcadpkakwvqkiik 66query: 64 k 64sbjct: 67 k 67 sdf-1a链(pdb1a15)的ramachandran 曲线 procheck 总结图3-9 ramachandran 曲线统计sdf-1a链的ramachandran 曲线统计如图3-9,ramachandran分析sdf-1a链形成最合适的结构功能域的结果如图3-9所示,sdf-1a链最合适形成结构功能域的区域为a,b,l三个位点,其理论参与氨基酸残基数为92,-tage数为81.4%,额外允许存在结构功能域为a,b,l,p四个位点,相应的其理论参与氨基酸残基数为18,-tage数为15.9%,普通允许存在结构功能域的区域为a,b,l,p四个位点,其理论参与氨基酸残基数为1,-tage数为0.9%,不允许存在结构功能域的区域为xx两个位点,其理论参与氨基酸残基数为2,-tage数为1.8%,非甘氨酸和非脯氨酸残基其理论参与氨基酸残基数为92,-tage数为100%,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论