根癌土壤杆菌C58 Cereon中分泌蛋白信号肽分析_第1页
根癌土壤杆菌C58 Cereon中分泌蛋白信号肽分析_第2页
根癌土壤杆菌C58 Cereon中分泌蛋白信号肽分析_第3页
根癌土壤杆菌C58 Cereon中分泌蛋白信号肽分析_第4页
根癌土壤杆菌C58 Cereon中分泌蛋白信号肽分析_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

45 卷 4 期2005 年 8 月微 生 物 学 报Acta Microbiologica SinicaVol. 45August No. 420053 通 讯 作 者 :TelPFax :86-871-5228532 ; E-mail :heyueqiu 163. net作 者 简 介 :范 成 明 (1977 - ) ,男 ,山 东 省 邹 平 县 人 ,博 士 研 究 生 。 E-mail : fanchengming 126. com收 稿 日 期 :2005-01-04 ,修 回 日 期 :2005-05-05根 癌 土 壤 杆 菌 C58 Cereon 中 分 泌 蛋 白 信 号 肽 分 析范 成 明 李 成 云 赵 明 富 何 月 秋 3(云 南 农 业 大 学 植 物 保 护 学 院 昆 明 650201)摘 要 :利 用 SignalP310、 LipoP110、 TMHMM210 和 TargetP1101 4 种 蛋 白 分 析 软 件 预 测 了 Agrobacterium tumef aciens C58Cereon 菌 株 全 部 基 因 组 的 4554 个 ORF编 码 的 蛋 白 信 号 肽 ,共 发 现 203 个 信 号 肽 ,且 它 们 的 氨 基 酸 残 基 相 对 保 守 。其 中 158 条 具 分 泌 型 信 号 肽 ,9 条 具 RR-motif 型 信 号 肽 ,28 条 具 信 号 肽 酶 型 信 号 肽 ,8 条 具 细 菌 素 -信 息 素 型 信 号肽 ,但 只 有 分 泌 蛋 白 AGR-C-1878p 和 AGR-C-1880p 的 信 号 肽 氨 基 酸 残 基 完 全 相 同 ,表 明 信 号 肽 是 高 度 变 异 的 。关 键 词 :基 因 组 ,信 号 肽 ,蛋 白 分 析中 图 分 类 号 :Q936 文 献 标 识 码 :A 文 章 编 号 :000126209 (2005) 0420561206根 癌 土 壤 杆 菌 ( Agrobacterium tumef aciens)作 为 一种 载 体 ,在 基 因 工 程 中 的 作 用 是 众 所 周 知 的 。 2001年 该 菌 株 的 基 因 组 测 序 完 成 ,并 对 基 因 组 的 组 成 和结 构 特 点 做 了 较 为 系 统 的 分 析 1 ,为 我 们 在 今 后 的试 验 中 更 好 地 利 用 该 菌 株 进 行 基 因 工 程 的 研 究 提 供了 更 好 的 试 验 依 据 。 但 是 对 于 根 癌 土 壤 杆 菌 基 因 组中 信 号 肽 蛋 白 的 分 析 ,还 未 见 报 道 。多 数 移 位 蛋 白 在 多 肽 的 N 端 具 有 信 号 肽 。 信 号肽 可 以 指 导 蛋 白 运 送 到 蛋 白 的 正 确 作 用 位 点 2 。 尽管 不 同 的 蛋 白 的 信 号 肽 存 在 差 异 ,但 信 号 肽 的 基 本 结构 是 相 似 的 3 。 信 号 肽 一 般 有 3 个 明 显 的 结 构域 4 ,5 ,即 N- domain、 H- domain、 C- domain。 随 着 人 们 对信 号 肽 研 究 的 深 入 ,人 们 根 据 信 号 肽 酶 识 别 信 号 肽 序列 的 不 同 将 信 号 肽 分 成 4 类 6 :信 号 肽 酶 型 7 、 信 号肽 酶 型 8 ,9 、 ComC型 10和 细 菌 素 2信 息 素 型 11 。随 着 生 物 信 息 学 的 迅 速 发 展 ,对 蛋 白 的 结 构 和功 能 进 行 预 测 ,如 蛋 白 的 信 号 肽 预 测 12 ,13 、 作 用 位 点的 预 测 13 和 跨 膜 结 构 的 预 测 14 等 ,已 成 为 生 物 信 息学 研 究 的 重 要 组 成 部 分 ,同 时 也 为 今 后 的 试 验 提 供更 可 靠 的 依 据 ,使 实 验 更 有 目 的 性 。 但 每 个 软 件 都有 自 己 的 优 点 和 不 足 ,为 了 减 少 误 差 ,在 对 核 酸 或 蛋白 序 列 进 行 分 析 时 ,一 般 都 采 用 多 个 软 件 同 时 分 析 。当 不 同 的 软 件 分 析 的 结 果 有 较 大 的 出 入 时 ,如 何 取舍 常 常 是 研 究 者 很 困 惑 的 问 题 。 本 文 以 4 种 软 件 对根 癌 土 壤 杆 菌 染 色 体 基 因 组 中 信 号 肽 预 测 的 结 果 为例 ,对 其 信 号 肽 的 特 征 及 不 同 软 件 间 产 生 差 异 的 可能 原 因 和 解 决 办 法 进 行 了 阐 述 。1 材 料 和 方 法111 材 料所 利 用 的 染 色 体 基 因 组 来 源 于 ftp :PPftp. ncbi.hih. govPgenomesPBacteriaPAgrobacterium- tumefaciens -C58 - Cereon。 染 色 体 中 共 有 4554 个 ORF。112 方 法利 用 http :PPwww. cbs. dtu. dkPservices 提 供 的SignalP310、 LipoP110、 TMHMM210 和 TargetP1101 4 种蛋 白 分 析 软 件 ,筛 选 Agrobacterium tumef aciens C58Cereon 菌 株 的 全 部 染 色 体 基 因 所 编 码 的 部 分 分 泌 型蛋 白 。11211 SignalP310 计 算 分 析 :利 用 SignalP-NN 中 的Dscore 和 Smean 及 SignalP- HMM 中 的 Cmax3 个 参 数对 土 壤 杆 菌 的 基 因 组 进 行 初 步 的 筛 选 ,将 其 分 成 具有 信 号 肽 的 和 不 具 有 信 号 肽 的 两 大 类 群 。11212 L 值 的 计 算 : L 值 为 - 1981235 - 1231455 (S mean score) + 1983144 (HMM Cmax score)进 行 计算 筛 选 。 除 去 L 值 小 于 0 的 蛋 白 序 列 12 。11213 LipoP110 计 算 分 析 :它 可 以 大 致 将 蛋 白 分 成四 大 类 16 :细 胞 质 蛋 白 、 跨 膜 蛋 白 、 被 型 信 号 肽 酶识 别 的 蛋 白 和 被 型 信 号 肽 酶 识 别 的 蛋 白 中 被 型信 号 肽 酶 识 别 的 蛋 白 。11214 TMHMM210 计 算 分 析 : TMHMM210 可 以 计 算出 蛋 白 中 是 否 具 有 跨 膜 结 构 。 由 于 部 分 跨 膜 结 构 的结 构 域 也 能 被 型 信 号 肽 酶 识 别 ,可 能 被 错 误 地 预测 为 分 泌 型 蛋 白 17 ,为 了 提 高 结 果 的 可 靠 性 ,本 文只 选 取 不 具 有 跨 膜 结 构 域 的 蛋 白 。11215 TargetP1101 计 算 分 析 :该 软 件 可 以 将 蛋 白 按其 亚 细 胞 作 用 位 点 分 成 五 大 类 :叶 绿 体 型 、 线 粒 体型 、 分 泌 途 径 型 、 任 何 位 点 型 、 不 能 预 测 位 点 型 。通 过 11211 11215 的 计 算 分 析 ,对 结 果 进 行 复合 筛 选 ,即 选 出 5 种 分 析 结 果 的 重 叠 部 分 ,即 是 具 有分 泌 特 征 的 蛋 白 。 最 后 根 据 信 号 肽 的 特 点 5 将 各 种信 号 肽 归 类 。2 结 果211 土 壤 杆 菌 中 分 泌 蛋 白 信 号 肽 的 筛 选本 文 通 过 复 合 筛 选 得 到 203 条 具 有 信 号 肽 的 且有 分 泌 功 能 的 蛋 白 ,其 中 有 167 条 型 信 号 肽 酶 识别 的 信 号 肽 158 条 分 泌 型 信 号 肽 (表 1) 和 9 条 RR-motif 型 信 号 肽 (表 2) ;有 8 条 细 菌 素 -信 息 素 型 信号 肽 (表 3) ;28 种 脂 蛋 白 信 号 肽 (表 4) 。表 1 分 泌 型 信 号 肽 长 度 及 对 应 蛋 白Table 1 Length of the Sec-type signal peptides and name of proteinProtein Length Protein Length Protein Length Protein LengthGR - C - 2067p 19 AGR - L - 315p 22 AGR - L - 1777p 24 AGR - L - 982p 27AGR - C - 4118p 19 AGR - L - 3185p 22 AGR - L - 198p 24 AGR - C - 3924p 28AGR - L - 1726p 19 AGR - L - 3413p 22 AGR - L - 2241p 24 AGR - C - 4360p 28AGR - L - 1p 19 AGR - L - 373p 22 AGR - L - 2247glp 24 AGR - L - 129GMp 28AGR - L - 3547p 19 AGR - L - 407p 22 AGR - L - 2419p 24 AGR - L - 2811p 28AGR - L - 632p 19 AGR - L - 425p 22 AGR - L - 2862p 24 AGR - L - 3087p 28AGR - C - 2347p 20 AGR - C - 1196p 23 AGR - L - 3125p 24 AGR - C - 2502p 29AGR - C - 3637p 20 AGR - C - 2092p 23 AGR - L - 3165p 24 AGR - C - 2586p 29AGR - C - 4189p 20 AGR - C - 2707p 23 AGR - C - 1451p 25 AGR - C - 3918p 29AGR - L - 1197p 20 AGR - C - 3018p 23 AGR - C - 2142p 25 AGR - L - 3070p 29AGR - L - 2575p 20 AGR - C - 3235p 23 AGR - C - 3448p 25 AGR - L - 3248p 29AGR - L - 2900p 20 AGR - C - 337p 23 AGR - C - 3849p 25 AGR - L - 573p 29AGR - L - 3270p 20 AGR - C - 3603p 23 AGR - C - 489p 25 AGR - C - 1156p 30AGR - L - 572p 20 AGR - C - 3652p 23 AGR - L - 1020p 25 AGR - C - 1426p 30AGR - C - 1045p 21 AGR - C - 4134p 23 AGR - L - 228p 25 AGR - L - 2992p 30AGR - C - 2741p 21 AGR - C - 4336p 23 AGR - L - 3560p 25 AGR - L - 873p 30AGR - C - 2812p 21 AGR - C - 4976p 23 AGR - L - 930p 25 AGR - C - 2458p 31AGR - C - 288p 21 AGR - C - 738p 23 AGR - C - 1036p 26 AGR - C - 314p 31AGR - C - 3306p 21 AGR - L - 1160p 23 AGR - C - 1474p 26 AGR - L - 2894p 31AGR - C - 529p 21 AGR - L - 1296p 23 AGR - C - 1631p 26 AGR - L - 612p 31AGR - L - 1124p 21 AGR - L - 2505p 23 AGR - C - 1881p 26 AGR - C - 2742p 32AGR - L - 1462p 21 AGR - L - 2863p 23 AGR - C - 2594p 26 AGR - C - 3080p 32AGR - L - 297p 21 AGR - L - 2941p 23 AGR - C - 2805p 26 AGR - L - 39p 32AGR - L - 3137p 21 AGR - L - 3061p 23 AGR - C - 384p 26 AGR - L - 702p 32AGR - L - 3319p 21 AGR - L - 325p 23 AGR - C - 4053p 26 AGR - C - 2334p 33AGR - L - 335p 21 AGR - L - 608p 23 AGR - C - 4215p 26 AGR - C - 4604p 33AGR - L - 761p 21 AGR - C - 1084p 24 AGR - C - 433p 26 AGR - L - 2413p 33AGR - L - 890p 21 AGR - C - 113p 24 AGR - C - 970p 26 AGR - L - 3153p 34AGR - L - 993p 21 AGR - C - 140p 24 AGR - L - 1009p 26 AGR - C - 4209p 35AGR - C - 1878p 22 AGR - C - 1639p 24 AGR - L - 1021p 26 AGR - C - 2380p 36AGR - C - 1880p 22 AGR - C - 3316p 24 AGR - L - 2651p 26 AGR - C - 2705p 36AGR - C - 2482p 22 AGR - C - 3508p 24 AGR - L - 3262p 26 AGR - L - 295p 36AGR - C - 2695p 22 AGR - C - 3762p 24 AGR - C - 1003p 27 AGR - L - 514p 36AGR - C - 2949p 22 AGR - C - 3922p 24 AGR - C - 1396p 27 AGR - L - 3023glp 37AGR - C - 4294p 22 AGR - C - 4267p 24 AGR - C - 200p 27 AGR - C - 1201p 38AGR - L - 1237p 22 AGR - C - 4582p 24 AGR - C - 316p 27 AGR - C - 3292p 38AGR - L - 2211p 22 AGR - C - 75p 24 AGR - C - 498p 27 AGR - C - 1197p 40AGR - L - 2612p 22 AGR - C - 94p 24 AGR - L - 146p 27 AGR - C - 3730p 48AGR - L - 2662p 22 AGR - L - 1481p 24 AGR - L - 798p 27AGR - L - 271p 22 AGR - L - 1638p 24 AGR - L - 976p 27表 2 具 有 RR2motif 的 被 信 号 肽 酶 型 信 号 肽Table 2 Signal peptides recognized by SPase with twin-arginineProtein Signal sequenceAGR - C - 1468p MQFTRRHTLKFAGISCAAT ALAGALAGR - L - 1912p MRRHLMTTTAAMLLAMTGSAFAGMEAGR - C - 3890p MISHCRRLLATTTALVIASTAIAAAEAGR - C - 2981p MICRRSLLLGGALLATVMKAPHLLADGDAGR - L - 1217p MRRTIVKIAMTGFLVTSGLVSP ALSQELAGR - L - 2772p MTFSRRQFHKIALAAGAFVALPGGSFAAAEAGR - C - 1694p MSNAREERRAIAAVLVAGLGFVPATAHAQDPAGR - L - 456p MEGYMRRATLFAGLVAGFSTFAFNA AQAVEIThe conserved residues of the RR-motif are indicated in bold letters. Thepredicted SPase cleavage site , residues from position - 3 to - 1 relative tothe SPase cleavage site are underlined.表 3 细 菌 素 2信 息 素 型 信 号 肽Table 3 Predicted bacteriocin and pheromone signal peptidesProtein Signal peptide Spase AGR - C - 971p MCLASAFSLGALAP ALA QAPAGR - C - 1570p MNIVSTSVALLLAA ASA EVEAGR - C - 996p MSWVDPMTSILTNAA AMA ALQAGR - L - 1576p MMLAAAMLAINISGV AAA VPVAGR - C - 1692p MEVSSMSSSISSALSIMLAAVLPVLVFPHGASS ASS QVAAGR - C - 1007p MALSALAVLLLTMASTS ENA SASAGR - C - 3641p MPAHSLFSLSVSAALLLSAVPLP AQS AGWAGR - C - 2989p MSTAHFTFCTLFSLTVAAMPVA APA ADGThe predicted SPase cleavage site , residues from position - 3 to - 1 relativeto the SPase cleavage site are underlined.265 微 生 物 学 报 Acta Microbiologica Sinica 2005 , Vol. 45 No. 4 表 4 脂 蛋 白 信 号 肽Table 4 Lipoprotein signal peptidesProtein Signal peptide SPase AGR - C - 862p MTDTSLQTLTRRGFVLISAGSV LSA CVAGR - C - 967p MSTRRLPALLLPLAL LAG CQAGR - C - 1378p MVTVIAKSNSRTKSLLSSVAEVSAVVSMLVV LSG CVAGR - C - 1443p MSGNFLRLSAAMSLLAV VAG CNAGR - C - 1473p MRVSIVLGSLAALVA LTA CQAGR - C - 1491p MLFRSVTLAAFAIA LSA CTAGR - C - 2283p MPLAGSRHVTALTLAVLTA LSG CAAGR - C - 3026p MKSVLIIAAVFGFSASAA LAE CAAGR - C - 3031p MRLSINGQKRRALFLAPLFAAL MAG CAAGR - C - 3166p MKTLLSSAAITLSLA LSG CTAGR - C - 3386p MSLAFRLNAYKATGLILAAAA LAA CQAGR - C - 3722p MRVWKQVGVSLAVVG AGL CLAGR - C - 3839p MRNSGKFRGRSALLLSSTVGLALA LSA CTAGR - C - 4244p MSISRRGVLFGLPLF LAG CAAGR - C - 4452p MVSNLRIAERKGSVMRGVFAVVFLMLV LAG CAAGR - C - 4477p MRQAAYSLRRRLLGWLLISTA IIG CVAGR - C - 4619p MNATDTQGRTMSRRILPLFASLCVTAV LAG CSAGR - C - 4740p MGRLPSRRAHCNVGESFMKKAIIFALVGLS LAS CTAGR - C - 4789p MQFRYVVTGLAVVMS LAG CQAGR - C - 4934p MIKKIAIVALCGTY LSA CTAGR - C - 4986p MLSDVFSRWSRVAAAISVVMMAGL LAG CQAGR - L - 1719p MNPIHIVVAAPLL LGG CTAGR - L - 1720p MMTRPFTLGSKLAAILSLPLF LSG CVAGR - L - 2071p MKTILIAAALGGIFA LAS CSAGR - L - 2074p MFRINRSLFLLIPAIA LSS CQAGR - L - 2135p MNFKTSAALLSAAIA VSS CVAGR - L - 2246p MSRTNISALSPMQKLARNPAVIAMTLALA LAG CAAGR - L - 2979p MNETTTTRRGFLLGAGGLALAG LAG CNThe predicted SPase cleavage site , residues from position - 3 to - 1 relative to the SPase cleavage site are underlined.图 1 土 壤 杆 菌 基 因 组 中 分 泌 型 信 号 肽 长 度 分 布Fig. 1 Length distribution of predicted secretory ( Sec-typy) signalpeptides in Agrobacterium tumefaciens C58 cereon212 土 壤 杆 菌 中 各 类 信 号 肽 的 特 征21211 分 泌 型 信 号 肽 的 特 征 :土 壤 杆 菌 中 信 号 肽 长度 变 化 如 图 1 所 示 。 在 158 条 被 信 号 肽 酶 型 识 别的 分 泌 蛋 白 中 ,其 信 号 肽 的 长 度 变 化 范 围 为 1948aa ,平 均 为 2514aa。 同 时 ,从 信 号 肽 相 似 性 的 比 较来 看 ,在 所 筛 选 出 的 203 条 信 号 肽 中 只 有 两 条 蛋 白即 AGR-C-1878p 和 AGR-C-1880p 的 信 号 肽 的 氨 基 酸残 基 完 全 相 同 ,同 为 MNIKSLLIGSAAALAAVSGAHA ,并 且 通 过 blast 比 对 这 两 个 前 蛋 白 的 成 熟 蛋 白 ,结 果表 明 这 两 个 蛋 白 的 全 序 列 和 成 熟 蛋 白 也 具 有 较 高 的相 似 性 。 同 时 信 号 肽 长 度 的 变 化 说 明 信 号 肽 具 有 高度 的 变 异 性 ,这 可 能 与 其 成 熟 蛋 白 的 靶 标 位 点 精 确识 别 和 功 能 的 精 确 分 工 密 切 相 关 。图 2 20 种 氨 基 酸 残 基 在 分 泌 型 蛋 白 信 号 肽 中 出 现 频 率Fig. 2 20 charged residues of predicted signal peptides of the secretedproteins在 土 壤 杆 菌 信 号 肽 的 氨 基 酸 组 成 中 (图 2) ,非极 性 氨 基 酸 残 基 出 现 频 率 为 014 % 2410 % ,平 均 为812 % ,其 中 残 基 W 的 出 现 频 率 最 低 为 014 % ,而 残365 2005 , Vol. 45 No. 4 范 成 明 等 :根 癌 土 壤 杆 菌 C58 Cereon 中 分 泌 蛋 白 信 号 肽 分 析基 A 的 出 现 频 率 最 高 为 2410 % ,其 次 为 氨 基 酸 残 基L 为 1418 % ;带 正 电 的 氨 基 酸 残 基 R、 K和 H 分 别 为313 % ,414 %和 112 % ,平 均 为 310 % ;带 负 电 的 氨 基酸 残 基 D 和 E 都 为 015 % ,平 均 为 015 % ;不 带 电 的极 性 氨 基 酸 残 基 出 现 频 率 为 014 % 911 % ,平 均 为218 % ,残 基 S 的 出 现 频 率 最 高 为 911 % ,残 基 Y的最 低 为 014 %。 同 时 ,发 现 在 信 号 肽 组 成 中 使 用 率大 于 5 %的 氨 基 酸 残 基 ,多 数 属 于 脂 肪 族 氨 基 酸 ,主要 是 中 性 和 含 有 羟 基 或 硫 氨 基 的 氨 基 酸 。 这 可 能 与分 泌 蛋 白 的 属 性 相 关 ,使 信 号 肽 更 易 穿 过 质 膜 ,从 而行 使 信 号 指 导 功 能 。从 土 壤 杆 菌 分 泌 型 信 号 肽 的 N 结 构 域 、 H 结 构域 C 结 构 域 的 变 化 来 看 ,N 结 构 域 的 长 度 变 化 为 2 19aa ,平 均 为 518aa。 H结 构 域 的 长 度 变 化 为 1139aa ,平 均 为 1714aa。 它 们 的 变 化 与 Harold5 所 报 道Bacillus subtilis 的 结 构 有 差 异 。 可 能 在 不 同 的 生 物中 信 号 肽 的 N 结 构 域 和 H结 构 域 的 变 化 有 所 不 同 ,这 还 需 要 在 今 后 的 研 究 中 进 行 探 讨 。 C 结 构 域 (表5)在 -3 位 置 (相 对 于 酶 切 位 点 ) 、 + 1 位 置 和 + 1 位 置上 氨 基 酸 残 基 A 使 用 的 频 率 最 高 ,分 别 为 8110 %、9317 %和 2519 % ;可 以 看 出 在 -3 和 -1 的 位 置 上 ,氨基 酸 残 基 的 组 成 非 常 保 守 ,在 -3 位 置 上 ,出 A 之 外 ,L、 S 和 V 的 使 用 频 率 分 别 为 119 %、 613 %和 812 % ,而 D、 E、 F、 H、 K、 M、 N、 P、 R、 T、 W 和 Y使 用 频 率为 0 ,在 -1 位 点 除 了 氨 基 酸 残 基 A (9317 %) 外 ,只 有氨 基 酸 残 基 G(使 用 频 率 为 119 %) 和 S(使 用 频 率 为414 %) ,其 他 氨 基 酸 残 基 在 该 位 点 上 的 使 用 频 率 均为 0。 - 3 和 - 1 位 是 型 信 号 肽 酶 识 别 比 较 关 键的 位 点 ,因 而 在 氨 基 酸 残 基 的 使 用 上 是 较 保 守 的 。表 5 分 泌 型 信 号 肽 中 20 种 氨 基 酸 在 酶 切 位 点 ( - 3 3)使 用 频 率Table 5 20 charged residues at the cleavage position from - 3 to + 3 of the Sec-type signal peptidesaa - 3 - 2 - 1 + 1 + 2 + 3 aa - 3 - 2 - 1 + 1 + 2 + 3A 8110 716 9317 2519 312 1018 M 010 819 010 016 010 016C 016 010 010 016 010 119 N 010 414 010 119 016 119D 010 010 010 716 2815 312 P 010 113 010 016 716 613E 010 312 010 1518 1416 517 Q 016 1018 010 2212 511 414F 010 1217 010 113 016 215 R 010 119 010 113 010 613G 016 215 119 710 312 312 S 613 819 414 318 1114 613H 010 1011 010 119 113 016 T 010 119 010 215 1615 613I 016 016 010 016 119 812 V 812 215 010 016 312 1018K 010 119 010 312 119 812 W 010 016 010 010 010 016L 119 1717 010 215 010 1114 Y 010 215 010 010 016 01621212 RR-motif 型 信 号 肽 :能 被 信 号 肽 酶 识 别 的信 号 肽 除 了 分 泌 型 信 号 肽 之 外 ,还 有 一 类 RR-motif型 信 号 肽 。 它 除 了 具 有 分 泌 型 信 号 肽 所 具 有 的 结 构特 征 之 外 ,其 最 明 显 的 特 征 是 具 有 R- R- X- # - # ( X表 示 任 意 氨 基 酸 残 基 , # 表 示 疏 水 氨 基 酸 残 基 ) 19 这 样 的 模 式 。 在 该 菌 株 中 得 到 了 如 表 2 所 示 的 含 有RR-motif 型 信 号 肽 的 分 泌 蛋 白 。 根 据 本 文 的 试 验 结果 可 知 , SignalP 可 以 预 测 出 细 菌 素 -信 息 素 型 信 号肽 ,这 与 Harold5 认 为 该 软 件 不 能 预 测 细 菌 素 -信 息素 型 信 号 肽 相 悖 ,这 可 能 是 不 同 版 本 的 软 件 所 致 。21213 细 菌 素 2信 息 素 型 信 号 肽 :通 过 SignalP 算 法 ,得 到 8 条 不 含 H 结 构 域 的 细 菌 素 2信 息 素 型 信 号 肽(表 3) 。 含 有 该 类 信 号 肽 的 蛋 白 是 通 过 ABC (ATP-binding cassette)转 运 子 分 泌 到 胞 外 。21214 信 号 肽 酶 型 信 号 肽 (或 脂 蛋 白 信 号 肽 ) :从4554 个 ORF 中 ,共 筛 选 得 到 28 条 含 有 脂 蛋 白 信 号肽 的 蛋 白 (表 4) 。 其 信 号 肽 的 平 均 长 度 为 2117aa(图 3) , 16 34aa。 且 H 结 构 域 的 平 均 长 度 为1211aa ,N 结 构 域 的 平 均 长 度 为 616aa。 同 时 ,在 该类 信 号 肽 中 ,也 发 现 具 有 RR-motif 模 式 的 信 号 肽 ,说明 有 些 脂 蛋 白 也 可 能 通 过 Tat 分 泌 途 径 进 行 移 位 。图 3 土 壤 杆 菌 中 脂 蛋 白 信 号 肽 的 长 度 分 布Fig. 3 Length distribution of predicted lipoprotein signal peptides inAgrobacterium tumefaciens C58 Cereon该 类 信 号 肽 在 氨 基 酸 残 基 的 使 用 频 率 (图 4) 与分 泌 型 信 号 肽 相 似 。 非 极 性 氨 基 酸 的 平 均 使 用 频 率最 高 为 716 % ,带 正 电 荷 的 氨 基 酸 平 均 为 312 % ,带负 电 荷 的 氨 基 酸 平 均 为 017 % ,不 带 电 极 性 氨 基 酸为 410 %。 可 以 看 出 信 号 肽 的 氨 基 酸 的 组 成 相 对 是保 守 的 。465 微 生 物 学 报 Acta Microbiologica Sinica 2005 , Vol. 45 No. 4 图 4 20 种 氨 基 酸 残 基 在 脂 蛋 白 信 号 肽 中 出 现 频 率Fig. 4 20 charged residues of predicted signal peptides of the lipoproteins21215 SignalP-NN 中 判 断 参 数 Smean 和 Dscore :SignalP-NN 的 参 数 Dscore 是 SignalP310 中 新 增 加 的 ,且 Dscore 比 Smean 对 信 号 肽 有 更 高 的 鉴 别 能 力 15 。在 以 往 的 版 本 中 主 要 以 Smean 作 为 一 个 重 要 的 判 断参 数 。 为 了 对 比 两 个 参 数 的 鉴 别 力 ,本 文 在 数 据 的处 理 中 ,分 别 用 SignalP-NN 参 数 Smean 和 Dscore ,与SignalP- HMM 参 数 Cmax 组 合 即 Smean 和 Cmax 组 合(简 称 :S-C) 和 Dscore 和 Cmax (简 称 :D-C) 来 判 断 蛋白 是 否 具 有 信 号 肽 ,并 对 所 得 结 果 进 行 比 较 。 单 由S-C 筛 选 出 具 有 信 号 肽 的 蛋 白 有 461 条 ;同 样 ,由D-C得 到 453 条 具 有 信 号 肽 的 蛋 白 ;其 中 两 种 方 法 共有 蛋 白 有 419 条 。通 过 分 别 统 计 S-C和 D-C两 种 方 法 所 得 全 部 的SignalP-NN 的 Smean 和 SignalP- HMM 参 数 Cmax ,发现 :S-C的 SignalP-NN 参 数 Smean 的 平 均 值 为 01747 ,而 D-C的 平 均 值 为 01737 ; S-C 的 SignalP- HMM 参 数Cmax的 平 均 值 为 01859 ,而 D-C 的 平 均 值 为 01875。通 过 它 的 比 较 难 以 说 明 那 种 方 法 更 好 。通 过 两 种 方 法 所 得 的 非 共 有 蛋 白 相 关 参 数 的 得分 来 看 :方 法 D-C得 出 的 SignalP-NN 的 参 数 Cmax 和Ymax 的 数 值 都 比 方 法 S-C 得 出 的 相 对 应 的 参 数 值高 。 对 比 两 种 方 法 所 得 的 SignalP- HMM 的 参 数Cmax ,可 以 看 出 利 用 S-C 所 得 的 SignalP- HMM 中 的Cmax 得 分 比 D-C的 普 遍 要 低 。且 在 两 种 方 法 共 有 的 蛋 白 中 进 行 统 计 分 析 ,发现 :SignalP-NN 的 Smean 最 小 值 为 01499 ,平 均 值 为01766 ; SignalP- HMM 最 小 值 为 01503 , 平 均 值 为01873。 这 两 个 参 数 的 得 分 都 较 高 。众 所 周 知 ,SignalP-NN 的 Smean 和 SignalP- HMM的 Cmax 这 两 个 重 要 参 数 的 值 越 高 ,蛋 白 含 有 信 号肽 的 可 能 性 就 越 大 。 因 而 笔 者 在 进 行 预 测 时 ,为 了使 预 测 结 果 更 加 准 确 ,选 用 了 SignalP-NN 中 的 Smean和 D 和 SignalP- HMM 参 数 Cmax 这 3 个 参 数 对 4554个 ORF 进 行 分 泌 型 蛋 白 的 筛 选 。3 讨 论对 于 这 几 个 软 件 预 测 的 准 确 性 有 好 多 学 者 15 ,20 已 对 其 进 行 了 探 讨 ,在 目 前 可 用 的 网 络 软 件 中 ,本 文所 使 用 的 软 件 都 是 属 于 准 确 性 较 高 的 软 件 , 如Karsten 等 20 报 道 在 革 兰 氏 阴 性 菌 中 利 用 SignalP-NN和 SignalP- HMM 对 其 中 信 号 肽 进 行 预 测 时 ,这 两 种方 法 的 正 确 性 分 别 为 9114 %和 9311 %。 但 是 在 实际 的 应 用 过 程 中 ,本 文 发 现 在 SignalP310 中 SignalP-NN 的 D- score 和 Smean 和 SignalP- HMM 的 Cmax 这 几个 重 要 的 参 数 在 信 号 肽 的 判 断 上 存 在 着 一 定 的 差异 ,并 不 是 所 有 的 被 这 3 个 判 断 为 含 有 信 号 肽 的 蛋白 的 3 个 参 数 的 得 分 都 比 较 高 。 这 不 免 给 我 们 的 判断 带 来 了 一 定 的 困 惑 。 同 时 本 文 为 了 保 证 结 果 的 可靠 性 ,选 用 3 个 参 数 同 时 对 土 壤 杆 菌 的 ORF 进 行 预测 ,以 便 提 高 预 测 结 果 的 可 靠 性 。利 用 不 同 的 软 件 对 同 一 基 因 组 进 行 分 析 ,其 结果 会 有 所 差 异 ,这 主 要 是 由 于 软 件 所 使 用 的 算 法 不同 。 同 时 每 个 软 件 都 不 可 能 保 证 其 预 测 结 果 完 全 正确 。 因 而 ,在 进 行 信 号 肽 的 分 析 时 首 先 应 该 选 择 权威 的 软 件 ,并 采 用 多 种 策 略 利 用 多 个 软 件 对 目 标 基因 组 进 行 筛 选 ,一 般 采 用 2 4 个 软 件 ,以 保 证 预 测结 果 的 真 实 性 。 再 者 ,由 于 信 号 肽 在 不 同 生 物 中 的存 在 这 一 定 的 差 异 ,利 用 于 软 件 对 其 进 行 分 析 时 ,一定 要 注 意 研 究 对 象 的 生 物 类 型 。通 过 对 土 壤 杆 菌 的 分 析 ,本 文 发 现 在 构 成 信 号肽 的 氨 基 酸 的 使 用 上 是 保 守 的 ,如 主 要 以 非 极 性 的为 主 且 在 酶 切 位 点 的 氨 基 酸 残 基 的 组 成 中 几 乎 没 有酸 性 氨 基 酸 和 碱 性 氨 基 酸 ,这 可 能 与 信 号 肽 的 与 质膜 识 别 的 属 性 有 关 。 但 是 信 号 肽 却 是 高 度 进 化 的 ,在 203 条 具 有 信 号 肽 的 蛋 白 中 ,只 有 两 条 蛋 白 的 信号 肽 是 相 同 的 。 这 种 情 况 可 能 与 信 号 肽 功 能 的 精 密分 工 是 密 切 相 关 的 。 因 为 蛋 白 的 要 行 使 其 正 确 地 功能 ,首 先 必 须 移 位 到 其 正 确 的 亚 细 胞 作 用 位 点 。 亚细 胞 位 点 的 识 别 正 是 由 信 号 肽 决 定 的 ,不 同 的 作 用位 点 ,就 应 该 有 不 同 的 信 号 肽 。 但 是 每 一 类 蛋 白 的信 号 肽 的 保 守 和 进 化 程 度 如 何 ,还 需 要 更 多 的 信 号肽 的 信 息 。参 考 文 献 1 Derek W W , Joao C S , Rajinder K, et al. The genome of thenatural genetic engineer Agrobacterium tumefaciens C581Science ,2001 , 294 (14) : 2317 - 23231 2 Emanuelsson O , Nielsen H , Brunak S , et al. Predicting subcellularlocalization of proteins based on their N-terminal amino acidsequence. Journal of Molecular Biology , 2000 , 300 : 1005 - 10161565 2005 , Vol. 45 No. 4 范 成 明 等 :根 癌 土 壤 杆 菌 C58 Cereon 中 分 泌 蛋 白 信 号 肽 分 析 3 von Heijne G. Life and death of a signal peptide. Nature , 1998 ,396 :111 - 1131 4 Akita M , Sasaki S , Matsuyama S , et al. SecA interacts withsecretory proteins by recognizing the positive charge at the aminoterminus of the signal peptide in Escherichia coli . Journal ofBiological Chemistry , 1990 , 265 :8162 - 81691 5 Paetzel M , Dalbey R E , Strynadka N C. Crystal structure of abacterial signal peptidase in complex with a beta-lactam inhibitor.Nature , 1998 , 396 :186 - 1901 6 Harold T , Albert B , Jan D H , et al. Signal peptide-dependentprotein transport in Bacillus subtilis : a genome-based survey of thesecretome. Microbiology and Molecular Biology Reviews , 2000 , 9 :515 - 5471 7 Tjalsma H , Bolhuis A , van Roosmalen M L , et al. Functionalanalysis of the secretory precursor processing machinery of Bacillussubtilis : identification of a eubacte

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论