




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精品文档关联分析步骤个人总结,还一些问题待解决已有 1570 次阅读2013-2-6 20:34|个人分类:科学笔记|系统分类:科研笔记|关键词:安装 软件 个人总结 style希望查看此贴的同仁们对步骤提出改进,指出不足,谢谢!一、软件安装和存放1.将plink文件直接放在D盘;将map和ped文件拷贝到plink文件下面,保证和在一起;2.Ped文件的格式和map文件都是先弄成txt文件,再直接更改文件后缀。可以在excel里先将需要的格式把数据排列好,再将excel保存为txt,再改txt后缀为ped或map.1)(.PED)文件的前六列是强制的格式,依次为:ped文件包含内容的顺序依次为以下信息备注Family ID可以用1,2,3,4表示Individual ID用入库编号表示Paternal ID可以用0表示Maternal ID可以用0表示Sex1=male; 2=female; other = unknownPhenotypecontrol设定为1,case设定为2Genotype如A T,中间空一格,缺失用0补平2)(.MAP)文件包括以下的四项:map文件包含内容的顺序依次为以下信息备注chromosome1-22, X, Y or 0 if unplacedrs# or snp identifierrs号Genetic distance (morgans)可以用0代替Base-pair position (bp units)用NCBI上的染色体起始位置3)协变量信息:协变量先单独建立一个文件,要txt格式的,比如有10个协变量,我命名为var01.txt。这个文件必须放在和ped,map和plink.exe文件一起。Var文件是先在excel格式里面整理好,删除第一行协变量的表头,但自己要单独记下来每列代表的意思,然后转化成txt文本格式,就是另存为txt。顺序依次为:family ID,个体ID,后面就是协变量了(number1-10),空缺的信息的用-9补全。二、软件启动开始运行cmdC:Documents and settingsAdministratorcdC:Documents and settingsAdministratorC:Documents and settingsAdministratord:D:cd plink三、软件运行的命令前提是冠心病数据文件分别为1.ped和1.map;用file1和bfile 3的结果相似,那些限制性条件只是去掉了3个对照;单倍型分析,在同一染色体上且位置较近的SNP分析单倍型才有效,不同染色体上SNP的分析那是联合效应分析运行命令功能plink -file 1 -make-bed -out 2转成二进制文件,2即为二进制文件了plink -bfile 2 -maf 0.01 -geno 0.05 -mind 0.05 -hwe 0.001 -make-bed -out 3设定过滤数据plink -bfile 3 -filter-controls hardy计算control的hw,将hwe0.05的位点过滤掉,23个SNP又去掉了2个SNPplink -bfile 3 -assoc -adjust -out assoc1等位基因的关联分析,每运行后及时更改文件名称(assoc1+时间)plink -bfile 3 -filter-females assoc -adjust -out 333女性样本关联分析plink -bfile 3 -filter-males assoc -adjust -out 444男性样本关联分析plink bfile 3 assocpermpermutation检验,就是模特卡罗模拟分析经验性的P值plink bfile 3 all -missing缺失率或得出率(call rate)分析,查看log文件结果plink bfile 3 model out model 1默认是卡方检验plink bfile 3 model fisherfisher检验,但是结果比卡方检验差plink bfile 3 logistic-ci 0.95 -covar var01.txt分析所有的协变量plink bfile 3 logistic covar var01.txt covar-number 1,3,5只分析1,3,5这几个协变量plink bfile 3 logistic sexplink file 1 logistic ci 0.95加性模式下分析plink file 1 logistic ci 0.95 dominant显性模式下分析plink file 1 logistic ci 0.95 recessive隐性模式下分析plink file 1 logistic ci 0.95 genotypic基因型分析plink -file 1 logistic ci 0.95 covar var01.txt covar-number 1,2,4-6加性模式下分析plink -file 1 logistic ci 0.95 covar var01.txt covar-number 1,2,4-6 dominant显性模式下分析plink file 1 logistic ci 0.95 covar var01.txt covar-number 1,2,4-6 recessive隐性模式下分析plink file 1 logistic ci 0.95 covar var01.txt covar-number 1,2,4-6 genotypic基因型下分析plink bfile 3 hap-snps rs653667,rs2261434 hap-assoc单倍型分析Plink bfile 3 filter-cases只包含casesPlink bfile 3 filter-controls只包含controlsPlink bfile 3 filter-males只包含malesPlink bfile 3 filter-females只包含femalesplink bfile 3 -filter-females logistic ci 0.95默认加性模型plink bfile 3 -filter-females logistic ci 0.95 dominantplink bfile 3 -filter-females logistic ci 0.95 recessiveplink bfile 3 -filter-females covar var01.txt -covar-number 1,2,4,8,9 -logistic ci 0.95默认加性模型plink bfile 3 -filter-females covar var01.txt -covar-number 1,2,4,8,9 logistic ci 0.95 dominantplink bfile 3 -filter-females covar var01.txt -covar-number 1,2,4,8,9 logistic ci 0.95 recessive四、结果查看可以先用notepad打开看一下,也可以用excel打开,打开步骤:用excel的文件,打开分隔符号下一步空格完成,再另存为即可。看到unjust对应的P值是未校正的,plink默认Bonf校正,非常严格,校正后基本没有显著的了。如果文章中不用plink校正后的结果的话,前面的分析也不要用plink的结果,不然别人会问你为什么不用plink校正。Log文件是保存运行过的命令,如果不及时更名,就被后面的log文件给覆盖掉了。五、关于单倍型的分析过程分型数据结果出来后,首先要做的是按照染色体将SNP位点分类(在位点位于不同染色体的情况下),1)如上图所示,按照不同染色体分好位点数;2)首先分析的是control数据里的LD,如果存在LD,即D接近1,r2大小似乎关系不大,就可以判定有LD,这个在Haploview软件里面分析。分析时的数据格式整理成Linkage format。可以把一个数据弄成ped,一个是map的。(奇怪的是我用plink format,系统总说我少SNP column,给ped加head,genotype那里换成rs号或SNP1,SNP2之类的都不行,map文件是标准的plink格式,headless),有时间再找出问题在哪。Map的文件:只有2列,一列是rs号,一列是染色体上的起始位置,至于这个位置,我用的是Hapmap数据库上的。不同数据库之间的相差不大,起始需要的是每2个SNP之间的相对距离,估计软件自己会计算。Ped文件:前6列是固定的,一次为FID,IID,father ID,mother ID,sex(1 male; 2 female),phenotype(1 control;2 case),后面就是基因型的了。按照SNP号排列好,但是不要表头。注意在map文件中,SNP的顺序要和这个对上。3)结果可以看到LD,右键点击,可以看到D,r2;点Haplotype,不知道怎么有的没有结果出来,可能是没有单倍型?
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 两栖类养殖工职业考核试卷及答案
- 变压器试验工理念考核试卷及答案
- 索具防腐蚀处理工艺考核试卷及答案
- 稻谷油脂酶解蛋白提取工艺开发考核试卷及答案
- 信息技术应用试题及答案大全
- 医学影像设备测试卷附答案
- 技术推广公司合伙协议书
- 针织专业试题及答案
- 药学相关专业试题及答案
- 河北省唐县第一中学2025-2026学年高二上学期开学考试历史试题(原卷版)
- 2024年下半年湖北黄冈黄梅县事业单位招聘“三支一扶”服务期满人员17人易考易错模拟试题(共500题)试卷后附参考答案
- 《小儿神经系统查体》课件
- 《初级会计实务》(第五版) 第三章 流动资产
- ps课件教学课件
- 人教版六年级上册道德与法治第一单元测试卷及答案
- 农业行政执法工作指南
- 小学体育教案《50米快速跑(途中跑)》
- 法律行业 律师事务所品牌建设方案
- 高职计算机专业人工智能技术应用与开发
- 地铁接触网检修工技能竞赛考试题库500题(含答案)
- 2.1 创新改变生活(课件) 2024-2025学年九年级道德与法治上册 (统编版2024)
评论
0/150
提交评论