01 散点图散点图_第1页
01 散点图散点图_第2页
01 散点图散点图_第3页
01 散点图散点图_第4页
01 散点图散点图_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

R基础绘图 基迪奥基迪奥 生信培训班生信培训班 1 目录 1)散点图 2)频率直方图 3)盒形图 4)PCA 5)聚类图 6)热图 2 小目录 散点图的介绍与应用 散点图的绘制(R代码) 3 散点图介绍 散点图是典型的二维图 简单但应用最广泛 合理使用,可以良好呈现数据的规律 通过添加颜色或辅助线,可以突出某些结 论; 常用的美化画法 1)给图片的不同区域上不同颜色(不同点或不同区域使 用不同的颜色); 2)给图片加辅助线; 4 散点图常见范例 两组样本重复性 5 整合不同类型的数据:火山图 不同样本的比较,配合相关 系数,用于展示两个样本的 重复性 差异表达的两个参数:差异倍数 和FDR,同时展示; 散点图常见范例 6 不同组学数据的比较(转录组 蛋白关联) 不同处理的数据的比较 不同处理组导致的基因差异 变化是如何分布的,是否有 规律。 不同组学的定量结果是否一致, 是否有相关性 散点图常见范例 7 例如重测序中常见的曼哈顿图,也是散点图的一种变形。 注:在重测序的系列课程中讲解各类曼哈顿图的详细画法。 散点图的变形气泡图 二维散点图可以呈现两类信息,当如果数 据的维度有三维甚至更高呢? 8 3D 图形虽然好看,但不直 观。因为三维图形不易于进 行比较。 散点图的变形气泡图 气泡图是呈现多维数据的良好方法。 常用的可以用于呈现四维的数据。 如左图,四维数据包括: 富集因子(X轴) 通路类型(Y轴) 通路内基因的数量(圆圈大小) 富集的Qvalue(圆圈颜色) 气泡图的画法,在系列课程的 ggplot2绘图部分有讲解,或利用 Omicshare可以绘制针对kegg富集分 析的气泡图。 9 珊瑚文章中的散点图 Barshis D J, Ladner J T, Oliver T A, et al. Genomic basis for coral resilience to climate changeJ. Proceedings of the National Academy of Sciences, 2013, 110(4): 1387-1392. 横坐标:普通珊瑚在处理下的差异倍数; 纵坐标:耐高温珊瑚在处理下的差异倍数; 图中,我们可以看出这些基因的差异倍数普 遍在普通珊瑚组 大于 耐高温珊瑚组(在45 辅助线的斜率低的一侧)说明了普通珊 瑚应激更大; 10 珊瑚文章中的散点图 这个图的处理过程: 1)找出普通珊瑚组特异差异表达的基因(维恩图红线部分) 2)将这些基因在两组样本的差异表达倍数的信息,提取出来; 3)画散点图 前两步涉及表格数据的处理,最后一步使用R画图。在后续的 练习中,我们将有类似的练习来期望得到与处理相关的生物学结 论。 11 另外一个案例散点图让数据 比较更加直观 12 来自小麦D基因组文章中,比较小麦D和短柄草 重要转录因子基因家族的拷贝数比较,审稿人 反馈:too boring 另外一个案例散点图让数据比 较更加直观 13 改用散点图后, 非常直观地呈现 出了两组数值的 差异。该图片最 后出现在正文中。 小目录 散点图的介绍与应用 散点图的绘制(R代码) 14 绘制散点图的基础命令 plot(11:20) plot(1:10,11:20) plot(cars) # cars是预存在R软件中的数据 15 plot常用参数 type pch main, sub, xlab, ylab xlim, ylim col, col.main, col.sub, col.axis, col.lab font.main, font.sub, font.axis, font.lab cex, cex.main, cex.sub, cex.axis, cex.lab 16 type参数详解 p for points, l for lines, b for both, c for the lines part alone of b, o for both overplotted, h for histogram like (or high- density) vertical lines, s for stair steps, S for other steps, see Details below, n for no plotting. 17 type参数效果图 type=”p”type=”b” type=”l” type=”c” 18 pch参数(一) ?pch plot(cars,pch=17) 19 pch参数(二) plot(1:10,pch=c(rep(16,5),rep(17,5) 20 标题 plot(cars, xlab=Speed,ylab=Dist,main=Cars,sub=Speed Dist) 21 坐标轴显示范围 plot(cars,xlim=c(0,30),ylim=c(0,150) 22 颜色及字体颜色(一) plot(cars,pch=17,col=red,col.lab=blue,col.axis=gre y) 23 颜色及字体颜色(二) plot(1:10,col=c(rep(red,5),rep(green,5),pch=17) 24 字体样式 plot(cars,font.lab=4,font.axis=2) 1: 正常(默认) 2: 加粗 3: 斜体 4: 加粗+斜体 25 点的大小和字体大小 plot(cars) plot(cars,cex=1.5,cex.lab=1.5,cex.axis=1.5) 26 回顾:plot常用参数 type pch main, sub, xlab, ylab xlim, ylim col, col.main, col.sub, col.axis, col.lab font.main, font.sub, font.axis, font.lab cex, cex.main, cex.sub, cex.axis, cex.lab 27 练习 绘制样品C1和C2的表达散点图 改变当前目录到 “你个人电脑的路径/散点图”目录, all.fpkm中含有所有样本的基因表达信息 参考脚本:plot.practise.R 备注:这个张图中,加入两个样本的相关系数的方法。 28 练习 # read the expression data expr = read.table(all.fpkm,header=T,s=1) # 文件读 入数据框expr # draw plot #png(C1_C2.plot.png,width=480,height=480) # 将后续的画 图结果导入png文件 pdf(C1_C2.plot.pdf) #对expr数据框的两列取log2值并画图,expr$C1_FPKM 代表数据框 中的一列,列名称是C1_FPKM;点类型是16,点缩放系数为0.5,颜 色红色,x轴和y轴的限定范围都是-510;并对x、y轴设定标签; # 对表达量取log2后(让数据更加均一),绘制散点图;$是引用下一级 的数据结构 plot(log2(expr$C1_FPKM),log2(expr$C2_FPKM), pch=16,cex=0.5,col=green, xlim=c(-5,12),ylim=c(-5,12), xlab=log2(C1_FPKM),ylab=log2(C2_FPKM) 29 练习 correl =cor(expr$C1_FPKM,expr$C2_FPKM) #计算相关系数 number=paste(Correlation=,sprintf(%.3f,correl),sep=) # 保留三位有效数字,并合并入文本信息; text(0,10,number) # 将相关系数的结果补充到图片上; dev.off() #关闭画图程序 30 延展 散点图可以推广到任何两组数值呈现或比较的图形中, 灵活使用,适用于各种情况。例如: 突变频率(MAF)与效应 基因长度与包含的SNP数 基因家族在两个物种中的拷贝数 31 突变的人群频率与效应 1个更复杂的实例 学习来自R for beginner中的一个经典实例,了 解如何从精确的参数控制,来获得我们想要的图形。 32 没有用任何选项的函数plot x - rnorm(10) y 1时,对齐位置在 文本右边的地方,取负值时对齐位置在文本左边 的地方;如果给出两个值(例如c(0, 0),第二个 只控制关于文字基线的垂直调整。 #font:控制文字字体的整数(1: 正常,2: 斜体,3: 粗体,4: 粗斜体); 完全“手工”图 par(bg=lightgray, mar=c(2.5, 1.5, 2.5, 0.25) #type=n图形留白,将使用次级函数画图,xlab=n,ylab=n意味着不画 坐标轴 plot(x, y, type=n, xlab=, ylab=, xlim=c(-2, 2),ylim=c(-2, 2), xaxt=n, yaxt=n) rect(-3, -3, 3, 3, col=cornsilk) #修改绘图区域颜色 #用次级函数画点 points(x, y, pch=10, col=red, cex=2) #次级函数绘制坐标轴,side1和2对应下和左侧 axis(side=1, c(-2, 0, 2), tcl=-0.2, labels=FALSE) axis(side=2, -1:1, tcl=-0.2, labels=FALSE) title(How to customize a plot with R (ter),font.main=4, adj=1, cex.main=1) #mtext绘制坐标轴说明,side是位置,line是到图形的距离(行数) mtext(Ten random values, side=1, line=1, at=1, cex=0.9, font=3) mtext(Ten other values, side=3,line=0.5, at=-1.8, cex=0.9, font=3) #坐标轴的刻度值,也通过次级函数添加 mtext(c(-2, 0, 2), side=1, l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论