生物信息绘图基础_第1页
生物信息绘图基础_第2页
生物信息绘图基础_第3页
生物信息绘图基础_第4页
生物信息绘图基础_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息绘图基础 吴红龙 绘图的主要目的 绘图常用工具和图表格式 数据类型以及图示 介绍Excel,SVG绘图,R绘图等软件的 使用 绘图的主要目的 表达数据特征表达数据特征 实验数据中蕴含着各种显著或潜在的规律和特征。生物信息领域 中的海量离散数据尤其如此,并且这些规律或特征通常被淹没在 随机信号和实验误差之中。特征分布图可以形象化的展现数据中 的抽象规律及特征。(正态分布、双峰分布.) 表示数据关系表示数据关系 数据之间存在着各种直接或间接的联系,例如包含、延伸、对 照、线性等等关系。生物信息领域中,我们通常用连接关系图和 线性关系图来表示数据元素间的这种关系的细节。(进化树、蛋 白代谢途

2、径、染色体上基因排布.) 常用的绘图工具 1.Excel 2. SVG 3.R ,Gnuplot,Matlab 4. Illustrator CS4,Photoshop, Origin,Tecplot 常见的图片格式 1.散点图,柱形图,饼图 2.Venn 图,圆环图 3. 构造图、示意图、图解、框图、流程图、 记录图、布置图、地图、照片、图版 4.热图,曲面图,曲线图、火山图 插图和表格是科技论文撰稿中常用 的重要辅助手段。图表使用得当,设计 合理,不仅可以使论文论述清楚、明白, 还可以起到活跃、美化、节省版面,提 高读者阅读兴趣的效果。图应具有“自 明性” 。 图表 常见Table 格式

3、科学文章中的表格: 需采用三线表的格式(必要时可加辅 线),表格中的字体采用Arial,所有的内容 要居中,如果有必要对内容进行排序。 表头标注一定要简明扼要,字体采用黑 体。 绘图基本要求 常见图表要求常见图表要求 1.长宽比例合适(3:2或者4:3) 2.图片颜色格式(RGB or CMYK) 3.字体类型以及大小(Arial ) 4.图例标注 5.图表格式(根据表达的意思进行调整) 6.存储格式(一般在没有特殊要求的条件下为pdf) 7.图片的四周不要留有过多的空白 数据类型及图示 条形图及柱形图 用宽度相同的条形的高度或长短来表示各类别数据的图形 有单式条形图、复式条形图等形式 主要用

4、于反映分类数据的频数分布 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴, 称为柱形图 环形图 环形图中间有一个“空洞”, 总体中的每一部分数据用环 中的一段表示 环形图与圆形图类似,但 又有区别: 圆形图只能显示一个总 体各部分所占的比例 环形图则可以同时绘制多个 总体的数据系列,每一个总体 的数据系列为一个环 连接关系图 KEGG Pathway iPath Point to Point Excel Excel是微软公司出品的Office系列办 公软件中的一个组件,可以用来制作电子 表格、完成许多复杂的数据运算,进行 数据的分析并且具有强大的制作图表的 功能。OpenOffice下

5、的Calc具有类似功能, 可以作为Excel的替代品 Excel 作图 Excel 图表: 1. 饼图 2. 柱形图 3. 折线图 4. 条形图 5. XY散点图 饼图(pie Chart) 也叫圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形 主要用于表示总体或样本中各组成部分所占的比例,对于研究结 构性问题十分有用 绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形角 度表示,这些扇形的中心角度,是按各部分数据百分比占360的 相应比例确定的 柱状图 YH与NA18507 基因组结构性变异 (structure variations)长度分布图 首先对原始数据进行处理,按不同档计算

6、出 每个档下SV的个数。 曲线图 曲线图是用平滑的曲线将各数据点 连接起来而组成的图形,以曲线方式显 示数据的变化趋势。曲线图可以显示随 参量(根据常用比例设置)而变化的连 续数据。 SVG绘图 SVG-Scalable Vector Graphics 一种开放标准的矢量图形语言,代码来描绘图像,可以用任 何文字处理工具打开SVG图像,通过改变部分代码来使图 像具有互交功能,并可以随时插入到HTML中通过浏览器来 观看,可以任意放大图形显示. http:/ http:/ (SVG中国) http:/ (SVG参考手册) Excel的图形总体看来只有三种,第一种是表现 绝对数值大小,如条形图,柱

7、形图,折线图等; 第二 种是表现比例,如饼图;第三种则是表现二维平面上 的变量关系,如X-Y散点图. / http:/ 学习资料学习资料 1.1. 手册手册: : /manuals.html 2. 2. for Beginners for Beginners 3. 3. 统计建模与统计建模与R R软件软件 4.4. 统计图形与数据可视化统计图形与数据可视化 /cn/forum/27/cn/forum/27 5.5.http:/bm2.genes.

8、nig.ac.jphttp:/bm2.genes.nig.ac.jp /RGM2/RGM2/index.php?clearindex.php?clear=all=all 6.6.R 语言与统计分析- 汤银才 7.7./R/R- doc/ 常用常用R程序包程序包 base-R 基础功能包 stats-R统计学包 nlme- 线性及非线性混合效应模型 Graphics- 绘图 lattice- 栅格图 ape- 系统发育与进化分析 apTreeshape- 进化树分析 seqinr- DNA序列分析 ade4- 利用欧几里得方法进行生态学数据 分析 clu

9、ster- 聚类分析 ecodist- 生态学数据相异性分析 mefa- 生态学和生物地理学多元数据处理 mgcv- 广义加性模型相关 mvpart- 多变量分解 nlme- 线性及非线性混合效应模型 ouch- 系统发育比较 BiodiversityR - 基于Rcmdr的生物多样性数据分析 vegan- 植物与植物群落的排序,生物多样性 计算 maptools- 空间对象的读取和处理 sp-空间数据处理 spatstat- 空间点格局分析,模型拟合与检验 splancs- 空间与时空点格局分析 picante- 群落系统发育多样性分析 R packages 安装与调用 Install.pa

10、ckages(“package”) Library(package) 部分函数部分函数 计算 log(x) log10(x) exp(x) sin(x) cos(x) tan(x) asin(x) acos(x) min(x) max(x) range(x) length(x) 统计检验 mean(x) sd(x) var(x) median(x) quantile(x,p) cor(x,y) t.test() lm(y x) wilcox.test() kruskal.test () 统计检验 lm(y f+x) lm(y x1+x2+x3) bartlett.test binom.test

11、 fisher.test chisq.test glm(y x1+x2+x3, binomial) friedman.test . 工作空间工作空间 ls() 列出工作空间中的对象 rm() 删除工作空间中的对象 rm(list=ls() 删除空间中所有对象 save.image() 保存工作镜像 sink() 将运行结果保存到指定文件中 getwd() 显示当前工作文件夹 setwd() 设定工作文件夹 低水平绘图函数低水平绘图函数 lines() 添加线 curve() 添加曲线 abline() 添加给定斜率的线 points() 添加点 segments() 折线 arrows() 箭

12、头 axis() 坐标轴 box() 外框 title() 标题 text() 文字 mtext() 图边文字 高水平绘图函数高水平绘图函数 plot() 绘制散点图等多种图形 hist() 直方图 boxplot() 箱线图 stripchart() 点图 barplot() 条形图 dotplot() 点图 piechart() 饼图 interaction.plot() matplot() 绘图参数绘图参数 参数用在函数内部,在没有设定值时使用默认值。 font= 字体 lty= 线类型 lwd= 线宽度 pch= 点的类型 xlab= 横坐标 ylab= 纵坐标 xlim= 横坐标范围

13、 ylim= 纵坐标范围 log = 是否取log坐标 读取文件读取文件 存储文件存储文件 1, ? Eg : ?plot 2, example() Eg : example(plot) Tips 最常用函数最常用函数 ,par() eg :par(font.lab=1,font.axis=1,cex.lab=1.5,cex.axis=1. 5,mar=c(5.1,3.2,1,0.5)) ,read.table() eg : a-read.table(“*.txt”) ,plot() eg : plot(V2V1,data=a,ylab=“Mean Mehtylation”,xlab=“”,x

14、axt=“n”,type=“p”,pch=20,col= “red”,cex=0.5);axis(); ,pdf() eg : pdf(“out”,height=6,width=8) 1 . 散点图散点图 2 . 盒形图盒形图 Gnuplot GNUPLOT 是在 1986 年由 Colin kelley 和 Thomas Williams 所发展的绘图 公用程式,可将数学函数或数值资料以 平面或立体的图形画在不同种类终端机 或绘图输出装置上. IBM: http:/ /l-gnuplot/index.html User guide: http:/ ot/ 是一种由美国MathWorks公司出

15、品的商业数学软件,是 一种数值计算环境和编程语言,主要包括MATLAB和 Simulink两 大部分。它在数学类科技应用软件中在数值计 算方面首屈一指。MATLAB可以进行矩阵运 算、绘制函 数 和数据、实现算法、创建用户界面、连接其他编程语言的 程序等,主要应用于工程计算、控制设计、信号处理与通 讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB Matlab 作图 1.二维图形 a. 曲线图(PLOT) b. 符号函数画图(ezplot),fplot c. 对数坐标图 loglog(Y) 表示 x、y坐标都是对数坐标系 semilogx(Y) 表示 x坐标轴是对数坐标系 se

16、milogy() 表示y坐标轴是对数坐标系 plotyy 有两个y坐标轴,一个在左边,一个在右边 2. 三维图形 a.曲线 b. 曲面 -1 -0.5 0 0.5 1 -1 -0.5 0 0.5 1 0 10 20 30 40 -4 -2 0 2 4 -4 -2 0 2 4 -10 -5 0 5 10 特殊的图形 0.1 0.2 0.3 0.4 0.5 30 210 60 240 90 270 120 300 150 330 1800 Polar plot of sin(2*theta).*cos(2*theta) 210.8 210.9211211.1 211.2211.3 211.4 21

17、1.5211.6 211.7211.8 -48.45 -48.4 -48.35 -48.3 -48.25 -48.2 -48.15 -48.1 -48.05 -48 -47.95 -2-1.5-1-0.500.511.52 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 3 -0.4 -0.3 -0.3 -0.2 -0.2 -0.2 -0.1 -0.1 -0.1 -0.1 000 0.1 0.1 0.1 0.1 0.2 0.2 0.2 0.3 0.3 0.4 平面等值线图平面等值线图散点图散点图极坐标图极坐标图 -2 0 2 -2 0 2 -10 -5 0 5 10 x-axis y-axis z-axis contour3 of peaks -202 -3 -2 -1 0 1 2 3 x-axis y-axis contour of peaks 空间等值线图空间等值线图 -1 -0.5 0 0.5 1 -1 -0.5 0 0.5 1 -1 0 1 三维散点图三维散点图 Software of Data visualization uWEBLOGO uCIRCOS uSTRUCTURE uCytoscape uiPath uCluster WEBLOGO: /examples.html CIRCO

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论