大数据sci基础课_第1页
大数据sci基础课_第2页
大数据sci基础课_第3页
大数据sci基础课_第4页
大数据sci基础课_第5页
免费预览已结束,剩余15页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、这是什么样的馅饼,让我来为大家下这类文章属于数据挖掘类文章,通过分析别人的实验高通实验数据例如芯片或二代数据根据生物信息学方法来寻找这是什么样的馅饼,让我来为大家下这类文章属于数据挖掘类文章,通过分析别人的实验高通实验数据例如芯片或二代数据根据生物信息学方法来寻找潜在重要的生物分子,可以作为诊断标志物或预后标志物2. 为什么用别人的数据还可章这些产生的海量大数据的上传者一般是取某几个重要的分子来研究来文章,因为精力有限,不可能把所有潜在的分子都研究一遍,但由于的文章必须 要数据库,例如 GEO 数据库。所以你可以挖掘这些 数据上传你的原始数据到来发现新的潜在有价值的知识,这也是这类文章的原因和

2、新颖点。 当然你也发现这类文章影响因子在 1-2 之间,不高。这也是理所当然的,如没有进一步实验研究就能发 分以上的文章,那就是天上掉妹子的事了3. 完成这类文章要是做些首先,一个新的 idea,最好是别人在这方向没有做类似你要做的工作。例如上面的肝癌已过了就不要做了。其次,一个新的分析方法,一般是构建生物网络之类的,或根据新的生物信息学分析方法,如果这方法是你,那即使是研究的对象也是上述的肝癌也是能的最后就是写作,其实仔细研究上面的文章发现也是一般的模版式或罗列式写法。当然要写的有新意也是不容易的。其中,可能最大的难点是数据的挖掘和分析。首先,要会用一些数据库,例如 GEO其次,了解些基本的

3、分析方法,看懂分析结果的生物学含义。最后,就是实践这些分析的过程,可能要编程。方向较少,所以本次公开投稿决定的方向是胆囊癌。特此邀请o 椰子同参这是GEO 数据库中胆囊癌的数据通3-4周1 2 数据库的这是GEO 数据库中胆囊癌的数据通3-4周1 2 数据库的具体讲解,如数据,数据分析的方法和结果3目前会按照以上进度进行更新,当然可能也会有所变动。方法学重要,但写作的思路和切入点也非常重要,关键点是为什么选择胆囊癌,这是一个需要体会的东西,我会尽快录制详细有关写作思路的,因为考虑到,况且文章尚未完工,防止一些耍小聪明的人,我会想个办法呈现给大家,但相信感一定是可以看到的。的童鞋另一点,对于此次

4、只有2 位同学报名,感觉挺失落,大家跟帖表支持,我很欣再一点,带着公开投稿的机会对于零基础从来没写过 SCI 的童鞋来说,机会是十分难得的,既可以亲身参与,又可以第一次SCI 文章以我一定会严格把关参与童鞋的真“零础”的给零基础童鞋学习,将会检索该童鞋的情况,一些非零基础的童鞋的行为。本栏写的文章都是高效率的非实验性文章,讲究的是效率和高产,一般不需要耗费很多的体力和精力,所以每次公开投稿只一位即可,一切看第一次公开投稿的情况吧,如果不是很受欢迎,就不做了,毕竟也要花精力的。文献调研:在pubed输入allblddran本栏写的文章都是高效率的非实验性文章,讲究的是效率和高产,一般不需要耗费很

5、多的体力和精力,所以每次公开投稿只一位即可,一切看第一次公开投稿的情况吧,如果不是很受欢迎,就不做了,毕竟也要花精力的。文献调研:在pubed输入allblddranermirarray。再输入Gallbladder rotein-eraction0microarray和protein-eractionnetwork而hccmicroarray作为就2 查询下而hccmicroarray作为就2 查询下的胆囊癌的标志物的研究review3,数据集的来源文3,数据集的来源文geo 中及时更新,所以要通过人名和geo 中及时更新,所以要通过人名和4 Ma MZ 胆囊癌的文章,仔细比3 篇是geo

6、相符,文章的内容都是某个lincRNA实MaMZ4 Ma MZ 胆囊癌的文章,仔细比3 篇是geo 相符,文章的内容都是某个lincRNA实MaMZ是通过筛选从而得出他的lncrna 重点在于lncRNA,那么mRNA 这些Ma MZ 4,方法学上的创新3下期将更新 GEO 数据和分析篇章。鉴于上述讲解对于零基础从未接触过大数据分析的童鞋来说鉴于上述讲解对于零基础从未接触过大数据分析的童鞋来说,估计还是有点力,我会视大家的反应看是不是要进一步用手把手来做更详细的讲解。GEO 数据集和简单分:v,2 种方法第一种(优先原始数据数,2 种方法第一种(优先原始数据数据 cel 表达谱数据(矩阵形式)

7、12.1MINiMLformattedfamilyfile(s)中的GPL2.2SeriesMatrix12.1MINiMLformattedfamilyfile(s)中的GPL2.2SeriesMatrixFile(s)中的matrix以上就是所的文件格式,最后导入R 语言进行处理。以后的分析具体只有标有如的数据集才能在 数据库上进行简单的分1名称即可:例如1名称即可:例如2.2 3.1 2.2 3.1 3.3 和 3.3 和 44查查XX疾病背景,分析了geoXX疾病的数据,为了阐明其发生发展机制XX疾病背景,分析了geoXX疾病的数据,为了阐明其发生发展机制s Materialsand

8、Microarray )singoftheMicroarray GOentandConstructthe XXidentificationofanetwork-basedConstructthe XXidentificationofanetwork-basedIdentificationofGOentandXX Key HYPERLINK http:/w/ 作sci*2预后分*3*miRNA-)*lncRNA-miRNA ()* 拷贝数-mRNA (,)* 甲基化-mRNA (甲基)* 转录因子)学到了这种文章的套路,不同与临床性文章和meta分析,这是个目前还学到了这种文章的套路,不同与临床性文章和meta分析,这是个目前还下两个数据tcga,和oncemine 数据库,是目前肿瘤最好数据库,可以直接看

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论