数据库原理课程设计模板.doc_第1页
数据库原理课程设计模板.doc_第2页
数据库原理课程设计模板.doc_第3页
数据库原理课程设计模板.doc_第4页
数据库原理课程设计模板.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库原理课程设计1. 分组要求每4 人一组,要求在报告中注明每个人的贡献,答辩时可由每组指定1 人进行答辩,或者轮流答辩。报告的上交时间不得晚于2012 年6 月15 日,课程设计占期末总分的15%,迟交或者不交都不能得到该部分的分数。2. 课程设计报告的要求A4 纸,正文部分要求不少于20 页,所有英文字体采用Arial。报告标题为小三,段前2.5 行,段后2 行,黑体粗体;正文字号为小四,楷体,段间距为1.25 行,段前段后0.5 行;附录中参考文献部分为楷体五号。3. 内容要求3.1. 需求分析(a) 应用领域分析:要求说明相关背景知识,现有的同类数据库的开发情况,设计数据库的目的是什么(b) 数据库系统应支持的信息和应用:目标和功能(c) 定义数据库需要哪些事务处理:数据流程图(d) 定义数据项:需要哪些数据信息(e) 预测数据库系统未来可能的扩展3.2. 系统开发平台(a) 操作系统:建议采用类Unix操作系统(b) 开发工具:前台+后台,比如采用什么语言,用哪些数据库服务器3.3. 数据库系统设计(a) 数据库系统拟采用的架构(b) 数据库设计:逻辑模型设计和物理模型设计(c) 数据表以及相关视图、函数和过程等(d) 数据库前台设计3.4. 系统实现(a) 系统流程图(b) 数据库系统功能分析3.5. 系统测试参考文献必须至少包含15篇参考文献,从背景介绍到数据库实现等,都可以包括在内。源代码清单源代码中必须包含后台导出的SQL文件,包含数据库建立过程、数据库表的设计以及收集的数据本身。此外,源代码还必须包含前台部分中页面设计、各个数据管理与分析模块,计算机语言可采用PERL/PYTHON/PHP等等。数据库原理课程设计研究报告范例POLFRED:多态性位点频率数据库张三 李四 王五摘 要POLFRED是基于Web的从文献中提取的众多人群样本多态性位点频率的数据库。目前数据库包含了40多个人群,150多个遗传体系。多态性位点主要包括SNP数据、STRP数据和插入-删失多态性等多种数据。我们还将POLFRED与NCBI的dbSNP数据库进行了比较。关键词:等位基因,频率,人群,单核苷酸多态性ABSTRACTPOLFRED is a Web-accessible database that provides a public access to gene frequency data for a diverse set of population samples. Our database currently contains data on more than 40 populations representing most major regions of the world and data on more than 150 genetic systems including SNPs, STRPs, and insertion-deletion polymorphisms. In this paper, we also compare our database with dbSNP, the NCBI database which has a broader but overlapping purpose.Keywords: Allelic Frequencies, Genetics, SNPs, Perl, MySQL1. 背景介绍人类基因组计划(HGP)的开展,尤其是新一代测序技术的发展,为我们的研究积累了大量的遗传变异数据。大多数的遗传统计学分析工具需要有详细的遗传变异尤其是变异的频率数据,但目前存在的数据库如dbSNPs等数据库只从SNP的上下文序列、位置、SNP在各个人群中的频率分布等记录,从而影响了进一步的利用这些数据进行Meta-分析或其他数据挖掘工作。(此处省略5000字)本研究旨在从前人遗传学研究的基础上,从已经发表的文献中收集与特定某些遗传病相关的遗传多态性位点及其在不同人群中的频率、个体等一系列数据。接下来的第2节我们将从数据库开发的角度介绍本数据库的数据结构和关系以及数据的基本来源以及数据的预处理等,并对数据库进行简单的统计分析。第3节我们将进一步2. 数据库设计与开发图2 POLFRED数据库EER图(ER图可用MySQL WorkBench从设计好的数据库直接导出)3. 系统实现可列出一系列的界面以及系统实现4. 系统测试查询、更新与分析、压力测试等5. 讨论与展望数据库的优点(横向比较)与存在的不足,以及数据库进一步的发展方向贡献度本研究涉及的工作中,张三主要负责数据的收集和整理,李四负责数据库的设计和录入,而王五则负责数据库前台的设计与系统实现。本研究报告是在3位作者的共同协同下完成的。参考文献参考文献请用Endnote等软件导入,以保证格式的一致性1. Cargill,M., Altschuler,D., Ireland,J., Sklar,P. Ardlie,K., Patil,N., Shaw,N., Lane,C.R., Lim,E.P., Kalyanaraman,N. et al. (1999) Characterization of single-nucleotide polymorphisms in coding regions of human genes. Nature Genet., 22, 231238.2. Goddard,K.A., Hopkins,P.J., Hall,J.M. and Witte,J.S. (2000) Linkage disequilibrium and allele-frequency distributions for 114 single-nucleotide polymorphisms in five populations. Am. J. Hum. Genet., 66, 216234.3. Brookes,A.J., Lehvaslaiho,H., Siegfried,M., Boehm,J.G., Yuan,Y.P., Sarkar,C.M., Bork,P. and Ortigao,F. (2000) HGBASE: a database of SNPs and other variations in and around human genes. Nucleic Acids Res., 28, 356360. 4. Smigielski,E.M., Sirotkin,K., Ward,M. and Sherry,S.T. (2000) dbSNP: a database of single nucleotide polymorphisms. Nucleic Acids Res., 28, 352355. Updated article in this issue: Nucleic Acids Res. (2001), 29, 308311.附录1:部分PHP核心源代码附录2:部分SQL代码推荐1糖尿病关联基因与蛋白数据库1. 主要数据来源a) Pubmed:相关文献b) Genbank:相关基因c) Swiss-prot:相关蛋白d) OMIM:疾病数据e) 2. 主要关系表a) 文献 pubicationb) 糖尿病分型 subtypec) 基因 gened) 蛋白 proteine) 多态性 polymorphismf) 人群 population3. 主要实现功能a) 查询 queryb) 录入 upgradec) 修改 editd) 初步统计分析 statistice) 4. 数据挖掘a) 糖尿病分型b) 【注意问题】(1) 必须注意长序列在数据库中的存储策略,考虑可以用文件存储序列,而在数据库中用index指向序列。(2) 确定查询时现实中常见的策略,注意不要都使用简单查询,复杂查询在很多时候反而是必要的。(3) 可以考虑为输出数据提供下载,以供后续分析使用。推荐2癌症-基因数据库注释系统1. 主要数据来源a) OMIM:癌症与易感基因的对应关系b) OMIM:提取关于疾病症状的关键词c) 采用两两比对的方式分析2. 数据库主要结构a) 癌症b) 基因c) 癌症-基因d) 基因-基因blast 结果3. 数据分析a) 采用文本挖掘的方法比较不同癌症之间的相似性,进行聚类分析b) 根据癌症-基因,基因-基因之间的关系,采用非加权贝叶斯网络分析不同癌症之间的关系c) 将(a)、(b)的结果进行比较分析推荐3蛋白相互作用网络及其功能注释数据库1. 主要数据来源a) BioGrid中不同物种的蛋白相互作用数据库b) MIPS中蛋白相互作用数据库c) GO中各种蛋白的功能注释以及Funcat等工具的应用2. 主要关系表a) Protein表从蛋白的序列、二级到三级结构等特征b) PPI表列出不同物种中蛋白-蛋白相互作用c) GO表列出各种蛋白在GO库中的功能分类d) GOI表列出各个GO编号之间的相互关系e) Organism表列出各个不同的物种3. 要求及问题a) 提供基于蛋白质名称、序列等几种查询,输出蛋白相互作用表以及功能b) 列出某个物种中的所有蛋白-蛋白相互作用及相关功能并提供下载4. 蛋白未知功能分类分析a) 基于蛋白质相互作用网络和已知功能信息的蛋白,运用机器学习的方法注释未知功能蛋白;b) 利用在不同物种中的相互关系,从进化的角度推断可能的蛋白质功能。推荐4脂肪酶及其底物特异性数据库1. 主要数据来源a) 从蛋白质数据库中获取脂肪酶序列、结构信息b) 从文献和KEGG数据库中获取酶和底物的信息c) 查找酶蛋白中可能的结构域和功能域2. 主要关系表a) Lipase表从酯酶的序列、二级到三级结构等特征b) Domain表列出各种酯酶中存在的各种蛋白结构域c) Dol表列出各种酯酶与蛋白结构域的对应关系d) Substrate表列出各种底物也就是脂类e) Organism表列出各个不同的物种f) Catal表列出不同酶与各种底物之间的催化特性参数3. 要求及问题a) 提供基于蛋白质名称、序列等几种查询,输出酯酶及其与底物关系b) 列出所有酯酶的相关特性并提供下载4. 酯酶最适合底物分析a) 基于酯酶的序列、结构和已知催化信息,以及底物之间化学结构的相似性,运用统计学习的方法预测关键的决定催化活性的蛋白结构域;b) 利用以上关系,在给定序列的条件下,确定酯酶的最适合底物。推荐5Human Metalloenzyme DatabaseIt is estimated that roughly half of all proteins contain a metal. Many metal ions in various metal-proteins have been experimentally validated to play many essential functions in cells, such as catalyzing, transporting and signal transduction.In this project one of our efforts will focus on collecting zinc-finger proteins, and their respective structure, function classification as well as their homologs and paralogs within Homo sapiens as well as the other 28 mammals, and etc. One of our further mining tasks is to cluster the proteins, and discover the conserved domains and residues essential for both their functions and metal ion binding.The other group will be assigned to collect the Megnasium ion binding proteins and their respective sequence, structures, functions and the other properties.Both of the two groups need to collect the relevant investigations as well as the related publications on the study how lack of such minerals causing the diseases, like aneamia.The included 29 mammalian genomes consist of Rhesus Macaque (Macaca mulatta) Cow (Bos taurus) Dog, Domestic (Canis familaiaris) Guinea Pig (Cavia porcellus) Sloth, Two-toed (Choloepus hoffmanni) Nine-banded Armadillo (Dasypus novemicinctus) Kangaroo Rat (Dipodomys ordii) Tenrec (Echinops telfari) Horse (Equus caballus) Hedgehog, European (Erinaceus europeaus) Cat, Domestic (Feli

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论