已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
云数据管理技术与挑战 陆嘉恒中国人民大学 2020 3 18 1 主要内容 2 云计算与云数据管理概述各大公司的云数据管理技术人民大学研究团队的工作云数据管理的研究挑战 2020 3 18 2 2020 3 18 3 CLOUDCOMPUTING 2020 3 18 4 云数据管理的新思维 2020 3 18 5 云数据管理准则 1 PartitionEverythingandkey valuestorage切分万物以治之数据库的第一范式无法满足 2020 3 18 6 云数据管理准则 2 EmbraceInconsistency容不同乃成大同数据库的ACID的属性无法满足 2020 3 18 7 云数据管理准则 3 Backupeverythingwiththreecopies狡兔三窟方高枕每个数据都有三个备份 达到99 999999 的保障度 2020 3 18 8 云数据管理准则 4 Scalableandhighperformance运筹沧海量兼容提供一个可伸缩的 处理和分析海量数据的平台 2020 3 18 9 拨云见日 切分万物以治之容不同乃成大同狡兔三窟方高枕运筹沧海量兼容 2020 3 18 10 主要内容 11 云计算与云数据管理概述各大公司的云数据管理技术人民大学研究团队的工作云数据管理的研究挑战 2020 3 18 11 主要内容 2020 3 18 12 Google文件系统 GFS 适用于大规模数据密集型应用程序的可扩展分布式文件系统多个部署GFS的集群已经建成目前最大的集群为 10000多个存储节点300 PB的存储容量可供不同机器上的上百用户同时读取 2020 3 18 13 介绍 观察1 控件的故障时常发生系统集成了实时监控 错误检测 容错性和自动恢复等功能超大文件 与普通文件相比 GB大小的文件很正常 2020 3 18 14 介绍 观察2 大部分文件修改都是添加新的内容需要考虑优化性能和保证原子性协同设计应用程序和API有利于增加整个系统的灵活性 2020 3 18 15 设计 集群包含一个master和多个chunkservers 并且可供多个用户读取 2020 3 18 16 GAEWeb应用 GAEWeb服务基础设施 分布式存储服务 应用程序运行时环境 应用开发套件 管理控制台 GoogleAppEngine 2020 3 18 17 分布式存储服务 GAE提供的分布式存储服务基于BigTable技术通过JavaJDO JPA接口或Python数据库标准接口访问和操作数据库优势 成本低 支持伸缩 并发性好 易管理采用乐观的并发控制 2020 3 18 18 应用程序运行时环境 GAE的应用程序运行时环境是一个可伸缩的Web程序运行平台目前支持Python和Java可以使用Google提供的丰富的应用服务 如分布式存储服务 网页抓取 邮件 图像 Google账户等 2020 3 18 19 云端应用 GoogleDocs是基于Web的文字处理和电子表格程序 支持在线协作 文档恢复 文档检索Gmail是有效的电子邮件工具 支持即时消息 视频聊天 会话检索等 2020 3 18 20 IBMEnsembles IBMTSAM IBMWebSphereCloudBurst IBMLotusLive IBMRC2 云环境管理解决方案 2020 3 18 21 IBMTSAM IBMTivoliServiceAutomationManager TSAM 管理应用服务生命周期的方案 2020 3 18 22 IBMWebSphereCloudBurst IBMWebSphereCloudBurstApplication WCA 帮助用户创建和管理面向服务的私有云平台有效整合了云基础设施层和云平台层 Web控制台 基础设施管理 虚拟化解决方案部署 用户合格组管理 虚拟器件镜像模板管理 监控 审计和计费 脚本包管理 数据中心资源 管理 CRM系统 ERP系统 网上银行 WebSphereApplicationServer WebSphereProcessServer WebSpherePorial DB2 数据中心管理员 应用系统 SOA环境 WebSphereCloudburstAppliance 2020 3 18 23 IBMLotusLive 通过Web方式交付的服务会议服务LotusLiveMeetingsLotusLiveEvents办公协作服务LotusLiveEngageLotusLiveConnections电子邮件服务LotusLiveNotes 2020 3 18 24 IBMRC2 IBMResearchComputeCloud 东京 北京 新德里 海法 苏黎世 纽约 奥斯丁 阿尔玛登 2020 3 18 25 AmazonWebService AmazonS3 AmazonEC2 AmazonSimpleDB AmazonSQS 2020 3 18 26 AmazonS3 AmazonSimpleStorageService S3 云计算平台提供的可靠的网络存储服务通过互联网访问和管理安全性账户认证访问控制列表查询字符串认证可靠性冗余备份的存储机制 2020 3 18 27 AmazonSimpleDB AmazonSimpleDB是一种支持结构化数据存储和查询操作的轻量级数据库服务存储模型 域 Domain 项 Item 属性 Attribute 现有不足延迟较大不能保证顺序执行用户更新与关系型数据库兼容有限 2020 3 18 28 AmazonEC2 AmazonEC2是一种云基础设施服务用户根据业务的需求自由地申请或者终止资源使用优势可伸缩性节省成本使用灵活安全可靠容错 2020 3 18 29 基础服务 数据库服务 应用开发服务 应用打包服务 2020 3 18 30 基础服务 F基础服务为上层服务和应用提供了安全 可靠的支撑环境三个关键技术多租户元数据安全架构 2020 3 18 31 数据库服务 F数据库服务数据模型数据对象持久化采用关系属性定义数据对象间的关系数据操作Web页面接口编程接口访问控制管理安全记录安全 2020 3 18 32 WindowsAzure NET服务 SQLAzure Live服务 2020 3 18 33 MicrosoftWindowsAzure AzureFabric控制器 存储服务 计算服务 开发环境 WindowsLive OfficeLive ExchangeOnline SharePointOnline DynamicCRMOnline Live服务 NET服务 SQL服务 SharePoint服务 DynamicCRM服务 应用 Azure服务平台 WindowsAzure 2020 3 18 34 MicrosoftSQLAzure 云环境的数据管理系统不支持CLR 空间数据及一些系统管理功能 如启动 停止SQLServer 优势无需对数据库进行定期备份提供统一数据访问接口提供更健壮的服务 2020 3 18 35 主要内容 36 云计算与云数据管理概述各大公司的云数据管理技术人民大学研究团队的部分工作云数据管理的研究挑战 2020 3 18 36 人大 阿里巴巴云 项目简介 由人大多个学院和教授共同合作针对淘宝 阿里巴巴海量的交易数据进行分析和挖掘 2020 3 18 37 研究任务 适合研究任务 宏观经济指数分析 参照人大三大发布项目开发指数平台 集成多种统计算法模型 提供横向对比分析设计周期性自动指数计算系统 可以按月 周 天自动计算指数 发布类似K线图的动态指数 38 2020 3 18 人民大学新开的 分布式系统与云计算 课程 2010年教育部IBM精品课程 39 分布式系统概述分布式云计算技术综述分布式云计算平台分布式云计算程序开发 2020 3 18 39 已编写教材介绍 分布式系统及云计算概论 清华大学出版社 Hadoop实战 机械工业出版社 Comingsoon 2020 3 18 40 课程网站 网址 下载教学课件 下载模拟试卷 观看课程视频 获取课程内容 2020 3 18 41 主要内容 42 云计算与云数据管理概述各大公司的云数据管理技术人民大学研究团队的工作云数据管理的研究挑战 2020 3 18 42 基于云上的数据管理的特点 计算资源是可伸缩的数据具有备份数据存储在大量分布的结点之上 2020 3 18 43 基于云上的数据管理的挑战 一 数据的自我管理和自调优 2020 3 18 44 基于云上的数据管理的挑战 二 基于大量节点的查询优化算法基于大量节点的索引结构 2020 3 18 45 基于云上的数据管理的挑战 三 资源调度和负载均衡多租户情况中 2020 3 18 46 总结 47 海量数据管理 新的挑战和机遇 企业和学术界共同面对的课题云数据管理技术方兴未艾国产数据库企业发展的一个新的机遇和挑战 2020 3 18 47 FurtherReading F Changetal Bigtable Adistributedstoragesystemforstructureddata InOSDI 2006 J DeanandS Ghemawat MapReduce Simplifieddataprocessingonlargeclusters InOSDI 2004 G DeCandiaetal Dynamo Amazon shighlyavailablekey valuestore InSOSP 2007 S Ghemawat H Gobioff andS T Leung TheGoogleFileSystem InProc SOSP 2003 D Kossmann Thestateoftheartindistributedqueryprocessing ACMComputingSurveys 32 4 422 469 2000 2020 3 18 48 FurtherReading EfficientBulkInsertionintoaDistributedOrderedTable SIGMOD2008 AdamSilberstein BrianCooper UtkarshSrivastava ErikVee RamanaYerneni RaghuRamakrishnanPNUTS Yahoo sHostedDataServingPlatform VLDB2008 BrianCooper RaghuRamakrishnan UtkarshSrivastava AdamSilberstein PhilBohannon Hans ArnoJacobsen NickPuz DanielWeaver RamanaYerneniAsynchronousViewMaintenanceforVLSDDatabases ParagAgrawal AdamSilberstein BrianF Cooper UtkarshSrivastavaandRaghuRamakrishnanSIGMOD2009CloudStorageDesigninaPNUTShellBrianF Cooper RaghuRamakrishnan andUtkarshSrivastavaBeautifulData O ReillyMedia 2009 2020 3 18 49 FurtherReading F Changetal Bigtable Adistributedstoragesystemforstructureddata InOSDI 2006 J DeanandS Ghemawat MapReduce Simplifieddataprocessingonlargeclusters InOSDI 2004 G DeC
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物业租赁合同范本及管理实务
- 幼儿园主题活动策划与教学反思
- 保险理赔服务流程标准化手册
- 贸易企业合同管理流程规范
- 六年级数学观察物体教学范本与课件
- 公司服务合同保证声明书(3篇)
- 有机废弃物循环利用项目可行性报告
- 建筑工程环保验收报告
- 高校心理健康教育课程体系建设与评价
- 高等数学试卷解析及答题技巧
- 2025年下半年四川广元青川县招聘事业单位工作人员18人重点基础提升(共500题)附带答案详解
- 2025江苏南京玄武区招聘社区工作者和“两新”组织专职党务工作人员70人备考考试题库附答案解析
- 基于六经病欲解时理论运用《伤寒论》经方治疗失眠症的创新性研究
- 箱式变电站迁移施工方案
- 2025江西吉安市国资委出资监管企业外部董事人选招录6人备考考试题库附答案解析
- GB/T 4744-2013纺织品防水性能的检测和评价静水压法
- 卫生部心血管疾病介入诊疗技术培训教材(共206页)
- 优才内经复习指导
- 2021年江苏徐州中考物理试卷附答案详解
- T∕CAMDI 047-2020 输液、输血器具用硬质聚氯乙烯(PVC)专用料
- 电大行政管理现代化评价系统初探
评论
0/150
提交评论