版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分布式存储在网盘和在线备份的应用技术创新,变革未来提纲互联网存储应用的特点网盘与在线备份的特点云存储平台简介总体实现方案分布式数据库架构分布式数据库特点分布式文件系统架构互联网存储应用的特点3高可靠:数据多份存储高可用:7X24小时高扩展:随时扩容高性能:高并发,低延迟高安全:分布式密钥和严格IDC管理制度高性价比:价格成本可控制易监控和维护:响应及时网盘和在线备份的特点4网盘与在线备份有很多相同点后台架构类似访问方式相似(上传及下载)都是云存储服务目标都是解决数据存储问题等在线备份相对网盘(同步盘)的特殊性是否保持用户的原始路径是否有设备的区分是否可以备份企业级数据库是否密钥用户可以自己保存
2、云存储平台简介PC客户端手机客户端WEB数据应用层HBase小数据存储层MongoDBMySQLHadoop/Carbonite业务处理层文件流信息HDFSCFS大数据存储层5云存储平台简介(二)6总共有1000亿个文件每天增加近1个亿新文件总共服务器台数约有1万台总存储量约为200P总体实现方案7分布式数据库:关系数据库与非关系型数据库(NoSql)集群 解决结构化数据的海量存储和高效访问MySQLHBase分布式文件系统:以文件为存储单位的非结构化数据存储HDFSMongoDB前端应用负载均衡LVSNgnix分布式数据库架构8分布式数据库架构(二)HBaseMySQL离散数据信息Maste
3、r1,2Slave1,2Master1,2,3Slave1,2,3,4,5同步服务交易数据等文件属性等9分布式数据库特点-HBase10成熟度比较高,目前已有多个著名公司在使用TaobaoFacebookAdobeTwitterYahoo!Trend Micro广告分析公司分布式数据库特点-HBase(二)11行强一致性同一行数据的读写只在同一台RS(RegionServer)机器上进行同一行的列的写入是原子操作水平自动伸缩Region的自动分裂(生产系统需要看具体情况)Master的自动均衡增加RegionServer机器即增加读写吞吐量及处理能力增加DataNode机器可增加容量分布式数据
4、库特点-HBase(三)12任意增加列高性能随机写支持Thrift框架Hbase经验分享13合理设计rowKey和Pre-Sharding尽量避免只操作少数几台机器;根据数据量、RegionServer个数合理Pre-Sharding。充分利用Filter功能SingleColumnValueFilterSubstringComparatorBinaryPrefixComparatorFamilyFilterQualifierFilterColumnPrefixFilterColumnPaginationFilterHbase经验分享(二)14可根据应用需求重写某些方法SubstringCom
5、paratorOverridepublic int compareTo(byte value) String laststr = Bytes.toString(value).toLowerCase();return laststr.contains(substr) ? 0 : 1;HBase经验分享(三)15充分FilterList的addFilterBinaryPrefixComparatorQualifierFilterColumnPrefixFilterPageFilterHBase经验分享(四)16考虑容量开启压缩目前主要是lzo方式提高随机读性能前端增加一个分布式缓存Radis系统系
6、统参数优化GC策略:-XX:+UseConcMarkSweepGC -XX:+UseParNewGC - XX:CMSInitiatingOccupancyFraction=70读写策略优化HBase经验分享(五)17系统参数优化读优化:hbase.regionserver.handler.counthbase.regionserver.global.memstore.upperLimit/lowerLimithbase.hregion.memstore.block.multiplierhbase.hstore.blockingStoreFileshbase.hregion.max.files
7、ize写优化:Bloomfilterin-memoryBlockcachehfile.block.cache.size分布式文件系统架构18大文件数据HDFS小文件数据及分块数据MongoDB文件“垃圾”数据回收分布式文件系统架构-HDFS(二)NFS Server/ BackupNode19分布式文件系统架构(三)文件流数据Shard1ShardNReplica setMaster1,2Slave1,2,NMongoDBHDFS校验服务小文件/分块数据大文件20MongoDB经验分享21尽量创建索引限定返回结果条数Filter只返回需要的数据优化主键,尽量自己控制主健IDUUID主键使用BinaryData数据类型存储HDFS经验分享22系统参数优化GC策略带宽策略优化带内与带外心跳的区分NameNode的备份至NFS时尽量不影响正常带宽使用同步锁机制尽量少用所有文件IO操作的地方尽可能不要加同步锁文件复本数设置尽量根据应用的访问频率设置不同份数HDFS经验分享(二)23NameNode数据损坏原因分析及修复查看日志,确定大概问题位置备份fs
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于深度强化学习的智能浇灌系统在校园植物养护中的自主决策应用实践课题报告教学研究课题报告
- 静脉留置针规范化操作与维护全流程指南解读课件
- 慕课电机学考试题及答案
- 2026年纺织服装个性化生产技术行业创新报告
- 网络视频广告植入
- (2025)妊娠期高血压疾病心血管风险综合管理专家共识学习与解读
- 2026年纺织品质量检测创新报告
- 海南省2025南省规划展览馆招聘事业编制人员1人(第1号)笔试历年参考题库典型考点附带答案详解
- 江苏省2025江苏省农业科学院第二批招聘高层次人才笔试历年参考题库典型考点附带答案详解
- 梅州市2025广东梅州市引进急需紧缺人才(丰顺县事业单位岗位)考试笔试历年参考题库典型考点附带答案详解
- 水利水电工程建设用地设计标准(征求意见稿)
- 2024中小学教师 高级职称专业水 平能力题库 (含答案)
- 《MEMS加工工艺》课件
- 皮带通廊改造施工方案范文
- 日语中助词は和が的区别(初级)课件
- 高二【化学(鲁科版)45】微项目探秘神奇的医用胶-课件
- 第五章儿童发展心理学智力的发展演示文稿
- GB/T 40851-2021食用调和油
- corelDraw交互式工具组
- 新闻价值及新闻敏感课件
- 2022年新疆地矿投资(集团)有限责任公司招聘笔试题库及答案解析
评论
0/150
提交评论