




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HDFS简介,杨林三2012.08.28,提纲,文件系统HDFS实验,文件系统概览,文件系统数据结构,文件系统数据结构,文件系统工作流程,LinuxExt2,LinuxExt3,NFS,小结,Hadoop,Hadoop,HDFS目标,Targets&CharactersVerylargefilesGB,TB,PB+Millionsoffiles10K+nodesStreamingdataaccessWrite-once,read-many-timesGooddatacoherencyTimetoreadwholedatasetmattersmorethantimetoseekCommodityhardwareCheapNodefailure:thechanceoverlargeclusterishighRedundancythroughreplicasFailurehandlingandrecovery,HDFS目标,Targets&CharactersOptimizedforbatchprocessingmovecomputationratherthandatalocationsofdataexposedtocomputationNotgoodforLow-latencydataaccessmsHighthroughputagainstLow-latencyLotsofsmallfilesMetadatamayrunoutofmemorySeektimeoverreadtimeMultiplewriters,arbitraryfilemodificationAsinglewriterWriteatendWrite-once,read-many-times,HDFS架构,Master/WorkersNameNodeMaster:onesingleFilenamespaceDirectoriesandfilesMetadataInmemoryMappingfilename-blocksblocks-datanodeClusterconfigurationReplicationManagement,DataNodesWorkers:manyAblockserverStoreblocksinlocalFSStoremetadataofblocksServedatatoclientsFacilitatepipelinetootherdatanodes,HDFS架构,DataStorage,Blocks/Chunks,Blocksize64/128/256MBConfigurablewhysobig?transferoverseekseek:10ms,transferrate:100MB,seektime/transfertime=1%=blocksize=100MBblocksofafiledistibutedoverdatanodesaspossibleasingleFILE,existingofNblocks,isstoredonMnodes,Namenode,Logofcreation,deletion,renameofthenamespace,NamespacetreeiscachedinRAMandstoredpermanentlyinFSImage,Editlogtakesrecodeofopen,close,renamefileordirectory,etc,SecondaryNamenode,Why?PeroidicallyMergeeditsandfsimagePreventeditlogfrombeingtoolargeProvidecheckpointofNamenodesfsimageasbackupincaseofNamenodecrash,NamenodeHigh-Availability,FsImageandEditLogarecentraldatastructuresofHDFS.AcorruptionofthesefilescancauseaHDFSinstancetobenon-functional.Forthisreason,aNamenodecanbeconfiguredtomaintainmultiplecopiesoftheFsImageandEditLog.MultiplecopiesoftheFsImageandEditLogfilesareupdatedsynchronously.Meta-dataisnotdata-intensive.,NamenodeSafemode,MergeFSImageandEditsEntersafemodeOffersread-onlyviewoffilesystemtoclientsBlock-locationinformationcollectionblock-locationinfonotinfsimagedatanodescheckintoreporttheirblockscheckblocksminimalreplicationcondition:99.9%blocksmeetminimumreplicationlevel(configurable,default1)exitsafemodeifminimalreplicationconditionreachesReplicateblocksifnecessaryblockswhoesreplicanumberislessthan3,HDFSoperations,MetadataoperationsCommunicatewithnamenodeonlyls,lsr,df,du,chmod,chown.R/W(block)operationsCommunicatewithnamenodeanddatanodesput,copyFromLocal,copyToLocal,tail.,DataWriting,DataReading,ReplicaPlacement,Criticaltoreliabilityandperformance.ReplicasareplacedReplicationfactoris31onanodeinalocalrack1onadifferentnodeinthelocalrack1onanodeinadifferentrack.Replicationfactor31/3ofthereplicaonanode1/3onondifferentnodeinthesamerack1/3distributedevenlyacrossremainingracks.ReplicaselectionThenearestoneforread,NetworkTopology,Characters3040nodes/rack1GB+switchforrackuplinktoacoreswitchorrouter1GB+aggregatebandwidthnodesonsamerackmuchhigherthandifferentracks,Bandwidth&DistancesProcessesonthesamenodeDifferentnodesonthesamerackNodesondifferentracksinthesamedatacenterNodesindifferentdatacenters,DatanodeFailure,DiskfailureDataNode正常服务坏掉的磁盘上的数据尽快通知NameNodeMachineDown问:NameNode怎么知道DataNode挂掉了?答:datanode每3秒钟向namenode发送心跳,如果10分钟datanode没有向namenode发送心跳,则namenode认为该datanode已经dead,namenode将取出该datanode上对应的block,对其进行复制。,HDFS压缩,实验-拷贝数据,hadoopfs-copyFromLocal/home/hduser0/hadoop/practice/data/ntes_logs/news_20120813.23.log.gz/data/input/ntes_logs/,实验-数据块,实验-LineCount,后续,LZO压缩格式实验日志合并原perl流程多台js服务器rsync合并机合并读2分钟的日志按时间排序url正则匹配:多个正则表达式Hadoop可能的方案js服务器可以作为Data
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甘肃省人文课件
- 财务软件著作权转让合同7篇
- 甘南课件平台
- 瓷砖养护知识培训
- 瓷砖专业知识培训
- 瓷器制造工艺知识培训总结
- 2025年企业股份收购合同范本
- 基于创新技术的地铁旁通道冻结自动化监控系统构建与应用研究
- 基于分离法的实时仿真建模:原理、应用与优化
- 爱耳日课件教学课件
- 技术专家管理制度
- 黑龙江省哈尔滨市第九中学校2024-2025学年高二上学期11月期中考试生物试卷(有答案)
- 2025母婴护理员(中级)专业技能考评300题(含标准答案)
- 2025年小学语文一年级第一学期期中测试试卷
- (完整版)履带吊安装拆除专项施工方案
- 汉字竹子的课件
- 社区智慧化服务系统实施方案
- 小学生消防安全知识竞赛题库及答案
- 2025年航空航天用特种电缆研发生产合同
- 侵袭性肺真菌病诊断路径专家共识(2024版)解读
- (2025年标准)篮球免责协议书
评论
0/150
提交评论