




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HDFS简介,杨林三2012.08.28,提纲,文件系统HDFS实验,文件系统概览,文件系统数据结构,文件系统数据结构,文件系统工作流程,LinuxExt2,LinuxExt3,NFS,小结,Hadoop,Hadoop,HDFS目标,Targets&CharactersVerylargefilesGB,TB,PB+Millionsoffiles10K+nodesStreamingdataaccessWrite-once,read-many-timesGooddatacoherencyTimetoreadwholedatasetmattersmorethantimetoseekCommodityhardwareCheapNodefailure:thechanceoverlargeclusterishighRedundancythroughreplicasFailurehandlingandrecovery,HDFS目标,Targets&CharactersOptimizedforbatchprocessingmovecomputationratherthandatalocationsofdataexposedtocomputationNotgoodforLow-latencydataaccessmsHighthroughputagainstLow-latencyLotsofsmallfilesMetadatamayrunoutofmemorySeektimeoverreadtimeMultiplewriters,arbitraryfilemodificationAsinglewriterWriteatendWrite-once,read-many-times,HDFS架构,Master/WorkersNameNodeMaster:onesingleFilenamespaceDirectoriesandfilesMetadataInmemoryMappingfilename-blocksblocks-datanodeClusterconfigurationReplicationManagement,DataNodesWorkers:manyAblockserverStoreblocksinlocalFSStoremetadataofblocksServedatatoclientsFacilitatepipelinetootherdatanodes,HDFS架构,DataStorage,Blocks/Chunks,Blocksize64/128/256MBConfigurablewhysobig?transferoverseekseek:10ms,transferrate:100MB,seektime/transfertime=1%=blocksize=100MBblocksofafiledistibutedoverdatanodesaspossibleasingleFILE,existingofNblocks,isstoredonMnodes,Namenode,Logofcreation,deletion,renameofthenamespace,NamespacetreeiscachedinRAMandstoredpermanentlyinFSImage,Editlogtakesrecodeofopen,close,renamefileordirectory,etc,SecondaryNamenode,Why?PeroidicallyMergeeditsandfsimagePreventeditlogfrombeingtoolargeProvidecheckpointofNamenodesfsimageasbackupincaseofNamenodecrash,NamenodeHigh-Availability,FsImageandEditLogarecentraldatastructuresofHDFS.AcorruptionofthesefilescancauseaHDFSinstancetobenon-functional.Forthisreason,aNamenodecanbeconfiguredtomaintainmultiplecopiesoftheFsImageandEditLog.MultiplecopiesoftheFsImageandEditLogfilesareupdatedsynchronously.Meta-dataisnotdata-intensive.,NamenodeSafemode,MergeFSImageandEditsEntersafemodeOffersread-onlyviewoffilesystemtoclientsBlock-locationinformationcollectionblock-locationinfonotinfsimagedatanodescheckintoreporttheirblockscheckblocksminimalreplicationcondition:99.9%blocksmeetminimumreplicationlevel(configurable,default1)exitsafemodeifminimalreplicationconditionreachesReplicateblocksifnecessaryblockswhoesreplicanumberislessthan3,HDFSoperations,MetadataoperationsCommunicatewithnamenodeonlyls,lsr,df,du,chmod,chown.R/W(block)operationsCommunicatewithnamenodeanddatanodesput,copyFromLocal,copyToLocal,tail.,DataWriting,DataReading,ReplicaPlacement,Criticaltoreliabilityandperformance.ReplicasareplacedReplicationfactoris31onanodeinalocalrack1onadifferentnodeinthelocalrack1onanodeinadifferentrack.Replicationfactor31/3ofthereplicaonanode1/3onondifferentnodeinthesamerack1/3distributedevenlyacrossremainingracks.ReplicaselectionThenearestoneforread,NetworkTopology,Characters3040nodes/rack1GB+switchforrackuplinktoacoreswitchorrouter1GB+aggregatebandwidthnodesonsamerackmuchhigherthandifferentracks,Bandwidth&DistancesProcessesonthesamenodeDifferentnodesonthesamerackNodesondifferentracksinthesamedatacenterNodesindifferentdatacenters,DatanodeFailure,DiskfailureDataNode正常服务坏掉的磁盘上的数据尽快通知NameNodeMachineDown问:NameNode怎么知道DataNode挂掉了?答:datanode每3秒钟向namenode发送心跳,如果10分钟datanode没有向namenode发送心跳,则namenode认为该datanode已经dead,namenode将取出该datanode上对应的block,对其进行复制。,HDFS压缩,实验-拷贝数据,hadoopfs-copyFromLocal/home/hduser0/hadoop/practice/data/ntes_logs/news_20120813.23.log.gz/data/input/ntes_logs/,实验-数据块,实验-LineCount,后续,LZO压缩格式实验日志合并原perl流程多台js服务器rsync合并机合并读2分钟的日志按时间排序url正则匹配:多个正则表达式Hadoop可能的方案js服务器可以作为Data
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年C证安全员模拟题集及答案解析
- 2025年中小学英语教师面试英语预测题集
- 2025年美术教育专业能力测评试卷及答案解析
- 2025年旅游规划实务考试试题及答案解析
- 2025年劳动保护知识题库含答案
- 2025年技术经纪人入门面试题库及答案
- 2025年建筑建材工程师资格考试试题及答案解析
- 2025年环境卫生管理师专业资格考试试题及答案解析
- 2025年化学分析师专业资格考试试题及答案解析
- 2025年市场调研分析师职位面试指南及模拟题解答
- 人教版(2024)八年级上册英语Unit 1 Happy Holiday教案
- 2025年疾控实验室生物安全及保密相关知识理论培训考试试题(含答案)
- 2025年岗前安全培训试题及答案
- 民用航空飞机电子系统技术
- 2025至2030中国茶叶行业市场深度调研及投资策略及有效策略与实施路径评估报告
- 托育机构管理办法
- 2025年浙江省中考科学试题卷(含答案解析)
- 水生物病害防治员职业技能鉴定经典试题含答案
- 尿道狭窄护理查房
- 儿童眼保健知识课件
- 《Unit 6 Find your way》教案-2024-2025学年外研版(三起)(2024)小学英语四年级上册
评论
0/150
提交评论