Teradata架构介绍教程(东南融通内部资料)_第1页
Teradata架构介绍教程(东南融通内部资料)_第2页
Teradata架构介绍教程(东南融通内部资料)_第3页
Teradata架构介绍教程(东南融通内部资料)_第4页
Teradata架构介绍教程(东南融通内部资料)_第5页
已阅读5页,还剩58页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Teradata架构,技术交流,范晓亮2009-04-10,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,WhatisTeradata?,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,TeradataABriefHistory,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,Teradata数据库竞争优势,数据及用户不限量经过验证的可升级性:支持小到(10GB)大到(100+TB)的数据库无限的并行性:设计和建立在并行基础上的数据库成熟的优化技术:能够处理复杂的查询,支持到最多64个的join子查询商业模型:NF、强大的视图处理、星型模型能力提供单个真实商业版本:Teradata提供一个中央的,通过抽取各个源系统数据集成的企业范围的数据库,保证数据的一致性高可用性并行装载及卸数处理强大的并行装载,load与unload工具可升级性,这些工具如:Fastload、Multiload、TPump、andFastExport,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,Teradata存储体系架构,注意:ParsingEngine解释sql命令并把记录转换成一个AMP消息,分配插入数据的请求MessagePassingLayer分发行,并确保每行发送到合适的AMPAMP格式化行并经其写入与此AMP相关的磁盘一个AMP管理一个由磁盘阵列中多个物理磁盘组成的逻辑或虚拟盘,Teradata数据检索体系架构,注意ParsingEngine优化请求并创建任务AMP需要执行的任务MessagePassingLayer分发PE创建的任务到相应的AMP,并激活它AMP从各自对应的物理磁盘取出需要的数据并通过MPL返回PE,PE把数据返回给请求的客户应用程序,如果数据需要格式化,排序,聚合都由AMP完成,Teradata架构中几个名词概念,BYNET(BanYanNETwork)BYNET是一个为NCRMPP系统提供高性能网络互连能力的软件与硬件集。BYNET允许在各节点之间使用点对点、多点传送、广播通讯。通讯能力的可测量性,每增加一个节点,每个BYNET增加60M(BYNETVersion3是90M)的带宽,所以增加一个节点时,更多的点对点连接可以同时建立,广播和多点传送的固定带宽是每秒60M(BYNETVersion3是90M),广播通信只有在需要对所有AMP操作时才会调用,一般都是点对点的通信,多点通信在V2R5版本中才引进进来。MPP(MassivelyParallelProcessing)system大量并行数据处理系统CLI(CallLevelInterface)CLI是一个最底层的与TeradataRDBMS之间的接口TDP(TeradataDirectorProgram)它运行于任何客户端系统上的程序,它管理CLI的Session通行到RDBMS,它的功能包括SESSION开始,终止,登录,身份认证,备份恢复,重起,TeradataandMPPSystems,Teradata使一个MPP系统以一个整体的系统形态展现给用户和数据库管理者TeradataRBDMS的主要组件是ParsingEngine(PE)和AccessModuleProcessor(AMP)两个虚拟的处理器TheMPL(包括PDEandBYNET)连接并使各节点之间可以通信,TeradataFunctionalOverview,Channel-AttachedclientsoftwareOverview,CallLevelInterface(CLI):访问Teradata最底层的接口,控制客户端的请求和响应,创建session,缓冲区的分配和初始化,信息的打包和解包TeradataDirectorProgram(TDP):session初始化和终止,登陆,验证,恢复和重起,维护传递到PE的session队列,错误通知(如应用程序失败,Teradata重起),session在多个PEs之间的分配企业系统连接信道(ESCONChannel)和总线和标记信道(BusandTagChannel),Network-AttachedclientsoftwareOverview,CLI提供对Teradata最大限度的连接和访问性,ODBC作为业内标准是更多的应用程序可以连接到TeradataMicroTeradataDirectorProgram(MTDP)是Teradata提供的网络连接环境下的TDP实现,它和渠道连接下的TDP功能基本一致,唯一的区别是它不负责session在多个PEs之间的分配,此功能由运行在Teradata系统上的ConnectandAssignServers实现MicroOperatingSystemInterface(MOSI)实现在客户端访问Teradata时的操作系统独立性,有了它,只需要一个版本的MTDP运行在不同的网络连接数据库平台上,TeradataPE(ParsingEngine)Define,包括以下功能Sessioncontrol:一个有效的session一经建立,就由PE负责在客户端应用程序和RDBMS之间的这次对话的管理,sessioncontrol主要控制着logon和logoffParser:解析客户端请求的sql,判断其语法和语义上的正确性,并查询数据字典确认所有的请求对象和列是否存在,请求的用户是否有相应的访问权限Optimizer:评估所有可选的执行计划并选出最快的一种,并将其转化成AMP可执行的步骤,传给DispatcherDispatcher:通过执行控制控制Optimizer传来的执行步骤一步步传递给相应的AMP,通过响应控制把结果返回给客户,根据sql请求的不同,执行步骤可能传递给一个AMP,或者几个AMP或者所有AMP,TheParsingEngine(分析引擎),PE的功能管理session(可以管理多达120个)解析并优化请求的sql语句发送优化过的执行计划给AMP输入转换例如EBCDIC/ASCII之间转换,如果需要转换时发送返回的结果集给请求端,MessagePassingLayerDefine,它负责处理Teradata数据库的内部通讯,即所有PEs和AMPs之间的通讯都要经过MPL,PE分配给AMP的执行步骤通过MPL路由到合适的AMP,处理完成后,响应消息再经过MPL路由由AMP返回给相应的PEMPL由ParallelDatabaseExtensions(PDE)软件,Bynet软件和Bynet硬件组成根据分发的请求不同,会有以下三种通信Broadcast消息传递给系统中所有的AMPs和PEsMulti-Cast消息传递给一组AMPsPoint-to-Point消息传递给系统中一个特定的AMP或者PEMPL这种技术是Teradata并行性的基础,MessagePassingLayer,MPL功能在PE和AMP之间传送信息点对点,多点,广播通讯合成返回结果集并传回PETeradata并行性的基础MPL组成ParallelDatabaseExtensions(PDE)软件Bynet软件用于MPP系统的Bynet硬件,TheAccessModuleProcess(AMP)Define,每个AMP负责管理数据库的一部分,AMPs完成生成一个结果集时所有的物理处理工作,包括排序,聚合,格式化,转换当一个AMP收到MPL传递过来的Parser/Optimizer的执行步骤时,它会完成相应的请求如从物理磁盘取出数据或对数据进行排序,对于某些请求,AMPs也可能会将其上的数据拷贝并传递给其他AMPsLock数据库或表,创建、修改、删除表,插入、修改、删除表中的数据返回结果集给Dispatcher空间管理,空间的使用控制和空间分配输出数据的转换,与PE做相反的工作,如PE把EBCDIC转换成ASCII,AMP则把ASCII转换成EBCDIC返回,TheAccessModuleProcessor(AMP),AMP功能找出请求的行Lock管理行排序聚合列输出转换和格式化为客户请求创建结果集磁盘空间管理恢复处理,LinearGrowthandExpandability,TeradataParallelismDefine,Parallelism(并行性):是Teradata数据库的核心每个PE能够支持120个Session并行处理每个Session可以处理多个并发请求,虽然每个时点只有一个请求是活动的,但每个Session自已能够管理16个请求和它们相关的结果集每个AMP能够并行处理80个任务,多线程的同时处理多个请求每个AMP作为数据库的一部分一起并行的处理请求,如果optimizer传递来的执行步骤之间没有交叉,AMP会同时并行处理一个请求的多步操作,TeradataParallenlism,Teradata是建立在并行基础上的系统每个PE能够支持120个Session并行处理每个Session可以处理多个并发请求MPL能并行处理所有活动的消息每个AMP能够并行处理80个任务所有的AMP能并悉心能够处理一个请求一个AMP能并行处理多个请求,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,TeradataDatabaseVersion1Platforms,TeradataDatabaseVersion2Architecture,TeradataDatabaseVersion2SingleNode(SMP),SMP体系架构,Multi-NodeMPP,NCRRack-BasedCabinets,NCRMPP系统的一些特性,Teradata数据库软件:它允许多个SMP运行在Teradata数据库上,并扮演单个实例角色可升级的BYNET连接:当增加节点时,相应的增加了带宽并行可升级性:通过安装/升级多个SMPs实现软件的并行安装和升级AWS(AdministrationWorkstation):单点操作控制及升级服务管理SMP:SMP只需要负责管理各自资源还有一些冗余的组件:两个BYNET,在一个磁盘组中有两个磁盘控制器,又模拟控制器来增强可用性,个power来支持节点.,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,Teradata数据库与数据库用户的比较,首先在Teradata中,数据库与数据库用户同样的重要,在整个系统中数据库名与用户名必须是唯一的,是sql语句里最高层次的限定条件一般来说,一个用户具有登录及访问权限的在很多系统中,一般不会给用户分配永久的空间,只能授权用户访问包括数据视图或宏的数据库,通过授权给用户去访问数据库中的表.数据库和用户一样是可以为空的,既不包括任何表、视图、宏、触发器、存储过程,也可以不分配永久空间他们唯一的不同是用户必须有密码,而数据库没有。在任何时候,一个有权限的用户可以改变另一个用户的spool空间大小只有永久空间被分配后,才可以创建表到数据库中,而视图、宏、触发器等可以在任何时间添加,因为他们不需要永久空间。数据库与用户都是一个数据库对象的存储库,他们主要的不同是用户能够登录并获得数据库SESSION.在DBC.DBASE表存放着数据库或用户信息,DatabaseUserComparison,TeradataDatabase-user的层次关系,数据库和用户的空间类别,PermanentSpace:分配给用户或数据库的最大存储容量,存放tablerows,Fallbacktables,secondaryindexsubtables,storedprocedures,andpermanentjournals.SpoolSpace:系统自动获取的临时空间,存放结果集的中间过程和最终的sql语句结果(select语句通常是用Spoolspace存放已经select的数据),可变临时表和导出表的数据,不再需要时自动释放.TemporarySpace:系统自动获取的临时空间,存放GlobalTemporarytables被实例化的数据。,主题,WhatisTeradata?TeradataABriefHistoryTeradata数据库竞争优势TeradataRDBMS架构Teradata系统架构Teradata数据库与数据库用户的比较数据存储和访问,StoringRows,PrimaryIndexValues,PrimaryKeysandPrimaryIndexes,RowDistributionUsingaUPICase1,RowDistributionUsingaNUPICase2,RowDistributionUsingaHighlyNon-UniquePrimaryIndex(NUPI)Case,SecondaryIndexes,跟Oracle的索引差不多每一个表可以有零或多个次索引可以是唯一或非唯一在数据仓库并不常用次索引建立次索引需要额外资源和空间Teradata性能本身很高,用次索引的需要不高不影响表在AMP中的分布可以在需要时动态添加,不用时再drop掉添加改善查询性能,UniqueSecondaryIndex(USI)Access,Non-UniqueSecondaryIndex(NUSI)Access,ComparisonofPrimaryandSecondaryIndexes,FullTableScans,PartitionedPrimaryIndexes(PPI),Teradata数据库的一种索引机制,数据按分区字段在AMP中分组摆放每一个表可有零或一个表分区访问只看有关系的分区用表分区字段作过滤条件直接比较=不用分区字段作运算大大加快速度例子:select*fromprdview.Tbl_awheresum_date=20030101从一个分区取数,定义PPI,CREATEMULTISETTABLEprdmiddle.Ft_mid_subtotal_item,NOFALLBACK,NOBEFOREJOURNAL,NOAFTERJOURNAL(user_idDECIMAL(15,0),gen_amtDECIMAL(12,0),gen_monthDECIMAL(6,0),subtotal_bill_itemDECIMAL(12,0),deal_idDECIMAL(12,0),sum_dateINTEGER)PRIMARYINDEXXIE1Ft_mid_subtotal_item(user_id)PARTITIONBYRANGE_N(sum_dateBETWEEN20030701AND20091231EACH1,NORANGEORUNKNOWN);,PartitionedPrimaryIndexes(PPI)和NPPI对照,表分区Explain,select*fromdevview.Tb_seu_first_bill_itemwhereload_timeisnull,非表分区Explain,select*fromdevview.Tb_seu_first_bill_itemwhereload_time/100isnull,PIExplain,select*fromdevview.Tb_seu_first_bill_itemwherecdr_id=123,非PIExplain,select*fromdevview.Tb_seu_first_bill_itemwhererate_id=123,数据库锁,L

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论