版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
OracleBigDataSQL
全数据管理技术殷致云evan.yin@2016年10月12数据分析挑战隔离的信息孤岛难以分析数据分析挑战不同的数据访问接口4数据分析挑战没有能跨Oracle,Hadoop和NoSQL的统一接口客户想要什么丰富,全面的SQL访问企业的所有数据NoSQL突破创新:融合的大数据解决方案一条SQL可以访问所有数据源OracleHadoopBigDataSQLNoSQLAndmore…Oracle大数据SQL大规模并发SQL查询,横跨Oracle,Hadoop和NoSQLOracleDatabase12c卸载查询到Exadata存储服务器OffloadQuerytoExadataStorageServers小数据集快速返回SmalldatasubsetquicklyreturnedHadoop&NoSQL卸载查询到数据节点OffloadQuerytoDataNodesSQL数据子集datasubsetSQLOracle
BigDataSQL的用户9大数据分析服务研发、供应链、客户和消费者的数据集中化部署的数据科学组织提升客户体验、业务创新西班牙最大的零售银行,客户超过1300万收集来自不同接触渠道的多种信息,形成客户的统一视图网络威胁检测产品创新国际商业和技术
咨询公司,非/半结构化、运营和社交媒体大数据分析,探测网络入侵BDAExadataBDAExadataBDAExadataOracleBigDataSQL提供的能力关键功能特性10BigDataSQL:企业级海量大数据管理智能的外部表ExternalTables分布式数据存储的简单集成智能扫描SmartScan充分利用大数据平台的计算能力存储索引StorageIndexing自动减少I/O,从根本上提高查询分析性能谓词过滤下移PredicatePush-Down将分区修剪处理下移到大数据平台11丰富的SQL、更强的灵活性、更多的数据源12元数据:延伸Oracle外部表CREATETABLE
movielog
(
clickVARCHAR2(4000))ORGANIZATIONEXTERNAL(TYPEORACLE_HIVE
DEFAULTDIRECTORY
DEFAULT_DIRACCESSPARAMETERS(com.oracle.bigdata.tablenamelogscom.oracle.bigdata.clustermycluster))REJECTLIMITUNLIMITED;新型态的外部表ORACLE_HIVE(使用
hive元数据)ORACLE_HDFS(指定元数据)大数据参数获取Hadoop集群远程
Hive数据库/表DBMS_HADOOPPackage用于自动导入13智能外部表ExternalTableOracleTableHDFSData可定义:可获得:数据表名自动发现Hive表的元数据metadata定义Oracle数据类型自动将数据从Hadooptypes转化成Oracle数据库类型从任意的InputFormat自动转换任意的查询并行度在Hadoopcluster上并行执行
存储层14BigDataSQL:Hadoop
的另一个处理引擎文件系统
(HDFS)NoSQL数据库(OracleNoSQLDB,Hbase)资源管理(YARN,cgroups)处理层MapReduceandHiveSparkImpalaSearchBigDataSQL元数据存储Hadoop上的智能扫描:优化性能15DataNodeDiskBigDataSQL服务ExternalTableServicesSmartScan“Oracle服务位于上层”应用谓词过滤列投影(列过滤)半结构化数据解析(XML、JSON)“Hadoop服务位于底层”贴近数据进行处理工作使用Hadoopclasses实现SchemaOnRead转换为Oracle数据格式BigDataSQL数据流DisksDataNodeBigDataSQLAgentExternalTableServicesSmartScanRecordReaderSerDe101100101011001010110010123从HDFS数据节点读取数据直接路径读取尽可能使用基于C编写的reader否则使用Hadoop原生的classes将数据翻译转换为Oracle数据格式对Oracle格式数据应用智能扫描SmartScan谓词过滤列投影语法解析JSON/XMLBigDataSQL位于任何数据的顶层
1717任何类型的文件InputFormat创建分割/n/n/n/nRecordReader创建记录SerDe创建属性
BigDataSQL转换数据
&
智能扫描Hive元数据BigDataSQL细胞解析
18输出输入流数据转换Exadata存储服务器软件起源BigDataSQL细胞解析
19智能扫描输入输出流数据转换转换成Oracle文件快格式应用智能扫描及其他调优工具OracleBigDataSQL存储索引存储索引可以通过减少HDFS数据块的IO实现查询屠苏SQL查询中的列通过外部表定义映射到HDFS文件每个HDFS数据块中,所定义字段的最小和最大值保存在存储索引中20HDFSField1,Field2,10011010104511091043100110451609104311455190912430130101045019092043Field3,…,FieldnHDFSBlock1(256MB)HDFSBlock2(256MB)IndexB1–Movie_IDMin:1001Max:1609B2–Movie_IDMin:1909Max:13010Example:
查找MOVIE_ID为1109的所有打分✓✗21谓词下推DataNodeBigDataSQLAgentExternalTableServicesSmartScanDataNodeBigDataSQLAgentExternalTableServicesSmartScanSELECTticker,AVG(price)OVER(PARTITIONBYtickerORDERBYmnth)asavg_priceFROMstock_pricesWHEREmnth<:xANDmnth>:yANDstx_xchange=:zORDERBYmnthWHEREmnth<:xANDmnth>:yANDstx_xchange=:zSELECTticker,price,mnthWHEREmnth<:xANDmnth>:yANDstx_xchange=:zOracle数据库将SQL查询语句的谓词条件发送到Hadoop层(包括绑定变量)用于数据过滤Parquet/ORC文件格式的过滤Hive分区修剪HbaseSubscan再通过智能扫描SmartScan过滤出满足条件的行BigDataSQL效能特征
22减少IO的使用带来了综合性效能提升的效果100TB使用者查询分区裁剪10TB1存储索引1TB2谓词下推100GB3BigDataSQL安全特征
Hadoop安全ACL’s|Sentry|HDFS加密
|动态加密BigDataSQL安全特征
相同的数据安全模块应用于更广泛的数据存储先进的特性如:数据编辑,目前已经可以应用在不同数据源之间的结合Oracle安全层建构在现有
Hadoop功能之上Hadoop安全ACL’s|Sentry|HDFS加密
|动态加密(Hive)分区裁剪在查询运行之前读取
Hive目录跟裁剪分区12.2–利用Oracle数据库元数据优化分区裁剪目的:消除不必要的IO损耗存储索引维护元数据元素以标记文件块,减少不必要IO使用目的:消除不必要的IO损耗智能扫描最终过滤以确保只有被请求的数据元素会被传送到Oracle数据库目的:消除不必要的数据移动BloomFiltering(布隆过滤器)联接转换成布隆过滤器并下推到Hadoop节点目的:连接优化和本地化谓词和
ColumnProjection下推下推查询元素到文件如Parquet跟
ORC目的:减少优化文件格式所产生不必的IO消耗安全应用
Oracle数据库安全策略到非Oracle数据存储上目的:启动高效安全特性25BigDataSQL主要特征
OracleBigDataSQL能支持的平台Version3.026BigDataSQL支持的平台27XBBigDataSQLCloudServiceor1、BigDataSQL运行在Oracle集成系统平台Exadata运行Oracle数据库
以上
版本,BDA运行CDH5.5以上版本智能扫描SmartScan支持所有的数据通过Infiniband网络提供极致性能BDA是专门为海量数据处理而优化的Hadoop部署方式28BigDataSQL2、BigDataSQL运行在通用硬件平台12c+集成平台BDA采用通用x86硬件运行Oracle数据库
以上
版本,BDA运行CDH5.5以上版本利用OracleSQL进一步增强BDAHadoop平台的能力BDA是专门为海量数据处理而优化的Hadoop部署方式29BigDataSQL3、BigDataSQL运行在通用硬件平台支持Linux操作系统上的Oracle数据库12c(
以上
)+Cloudera(CDH5.5以上)或者Hortonworks(HDP2.3以上)的Hadoop利用OracleSQL增强Hadoop平台的能力激活Hadoop上长期保存的归档数据,缩短将数据转换为业务价值的时间30BigDataSQL4、BigDataSQL运行在Oracle公有云Linux操作系统上的Oracle数据库12c+ClouderaHadoop利用OracleSQL增强Hadoop平台的能力激活Hadoop上长期保存的归档数据,缩短将数据转换为业务价值的时间31XBBigDataSQLCloudService5、BigDataSQL运行在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026年初二化学(综合复习)上学期期末检测卷
- 2026年资产评估能力(资产分析)考题及答案
- 2025年高职建筑工程施工(测量放线)试题及答案
- 2025年中职软件工程(软件设计进阶)试题及答案
- 2025年大学(动画)三维动画制作期末试题及答案
- 2025-2026年九年级地理(区域发展)单元试卷
- 深度解析(2026)《GBT 18311.1-2003纤维光学互连器件和无源器件 基本试验和测量程序 第3-1部分检查和测量 外观检查》
- 深度解析(2026)《GBT 18128-2000应用错误与确认报文》
- 深度解析(2026)《GBT 17980.116-2004农药 田间药效试验准则(二) 第116部分杀菌剂防治苹果和梨树腐烂病疤(斑)复发》
- 深度解析(2026)《GBT 17980.2-2000农药 田间药效试验准则(一) 杀虫剂防治稻纵卷叶螟》
- 产褥感染课件
- 2025江苏省苏豪控股集团招聘参考笔试试题及答案解析
- 介入手术室护理查房
- 个体化肿瘤疫苗的临床前开发策略
- 装饰公司合伙协议书
- 尊崇宪法维护宪法
- 排水设施使用协议书
- 老年人失智症行为和精神症状(BPSD)护理方案
- 2025年超星尔雅学习通《环境经济学与生物资源管理》考试备考题库及答案解析
- JJG 1148-2022 电动汽车交流充电桩(试行)
- 智慧树知到《创新创业与管理基础(东南大学)》章节测试附答案
评论
0/150
提交评论