《数据仓库》课件.ppt_第1页
《数据仓库》课件.ppt_第2页
《数据仓库》课件.ppt_第3页
《数据仓库》课件.ppt_第4页
《数据仓库》课件.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020年3月23日星期一 DataMining ConceptsandTechniques 1 DataMining ConceptsandTechniques Chapter3 JiaweiHanDepartmentofComputerScienceUniversityofIllinoisatUrbana Champaignwww cs uiuc edu hanj 2006JiaweiHanandMichelineKamber Allrightsreserved 2020年3月23日星期一 DataMining ConceptsandTechniques 2 2020年3月23日星期一 DataMining ConceptsandTechniques 3 第三章数据仓库与OLAP技术概述 什么是数据仓库多维数据模型设计仓库体系结构数据仓库实现从数据仓库到数据挖掘 2020年3月23日星期一 DataMining ConceptsandTechniques 4 2 2 1数据仓库的产生数据仓库技术是随着人们对大型数据库系统研究的不断深入 在传统数据库技术基础之上发展而来的 其主要目的就是为决策提供支持 为OLAP 数据挖掘深层次的分析提供平台 数据仓库是一个和实际应用密不可分的研究领域 与传统数据库相比 数据仓库不仅引入了许多新的概念 而且在体系结构 数据组织等方面 均有其自身的特点 什么是数据仓库 2020年3月23日星期一 DataMining ConceptsandTechniques 5 数据仓库要解决的基本问题 全局范围内统一数据视图数据内容数据的完整性数据的准确性数据的一致性数据组织面向分析决策 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 6 在实际中经常存在这样 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 7 蜘蛛网 问题 没有统一规划和设计数据模型不一致数据定义不一致数据准确性差 冗余度高历史数据不统一 不规范 解决方案 深入 全面 客观的数据源分析 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 8 传统数据库的主要任务是进行事物处理 OLTP 它所关注的是事物处理的及时性 完整性与正确性 而在数据的分析处理方面 则存在着不足 主要体现在 集成性的缺乏首先 业务数据库系统的条块与部门分割 导致数据分布的分散化与无序化 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 9 证券公司内部信息系统 上海股东开户系统 指定 数据组织方式关系数据库系统 行情分析系统 类型可以选择 数据组织方式加密文本文件 上海法人清算系统 指定 数据组织方式关系数据库系统 证券交易系统 类型可以选择 数据组织方式关系数据库系统 财务分析系统 指定 数据组织方式关系数据库系统 证券咨询系统 类型可选择 数据组织方式加密文本文件 证券公司内部 信息孤岛群 实例 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 10 其次 业务数据库缺乏统一的定义与规划 导致数据定义存在歧义 证券交易数据库客户信息表acc numchar 10 CRM数据库客户信息表acc numchar 10 字段定义相同 但含义不同 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 11 上交所行情数据库S1char 6 深交所行情数据库hqzychar 6 字段名称不同 但含义相同 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 12 主题不明确建立传统数据库的目的是为了满足事物处理的需求 库和表的定义完全以此为基础进行 对数据分析而言缺少明确的主题 分析处理效率低 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 13 进一步整合现有的数据 企业范围内的信息共享准确 一致的集成数据快速访问精确 灵活分析 解决方案 引入数据仓库 联机分析处理和数据挖掘等技术 为什么需要数据仓库技术 2020年3月23日星期一 DataMining ConceptsandTechniques 14 数据仓库的定义 数据仓库之父BillInmon在1991年出版的 BuildingtheDataWarehouse 建立数据仓库 数据仓库 DataWarehouse 是一个面向主题的 SubjectOriented 集成的 Integrated 相对稳定的 Non Volatile 反映历史变化 TimeVariant 的数据集合 用于支持管理决策和信息的全局共享 什么是数据仓库 2020年3月23日星期一 DataMining ConceptsandTechniques 15 注意 数据仓库是一个过程而不是一个项目 数据仓库是一个环境 而不是一件产品 数据仓库提供用户用于决策支持的当前和历史数据 这些数据在传统的操作型数据库中很难或不能得到 数据仓库技术是为了有效的把操作形数据集成到统一的环境中以提供决策型数据访问 的各种技术和模块的总称 所做的一切都是为了让用户更快更方便查询所需要的信息 提供决策支持 2020年3月23日星期一 DataMining ConceptsandTechniques 16 数据仓库的特点1 面向主题的主题 在较高层次上将企业信息系统中的数据综合 归类并进行分析利用的抽象 在逻辑意义上 它对应企业中某一宏观分析领域所涉及的分析对象 2020年3月23日星期一 DataMining ConceptsandTechniques 17 数据仓库的特点 面向主题 寿险 财产险 机动车险 客户 操作型数据库是面向特殊处理任务 各个系统之间各自分离 数据仓库是按照一定的主题域进行组织 一个主题通常与多个操作型信息系统相关 操作型数据库 数据仓库 2020年3月23日星期一 DataMining ConceptsandTechniques 18 数据仓库围绕一些主题 如顾客 供应商 产品和销售组织 数据仓库关注决策者的数据建模与分析 而不是集中于组织机构的日常操作和事务处理 因此 数据仓库排除对于决策无用的数据 提供特定主题的简明视图 2020年3月23日星期一 DataMining ConceptsandTechniques 19 2 集成的数据仓库中的数据是在对原有分散的数据库数据抽取 清理的基础上经过系统加工 汇总和整理得到的 必须消除源数据中的不一致性 以保证数据仓库内的信息是关于整个企业的一致的全局信息 2020年3月23日星期一 DataMining ConceptsandTechniques 20 数据仓库的特点 集成的 面向特定应用 集成的 每一个数据库面向特定的应用 各类应用 包括其相关的数据库 之间相互独立 数据仓库中的数据面向整个企业的分析处理 数据仓库中的数据是已经集成了的 消除了数据的不一致性 操作型数据库 数据仓库 2020年3月23日星期一 DataMining ConceptsandTechniques 21 通常 构造数据仓库是将多个异种数据源 如关系数据库 一般文件和联机事务处理记录 集成在一起 使用数据清理和数据集成技术 确保命名约定 编码结构 属性度量等的一致性 2020年3月23日星期一 DataMining ConceptsandTechniques 22 3 反映历史变化数据仓库中的数据通常包含历史信息 系统记录了企业从过去某一时点 如开始应用数据仓库的时点 到目前的各个阶段的信息 通过这些信息 可以对企业的发展历程和未来趋势做出定量分析和预测 2020年3月23日星期一 DataMining ConceptsandTechniques 23 数据仓库的特点 反映历史变化 主要关心当前数据 通常包含历史数据 操作型数据库 数据仓库 2020年3月23日星期一 DataMining ConceptsandTechniques 24 数据存储从历史的角度 例如过去5 10年 提供信息 数据仓库中的关键结构 隐式或显式地包含时间元素 2020年3月23日星期一 DataMining ConceptsandTechniques 25 4 相对稳定的数据仓库的数据主要供企业决策分析之用 所涉及的数据操作主要是数据查询 一旦某个数据进入数据仓库以后 一般情况下将被长期保留 也就是数据仓库中一般有大量的查询操作 但修改和删除操作很少 通常只需要定期的加载 刷新 2020年3月23日星期一 DataMining ConceptsandTechniques 26 数据仓库的特点 相对稳定的 modify delete insert update Load Update 在某个时间段内保持相对稳定 实时更新 数据根据需要及时发生变化 定期加载 加载后的数据极少更新 实时更新 操作型数据库 数据仓库 2020年3月23日星期一 DataMining ConceptsandTechniques 27 数据库技术与数据仓库技术 数据库技术在系统功能和性能需求强调的是多用户环境下如何针对并发用户的增删改操作 保证数据的一致性和可恢复性 并发用户的吞吐量为数据库管理系统的重要性能指标数据仓库技术在系统功能和性能需求强调的是大数据量环境下的高效 快速查询 查询的吞吐量为数据仓库管理系统的重要性能指标 2020年3月23日星期一 DataMining ConceptsandTechniques 28 传统数据库与数据仓库的比较 比较项目传统数据库数据仓库总体特征围绕高效的事务处理以提供决策为目标存储内容以当前数据为主历史 存档 归纳面向用户普通业务处理人员高级决策管理人员功能目标面向业务操作 注重实时面向主题 注重分析汇总情况原始数据多层次汇总 数据细节损失数据结构结构化程度高 适合运算结构化程度适中 2020年3月23日星期一 DataMining ConceptsandTechniques 29 OLTP与OLAP 1 OLTP OnLineTransactionProcessing 联机事务处理系统 它是事件驱动 面向应用的 例如银行的储蓄系统就是一个典型的OLTP系统 其特点是 对响应时间要求非常高 用户数量非常庞大 主要是操作人员 数据库的各种操作基于索引进行关系数据库满足了联机事务处理 OLTP 的要求 2020年3月23日星期一 DataMining ConceptsandTechniques 30 2 OLAP OnLineAnalyticalProcessing 联机分析处理是基于数据仓库的信息分析处理过程 是数据仓库的用户接口部分 OLAP系统是跨越部门 面向主题的 其基本特点是 基础数据来源于信息系统中的操作数据 响应时间合理 用户数量相对较少 主要是业务决策与管理人员 数据库的各种操作不能完全基于索引进行 2020年3月23日星期一 DataMining ConceptsandTechniques 31 OLTP与OLAP的比较 2020年3月23日星期一 DataMining ConceptsandTechniques 32 OLTPvs OLAP P69 2020年3月23日星期一 DataMining ConceptsandTechniques 33 Chapter3 DataWarehousingandOLAPTechnology AnOverview Whatisadatawarehouse Amulti dimensionaldatamodelDatawarehousearchitectureDatawarehouseimplementationFromdatawarehousingtodatamining 2020年3月23日星期一 DataMining ConceptsandTechniques 34 第三章数据仓库与OLAP技术概述 什么是数据仓库多维数据模型设计仓库体系结构数据仓库实现从数据仓库到数据挖掘 2020年3月23日星期一 DataMining ConceptsandTechniques 35 从表到数据立方体 设计仓库建立在多维数据模型上 以数据立方体的方式来观察数据Adatacube suchassales allowsdatatobemodeledandviewedinmultipledimensionsDimensiontables suchasitem item name brand type ortime day week month quarter year Facttablecontainsmeasures suchasdollars sold andkeystoeachoftherelateddimensiontablesIndatawarehousingliterature ann Dbasecubeiscalledabasecuboid 基本立方体 Thetopmost0 Dcuboid whichholdsthehighest levelofsummarization iscalledtheapexcuboid 顶点立方体 Thelatticeofcuboidsformsadatacube 2020年3月23日星期一 DataMining ConceptsandTechniques 36 Cube ALatticeofCuboids time item time item location time item location supplier 2020年3月23日星期一 DataMining ConceptsandTechniques 37 ConceptualModelingofDataWarehouses Modelingdatawarehouses dimensions measuresStarschema AfacttableinthemiddleconnectedtoasetofdimensiontablesSnowflakeschema Arefinementofstarschemawheresomedimensionalhierarchyisnormalizedintoasetofsmallerdimensiontables formingashapesimilartosnowflakeFactconstellations Multiplefacttablessharedimensiontables viewedasacollectionofstars thereforecalledgalaxyschemaorfactconstellation 2020年3月23日星期一 DataMining ConceptsandTechniques 38 常见的概念模型 常用的概念数据模型有 星形模型雪花模型事实星座模型 2020年3月23日星期一 DataMining ConceptsandTechniques 39 1 星形模型 星形模型简洁 可以很准确地反映出各实体之间的逻辑关系 并依据实体的重要程度 将这种关系展示出来 星形模型由以下两部分构成 事实表维度表 2020年3月23日星期一 DataMining ConceptsandTechniques 40 事实表是星形模型的中心包含有大量的数据具有较小的 或没有 冗余度数据只需追加 不进行修改维度表是事实表的附属表一个事实表拥有一组维度表每个维度表通过主键与事实表相连 维度表之间通过事实表的中介相联系 2020年3月23日星期一 DataMining ConceptsandTechniques 41 ExampleofStarSchema SalesFactTable time key item key branch key location key units sold dollars sold avg sales Measures P73例3 1 2020年3月23日星期一 DataMining ConceptsandTechniques 42 2 雪花模型 雪花模型是星形模型的拓展 在事实表和维度表的基础上 增加了一类新表 详细类别表 用于对维度表进行描述 雪花模型的维度表具有较小的数据冗余 易于维护 节省存储空间 具有较高的灵活性 2020年3月23日星期一 DataMining ConceptsandTechniques 43 ExampleofSnowflakeSchema SalesFactTable time key item key branch key location key units sold dollars sold avg sales Measures 2020年3月23日星期一 DataMining ConceptsandTechniques 44 ExampleofFactConstellation SalesFactTable time key item key branch key location key units sold dollars sold avg sales Measures ShippingFactTable time key item key shipper key from location to location dollars cost units shipped 2020年3月23日星期一 DataMining ConceptsandTechniques 45 CubeDefinitionSyntax BNF inDMQL CubeDefinition FactTable definecube DimensionDefinition DimensionTable definedimensionas SpecialCase SharedDimensionTables Firsttimeas cubedefinition definedimensionasincube 2020年3月23日星期一 DataMining ConceptsandTechniques 46 DefiningStarSchemainDMQL definecubesales star time item branch location dollars sold sum sales in dollars avg sales avg sales in dollars units sold count definedimensiontimeas time key day day of week month quarter year definedimensionitemas item key item name brand type supplier type definedimensionbranchas branch key branch name branch type definedimensionlocationas location key street city province or state country 2020年3月23日星期一 DataMining ConceptsandTechniques 47 DefiningSnowflakeSchemainDMQL definecubesales snowflake time item branch location dollars sold sum sales in dollars avg sales avg sales in dollars units sold count definedimensiontimeas time key day day of week month quarter year definedimensionitemas item key item name brand type supplier supplier key supplier type definedimensionbranchas branch key branch name branch type definedimensionlocationas location key street city city key province or state country 2020年3月23日星期一 DataMining ConceptsandTechniques 48 DefiningFactConstellationinDMQL definecubesales time item branch location dollars sold sum sales in dollars avg sales avg sales in dollars units sold count definedimensiontimeas time key day day of week month quarter year definedimensionitemas item key item name brand type supplier type definedimensionbranchas branch key branch name branch type definedimensionlocationas location key street city province or state country definecubeshipping time item shipper from location to location dollar cost sum cost in dollars unit shipped count definedimensiontimeastimeincubesalesdefinedimensionitemasitemincubesalesdefinedimensionshipperas shipper key shipper name locationaslocationincubesales shipper type definedimensionfrom locationaslocationincubesalesdefinedimensionto locationaslocationincubesales 2020年3月23日星期一 DataMining ConceptsandTechniques 49 数据立方体的三种度量 P76 Distributive iftheresultderivedbyapplyingthefunctiontonaggregatevaluesisthesameasthatderivedbyapplyingthefunctiononallthedatawithoutpartitioningE g count sum min max Algebraic ifitcanbecomputedbyanalgebraicfunctionwithMarguments whereMisaboundedinteger eachofwhichisobtainedbyapplyingadistributiveaggregatefunctionE g avg min N standard deviation Holistic ifthereisnoconstantboundonthestoragesizeneededtodescribeasubaggregate E g median mode rank 分布的 代数的 整体的 2020年3月23日星期一 DataMining ConceptsandTechniques 50 AConceptHierarchy Dimension location all Europe North America Mexico Canada Spain Germany Vancouver M Wind L Chan all region office country Toronto Frankfurt city 2020年3月23日星期一 DataMining ConceptsandTechniques 51 ViewofWarehousesandHierarchies SpecificationofhierarchiesSchemahierarchyday month quarter week yearSet groupinghierarchy 1 10 inexpensive 2020年3月23日星期一 DataMining ConceptsandTechniques 52 MultidimensionalData Salesvolumeasafunctionofproduct month andregion Product Region Month Dimensions Product Location TimeHierarchicalsummarizationpaths IndustryRegionYearCategoryCountryQuarterProductCityMonthWeekOfficeDay 2020年3月23日星期一 DataMining ConceptsandTechniques 53 ASampleDataCube TotalannualsalesofTVinU S A 2020年3月23日星期一 DataMining ConceptsandTechniques 54 CuboidsCorrespondingtotheCube all product date country product date product country date country product date country 0 D apex cuboid 1 Dcuboids 2 Dcuboids 3 D base cuboid 2020年3月23日星期一 DataMining ConceptsandTechniques 55 BrowsingaDataCube VisualizationOLAPcapabilitiesInteractivemanipulation 2020年3月23日星期一 DataMining ConceptsandTechniques 56 TypicalOLAPOperations Rollup drill up summarizedatabyclimbinguphierarchyorbydimensionreductionDrilldown rolldown reverseofroll upfromhigherlevelsummarytolowerlevelsummaryordetaileddata orintroducingnewdimensionsSliceanddice projectandselectPivot rotate reorientthecube visualization 3Dtoseriesof2DplanesOtheroperationsdrillacross involving across morethanonefacttabledrillthrough throughthebottomlevelofthecubetoitsback endrelationaltables usingSQL 2020年3月23日星期一 DataMining ConceptsandTechniques 57 Fig 3 10TypicalOLAPOperations 2020年3月23日星期一 DataMining ConceptsandTechniques 58 AStar NetQueryModel ShippingMethod AIR EXPRESS TRUCK ORDER CustomerOrders CONTRACTS Customer Product PRODUCTGROUP PRODUCTLINE PRODUCTITEM SALESPERSON DISTRICT DIVISION Organization Promotion CITY COUNTRY REGION Location DAILY QTRLY ANNUALY Time Eachcircleiscalledafootprint 2020年3月23日星期一 DataMining ConceptsandTechniques 59 Chapter3 DataWarehousingandOLAPTechnology AnOverview Whatisadatawarehouse Amulti dimensionaldatamodelDatawarehousearchitectureDatawarehouseimplementationFromdatawarehousingtodatamining 2020年3月23日星期一 DataMining ConceptsandTechniques 60 DesignofDataWarehouse ABusinessAnalysisFramework FourviewsregardingthedesignofadatawarehouseTop downviewallowsselectionoftherelevantinformationnecessaryforthedatawarehouseDatasourceviewexposestheinformationbeingcaptured stored andmanagedbyoperationalsystemsDatawarehouseviewconsistsoffacttablesanddimensiontablesBusinessqueryviewseestheperspectivesofdatainthewarehousefromtheviewofend user 2020年3月23日星期一 DataMining ConceptsandTechniques 61 DataWarehouseDesignProcess Top down bottom upapproachesoracombinationofbothTop down Startswithoveralldesignandplanning mature Bottom up Startswithexperimentsandprototypes rapid FromsoftwareengineeringpointofviewWaterfall structuredandsystematicanalysisateachstepbeforeproceedingtothenextSpiral rapidgenerationofincreasinglyfunctionalsystems shortturnaroundtime quickturnaroundTypicaldatawarehousedesignprocessChooseabusinessprocesstomodel e g orders invoices etc Choosethegrain atomiclevelofdata ofthebusinessprocessChoosethedimensionsthatwillapplytoeachfacttablerecordChoosethemeasurethatwillpopulateeachfacttablerecord 2020年3月23日星期一 DataMining ConceptsandTechniques 62 DataWarehouse AMulti TieredArchitecture DataWarehouse OLAPEngine AnalysisQueryReportsDatamining Monitor Integrator Metadata DataSources Front EndTools Serve DataMarts DataStorage OLAPServer 2020年3月23日星期一 DataMining ConceptsandTechniques 63 ThreeDataWarehouseModels EnterprisewarehousecollectsalloftheinformationaboutsubjectsspanningtheentireorganizationDataMartasubsetofcorporate widedatathatisofvaluetoaspecificgroupsofusers Itsscopeisconfinedtospecific selectedgroups suchasmarketingdatamartIndependentvs dependent directlyfromwarehouse datamartVirtualwarehouseAsetofviewsoveroperationaldatabasesOnlysomeofthepossiblesummaryviewsmaybematerialized 2020年3月23日星期一 DataMining ConceptsandTechniques 64 DataWarehouseDevelopment ARecommendedApproach Defineahigh levelcorporatedatamodel DataMart DataMart DistributedDataMarts Multi TierDataWarehouse EnterpriseDataWarehouse Modelrefinement Modelrefinement 2020年3月23日星期一 DataMining ConceptsandTechniques 65 DataWarehouseBack EndToolsandUtilities Dataextractiongetdatafrommultiple heterogeneous andexternalsourcesDatacleaningdetecterrorsinthedataandrectifythemwhenpossibleDatatransformationconvertdatafromlegacyorhostformattowarehouseformatLoadsort summarize consolidate computeviews checkintegrity andbuildindiciesandpartitionsRefreshpropagatetheupdatesfromthedatasourcestothewarehouse 2020年3月23日星期一 DataMining ConceptsandTechniques 66 MetadataRepository Metadataisthedatadefiningwarehouseobjects Itstores Descriptionofthestructureofthedatawarehouseschema view dimensions hierarchies deriveddatadefn datamartlocationsandcontentsOperationalmeta datadatalineage historyofmigrateddataandtransformationpath currencyofdata active archived orpurged monitoringinformation warehouseusagestatistics errorreports audittrails ThealgorithmsusedforsummarizationThemappingfromoperationalenvironmenttothedatawarehouseDatarelatedtosystemperformancewarehouseschema viewandderiveddatadefinitionsBusinessdatabusinesstermsanddefinitions ownershipofdata chargingpolicies 2020年3月23日星期一 DataMining ConceptsandTechniques 67 OLAPServerArchitectures RelationalOLAP ROLAP Userelationalorextended relationalDBMStostoreandmanagewarehousedataandOLAPmiddlewareIncludeoptimizationofDBMSbackend implementationofaggregationnavigationlogic andadditionaltoolsandservicesGreaterscalabilityMultidimensionalOLAP MOLAP Sparsearray basedmultidimensionalstorageengineFastindexingtopre computedsummarizeddataHybridOLAP HOLAP e g MicrosoftSQLServer Flexibility e g lowlevel relational high level arraySpecializedSQLservers e g Redbricks SpecializedsupportforSQLqueriesoverstar snowflakeschemas 2020年3月23日星期一 DataMining ConceptsandTechniques 68 Chapter3 DataWarehousingandOLAPTechnology AnOverview Whatisadatawarehouse Amulti dimensionaldatamodelDatawarehousearchitectureDatawarehouseimplementationFromdatawarehousingtodatamining 2020年3月23日星期一 DataMining ConceptsandTechniques 69 EfficientDataCubeComputation DatacubecanbeviewedasalatticeofcuboidsThebottom mostcuboidisthebasecuboidThetop mostcuboid apex containsonlyonecellHowmanycuboidsinann dimensionalcubewithLlevels MaterializationofdatacubeMaterializeevery cuboid fullmaterialization none nomaterialization orsome partialmaterialization SelectionofwhichcuboidstomaterializeBasedonsize sharing accessfrequency etc 2020年3月23日星期一 DataMining ConceptsandTechniques 70 CubeOperation CubedefinitionandcomputationinDMQLdefinecubesales item city year sum sales in dollars computecubesalesTransformitintoaSQL likelanguage withanewoperatorcubeby introducedbyGrayetal 96 SELECTitem city year SUM amount FROMSALESCUBEBYitem city yearNeedcomputethefollowingGroup Bys date product customer date product date customer product customer date product customer 2020年3月23日星期一 DataMining ConceptsandTechniques 71 IcebergCube ComputingonlythecuboidcellswhosecountorotheraggregatessatisfyingtheconditionlikeHAVINGCOUNT minsup MotivationOnlyasmallportionofcubecellsmaybe abovethewater inasparsecubeOnlycalculate interesting cells dataabovecertainthresholdAvoidexplosivegrowthofthecubeSuppose100dimensions only1basecell Howmanyaggregatecellsifcount 1 Whataboutcount 2 2020年3月23日星期一 DataMining ConceptsandTechniques 72 IndexingOLAPData BitmapIndex IndexonaparticularcolumnEachvalueinthecolumnhasabitvector bit opisfastThelengthofthebitvector ofrecordsinthebasetableThei thbitissetifthei throwofthebasetablehasthevaluefortheindexedcolumnnotsuitableforhighcardinalitydomains Basetable IndexonRegion IndexonType 2020年3月23日星期一 DataMining ConceptsandTechniques 73 IndexingOLAPData JoinIndices Joinindex JI R id S id w

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论