已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
为什么要研究排序算法-结构化数据表查找问题,ResearchCenteronIntelligentComputingforEnterprises6.j=j-1;7.Aj+1=key;8.,基本排序算法I-内排序之插入法排序(3)插入排序的算法表达?,插入法排序,O(N2),基本排序算法II-内排序之简单选择法排序,ResearchCenteronIntelligentComputingforEnterprises3forj=i+1toN4.ifAjithen6.7.temp=Ak;8.Ak=Ai;9.Ai=temp;10.11.,O(N2),简单选择法排序,基本排序算法II-内排序之简单选择法排序(3)简单选择排序的算法表达?,基本排序算法III-内排序之冒泡法排序,ResearchCenteronIntelligentComputingforEnterprises3.forj=1toN-i4.ifAjAj+1then5.temp=Aj;6.Aj=Aj+1;7.Aj+1=temp;8.haschange=true;9.10.11.if(haschange=false)thenbreak;12.,冒泡法排序,O(N2),基本排序算法II-内排序之冒泡法排序(3)冒泡排序的算法表达?,快速排序,从待排序列中任取一个元素(例如取第一个)作为中心,所有比它小的元素放在左侧,所有比它大的元素放在右侧,形成左右两个子序列;然后再对各子序列重新选择中心元素并依此规则调整,直到每个子序列的元素只剩一个,此时便为有序序列了。,同学自己能否写出其算法-这里将用到递归(略),其他排序算法?,受限资源约束下的算法-内排序与外排序问题,ResearchCenteronIntelligentComputingforEnterprises&Services,HarbinInstituteofTechnology,战德臣哈尔滨工业大学教授.博士生导师教育部大学计算机课程教学指导委员会委员,内排序问题:待排序的数据可一次性地装入内存中,即排序者可以完整地看到和操纵所有数据,使用数组或其他数据结构便可进行统一的排序处理的排序问题;外排序问题:待排序的数据保存在磁盘上,不能一次性装入内存,即排序者不能一次完整地看到和操纵所有数据,需要将数据分批装入内存分批处理的排序问题;,问题类比:某教师要对学生按身高排序。教师只能在房间(相当于内存)中对学生进行排序,假设房间仅能容纳100人,那么对于小于100人的学生排序便属于内排序问题。而对于大于100人,如1000人的学生排序,学生并不能都进入房间,而只能在操场(相当于磁盘)等候,轮流进入房间,这样的排序便属于外排序问题。,受限资源约束下的算法-内排序与外排序问题(1)排序问题的复杂性在哪里?,受限资源约束下的算法-内排序与外排序问题(2)外排序环境与问题示例?,内存:2GB待排序数据:7GB,10GB,100GB?-大数据集合这种需要使用硬盘等外部存储设备进行大数据集合排序的过程/算法称为外排序(Externalsorting)。,外排序算法的环境/资源(仅介绍思想,忽略一些细节),假设:读写磁盘块函数:ReadBlock,WriteBlock内存大小:共Bmemory=6块,每块可装载Rblock=5个元素待排序数据:Rproblem=60个元素,共占用Bproblem=12块,问题:Bproblem块的数据怎样利用Bmemory块的内存进行排序?,受限资源约束下的算法-内排序与外排序问题(2)外排序环境与问题示例?,基本排序策略Bproblem块数据可划分为N个子集合,使每个子集合的块数小于内存可用块数,即:Bproblem/NBmemory2如何排序呢?,算法的应用条件:子集合数Bmemory子集合的块数Bmemory即大数据集块数Bmemory2,基本排序算法IV-续-外排序之多路归并排序-讨论(2)算法在任何情况下都可以应用吗?,归并排序-讨论,内存大小:共Bmemory=3块待排序数据:共占用Bproblem=30块基本策略:30块的数据集10个子集合,每个子集合3块,排序并存储。10个已排序子集合分成5个组:每个组2个子集合,分别进行二路归并,则可得到5个排好序的集合;5个集合再分成3个组:每个组2个子集,剩余一个单独1组,分别进行二路归并,可得3个排好序的集合;再分组,再归并得到2个排好序的集合;再归并便可完成最终的排序。,基本排序算法IV-续-外排序之多路归并排序-讨论(3)当更大规模的数据需要排序时怎么办?,归并排序-思考,假如内存共有8块,问其如何排序有70块的数据集呢?你是采用二路归并、三路归并、七路归并?你设计的具体算法,磁盘读写次数是多少呢?磁盘读写次数最少的应是几路归并?,基本排序算法IV-续-外排序之多路归并排序-讨论(4)思考一下下列情况排序,应该怎么办?,PageRank网页排序算法I-网页排序问题及思想,ResearchCenteronIntelligentComputingforEnterprises&Services,HarbinInstituteofTechnology,战德臣哈尔滨工业大学教授.博士生导师教育部大学计算机课程教学指导委员会委员,PageRank网页排序算法I-网页排序问题及思想(1)网页排序问题?,4,540,000条检索记录,1,210,000条检索记录,怎样把最重要的检索记录显示给用户?,问题背景-搜索引擎,文本,OurProductInformation,OurProductInformation,网页重要吗?-网页重要度,问题背景-网页PageRank是计算网页重要度的一种方法,PageRank网页排序算法I-网页排序问题及思想(2)PageRank是什么?网页又是什么?,网页重要度问题的抽象,正向链接,反向链接,一个网页的正向链接是另一个网页的反向链接,PageRank网页排序算法I-网页排序问题及思想(3)正向链接与反向链接?,关于网页的基本观点,网页的反向链接数越多是否越重要呢?重要度越高的反向链接是否越重要呢?正向链接数越多,是否其对链接的网页而言,重要度会降低呢?,PageRank网页排序算法I-网页排序问题及思想(4)PageRank的基本思想?,网页重要度,一个网页的重要度等于其所有反向链接的加权和,即:反向链接权值zi,网页重要度R,则R=zi(for所有反向链接i)。一个正向链接的权值等于网页的重要度除以其正向链接数,即:网页重要度R,其正向链接数m,则其每一个正向链接的权值z=R/m。,怎样计算网页的重要度呢?,PageRank网页排序算法I-网页排序问题及思想(4)PageRank的基本思想?,PageRank网页排序算法II-网页排序问题的表达与建模,ResearchCenteronIntelligentComputingforEnterprises&Services,HarbinInstituteofTechnology,战德臣哈尔滨工业大学教授.博士生导师教育部大学计算机课程教学指导委员会委员,PageRank网页排序算法II-网页排序问题的表达与建模(1)问题的数学建模?,数学建模-示例,数学建模-邻接矩阵,正向链接,反向链接,正向链接,反向链接,PageRank网页排序算法II-网页排序问题的表达与建模(1)问题的数学建模?,数学建模转移概率,反向链接,转移概率矩阵,反向链接的权值,网页重要度向量,邻接矩阵,PageRank网页排序算法II-网页排序问题的表达与建模(2)正向链接的权值矩阵-转移概率?,矩阵乘法与反向链接的加权和,转移概率矩阵M,网页i的重要度为Ri,各网页重要度的向量R,记为:R=(R1,R2,Rn)T,矩阵乘法,第n-1次的网页重要度,第n次的网页重要度,PageRank网页排序算法II-网页排序问题的表达与建模(3)矩阵乘法与反向链接的加权和?,Ri(n)=j(Mij*Rj(n-1),PageRank网页排序算法III-网页重要度的迭代计算方法及讨论,ResearchCenteronIntelligentComputingforEnterprises&Services,HarbinInstituteofTechnology,战德臣哈尔滨工业大学教授.博士生导师教育部大学计算机课程教学指导委员会委员,PageRank网页排序算法III-网页重要度的迭代计算方法及讨论(1)网页重要度的迭代计算方法?,转移概率矩阵M,网页i的重要度为Ri,各网页重要度的向量R,记为:R=(R1,R2,Rn)T,迭代计算Ri(1)=j(Mij*Rj(0)Ri(2)=j(Mij*Rj(1)Ri(n)=j(Mij*Rj(n-1)Ri(n)=Ri(n-1)?,R的初始值是多少呢?从哪一个Ri开始计算呢?,矩阵乘法,第n-1次的网页重要度,第n次的网页重要度,PageRank计算结果分析,PageRank网页排序算法III-网页重要度的迭代计算方法及讨论(2)PageRank的计算结果分析?,1号vs.5号,6号vs.7号,2号vs.3号,PageRank网页排序算法IV-PageRank与数学及算法总结,ResearchCenteronIntelligentComputingforEnterprises&Services,HarbinInstituteofTechnology,战德臣哈尔滨工业大学教授.博士生导师教育部大学计算机课程教学指导委员会委员,PageRank网页排序算法IV-PageRank与数学及算法总结(1)PageRank计算vs.数学的特征方程?,迭代计算网页重要度R(0)=(R1(0),R2(0),Rn(0)TR(1)=cMR(0)R(2)=cMR(1)R=R(n)=R(n-1),当R不发生变化时,即收敛时则为所求,网页重要度的迭代计算,对N阶方阵A(转移概率矩阵),满足:Ax=x的数称为A的特征值,称x为属
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年健康食品产业布局可行性研究报告及总结分析
- 2025年智能家居系统整体解决方案可行性研究报告及总结分析
- 2024年泰安岱岳中小学教师招聘真题
- 2025年清洁空气城市监测系统可行性研究报告及总结分析
- 2025年罗非鱼养殖技术合作协议
- 2025年特色小镇发展战略研究可行性报告
- 2025年 灌南县事业单位工作人员聘考试笔试试题含答案
- 2025年老年食堂服务协议
- 2025年人工智能医疗服务应用可行性研究报告及总结分析
- 2025年老年人智能化生活服务平台可行性研究报告及总结分析
- 幼儿园中的自然教育对孩子的影响
- 植物生产类专业职业生涯规划书
- 中国胃食管反流病诊疗规范(2023版)解读
- 高中学生学籍表模板(范本)
- 膳食营养指导和疾病预防(卢世琰)课件
- 办公楼建筑能源管理平台技术方案书
- 河南省铭玮昊化工科技有限公司年产1000吨溴硝醇、100吨磺酰胺、200吨叔丁酯项目环境影响报告书
- 灭火器检查记录表模板实用文档
- 《赢利 未来10年的经营能力》读书笔记PPT模板思维导图下载
- 2023年成都交子金融控股集团有限公司招聘考试备考题库及答案解析
- YS/T 337-2009硫精矿
评论
0/150
提交评论