搜索引擎的数学模型及其应用.pdf_第1页
搜索引擎的数学模型及其应用.pdf_第2页
搜索引擎的数学模型及其应用.pdf_第3页
搜索引擎的数学模型及其应用.pdf_第4页
搜索引擎的数学模型及其应用.pdf_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3 6 卷第3 期 J o u m a Io fS o u t h w 西e s t 南U n 民i v 族e r s 大i t y 学f o 学rN 报a t i 。o n 自a l 然i t i e 苎sN 学a t 版u r a lS c i e n c eE d i t i o n M a y2 01o I 1 一。 文章编号:1 0 0 3 - 2 8 4 3 ( 2 0 1 0 ) 0 3 - 0 4 8 0 - - 0 7 G o o g l e 搜索引擎的数学模型及其应用 赵国,宋建成 ( 西南民族大学计算机科学与技术学院,四川成都6 1 0 0 4 1 ) 摘要:该文在阐明G o o g l e 搜索引擎中关键的页面等级算法( P a g e R a l l k ) 原理的基础上,分析了P a g e R a n k 算法的随机冲 浪模型,并着重讨论相应的数学模型在足球队排名问题( 1 9 9 3 年全国大学生数学建模竞赛B 题) 中的应用具体做法是综 合考虑各队的比赛成绩,为每支球队计算相应的等级分( R a n k ) ,然后根据各队的等级分高低来确定名次考虑到竞技比 赛结果的不确定性,最后建立了等级分的随机冲浪模型分析表明等级分排名结果具有良好的参数稳定性,并且可以成 功地处理数据缺损方面的困难 关键词:搜索引擎;G o o g l eP a g e R a n k 算法;随机冲浪模型;足球队排名问题 中图分类号:0 1 4 1 4文献标识码:A 1引言 据统计,在短短2 0 多年的时间里,I n t e m e t 中产生的信息量相当于人类过去1 0 0 年产生的信息总量,而且 I n t e r n e t 上的信息量正以几何级数递增搜索引擎已经成为人们进行I n t e r n e t 信息资源搜索必不可少的工具在 众多的搜索引擎中,G o o g l e 搜索引擎以其雄厚的技术为支撑,凭借其强大的检索功能和高质量的检索服务,逐 渐脱颖而出G o o g l e 搜索引擎是由斯坦福大学S e r g e yB r i n 和L a w r e n c eP a g e 共同设计的,它是目前功能最强的 搜索引擎通过对8 0 亿网页进行整理,G o o g l e 可为世界各地的用户提供所需的搜索结果,而且搜索速度极快, 通常不到半秒,每天可提供约3 亿次查询服务 图1G o o g l e 搜索引擎的工作原理示意图图2I n t e m e t 网络的拓扑结构 G o o g l e 的优势在于掌握的信息量以及检索模型和检索速度传统的搜索引擎在很大程度上取决于文字在 网页上出现的频率G o o g l e 使用P a g e R a n k 技术检查整个网络链接结构,并确定哪些网页重要性最高然后进 行超文本匹配分析( H y p e n e X tM a t c h i n gA n a l y s i s ) ,以确定哪些网页与正在执行的特定搜索相关在综合考虑整体 收稿日期:2 0 1 0 0 3 1 3 作者简介:赵国( 1 9 7 9 ) ,男,硕士,西南民族大学计算机科学与技术学院讲师,主要研究方向为金融数学、数学模型 基金项目:西南民族大学青年项目 万方数据 第3 期 赵国等:G o o g l e 搜索引擎的数学模型及其应用 4 8 1 重要性以及与特定查询的相关性之后,G o o g l e 可以将最相关最可靠的搜索结果放在最前面 2 G o o g l e 搜索引擎的数学模型 G o o g l e 拥有多项专利技术,其中P a g e R a n k 算法是关键技术之一,它奠定了G o o g l e 强大的检索功能及提供 各种特色功能的基础虽然G o o g l e 每天有很多工程师负责全面改进G o o g l e 系统,但是仍把P a g e R a n k 算法作为 所有网络搜索工具的基础结构【2 j 2 1 P a g e R a n k 原理 P a g e R a n k 算法是G o o g l e 搜索引擎对检索结果的一种排序算法它的基本思想主要是来自传统文献计量学 中的文献引文分析,即一篇文献的质量和重要性可以通过其它文献对其引用的数量和引文质量来衡量,也就是 说,一篇文献被其它文献引用越多,并且引用它的文献的质量越高,则该文献本身就越重要G o o g l e 在给出页面 排序时也有两条标准:一是看有多少超级链接指向它;二是要看超级链接指向它的那个页面重要不重要这两 条直观的想法就是P a g e R a n k 算法的数学基础,也是G o o g l e 搜索引擎最基本的工作原理 P a g e R a n k 算法利用了互联网独特的超链接结构在庞大的超链接资源中,G o o g l e 提取出上亿个超级链接页 面进行分析,制作出一个巨大的网络地图具体的讲,就是把所有的网页看作图里面相应的顶点,如果网页A 有 个指向网页B 的链接,则认为一条从顶点A 到顶点B 的有向边这样就可以利用图论来研究网络的拓扑结构 P a g e R a n k 算法正是利用网络的拓扑结构来判断网页的重要性具体来说,假如网页A 有个指向网页B 的 超链接,G o o g l e 就认为网页A 投了网页B 一票,说明网页A 认为网页B 有链接价值,因而B 可能是个重要的 网页G o o g l e 根据指向网页B 的超链接数及其重要性来判断页面B 的重要性,并赋予相应的页面等级值 ( P a g e R a n k ) 网页A 的页面等级值被平均分画己给网页A 所链接指向的网页,从而当网页A 的页面等级值比较高 时,则网页B 可从网页A 到它的超链接分得一定的重要性根据这样的分析,得到了高评价的重要页面会被赋 予较高的网页等级,在检索结果内的排名也会较高页面等级值( P a g e R a n k ) 是G o o g l e 表示网页重要性的综合 性指标,而且不会受到不同搜索引擎的影响 当然,重要性高的页面如果和检索关键词无关同样也没有任何意义为此,G o o g l e 使用了完善的超文本匹 配分析技术,使得能够检索出重要而且正确的网页 2 2P a g e R a n k 算法 P a g e R a n k 算法的具体实现可以利用网页所对应的图的邻接矩阵来表达超链接关系为此,首先写出所对应 图的邻接矩阵4 为了能将网页的页面等级值平均分配给该网页所链接指向的网页,对各个行向量进行归一化 一一一T 处理,得矩阵A P a g e R a n k 算法的矩阵是将归一化矩阵A 转置所得矩阵W = A 1 这样形成的矩阵肜被称为转 移概率矩阵,它的各个列向量之和为全概率1 ,各个行矢量表示状态之间的转移概率转移概率矩阵与M a r k o f f 过程有着密切的联系【3 】转置的理由是,P a g e R a n k 算法并非重视链接到多少页面,而是重视被多少页面链接各 个网页的页面等级值P a g e R a n k 的计算,就是求这个转移概率矩阵W 的最大特征值所属的特征向量 现在以前面给出的三个页面之间的超链接关系为例,说明P a g e R a n k 算法如何计算给定网页的页面等级值 P a g e R a n k ,从而定量地知道哪些网页是最重要的为利用网页所对应的图的邻接矩阵来表达链接关系,首先写 出所对应图的邻接矩阵 A = O1l O O l 100 为了能将网页的页面等级值平均分配给该网页所链接指向的网页,对各个行向量进行归一化处理,得 万方数据 4 8 2西南民族大学学报自然科学版第3 6 卷 彳= o 1 2 O 0 l0 将归一化所得的矩阵彳转置,所得到的转移概率矩阵= ( w 口) 为 现给每个页面尸一个P a g e R a n k 值x ,这些P a g e R a n k 值应该由链接到该页面的那些页面的P a g e R a n k 值确 定,即指向P 的那些页面的页面等级值之和应该与尸的页面等级值x 。成正比设共同的比例系数为A ,则有下 面的线性方程组 土 :W ,x ,= 2 x ,f _ 1 , 2 ,3 ( 1 ) 。 J = l 令x = ( 而,x 2 ,X 3 ) 7 为页面等级值组成的列向量,则由矩阵乘法,等式( 1 ) 可以写成 W x = 触 由此求出转移概率矩阵的最大正特征值五= 1 ,相应非负特征向量x = ( 1 ,1 2 ,1 ) 1 ,由此可以确定网页的排 序为C ,A ,B ,其中页面A ,C 的排序无显著差别,之所以将c 排在前面是因为指向C 的超链接数更多一些 2 3 随机冲浪模型( R a n d o mS u r f e rM o d e l ) P a g e R a n k 算法原理中有个重要的假设:所有的网页形成一个闭合的链接图,除了这些文档以外没有其他 任何链接的出入,并且每个网页能从其他网页通过超链接达到但是在现实的网络中,并不完全是这样的情况 当一个页面没有出链的时候,它的P a g e R a n k 值就不能被分配给其它的页面同样道理,只有出链接而没有入链 接的页面也是存在的但P a g e R a n k 并不考虑这样的页面,因为没有流入的P a g e R a n k 而只流出的P a g e R a n k ,从 对称性角度来考虑是很奇怪的吲时,有时候也有链接只在一个集合内部旋转而不向外界链接的现象在现实 中的页面,无论怎样顺着链接前进,仅仅顺着链接是绝对不能进入的页面群总归是存在的 P a g e R a n k 技术为了解决这样的问题,提出用户的随机冲浪模型:用户虽然在大多数场合都顺着当前页面中 的链接前进,但有时会突然重新打开浏览器随机进入到完全无关的页面G o o g l e 认为:用户在8 5 的情况下沿着 链接前进,但在15 的情况下会跳跃到无关的页面中用公式表示相应的转移概率矩阵为 一W :d W o ! 型P P7 。 门 其中,e 为分量全为l 的胛维列向量,从而e e l 为全1 矩阵,d ( 0 ,1 ) 为权重因子( d a m p i n gf a c t o r ) ,在实际中 G o o g l e 取d = O 8 5 也就是说,在随机冲浪模型中,求各个页面等级值P a g e R a n k 的问题变成了求正矩阵形的 最大特征值所属的特征向量问题 还是考虑前面给出的三个网页A 、B 、c 之间的超链接关系,在随机冲浪模型下为方便计算令d = 0 5 ,相 应的转移概率矩阵为 ,o 1 6 6 7 o 1 6 6 7o 6 6 6 7 ) 一W :o 5 W4 螋P P 7 - - 10 4 1 6 7 o 1 6 6 7o 1 6 6 7I 3 I o 4 1 6 7 o 6 6 6 7o 16 6 7 j 根据著名的P e r r o n F r o b e n i u s 定理【3 】,转移概率矩阵的最大正特征值是1 ,相应的特征向量为 ( 1 4 1 3 ,1 0 1 3 ,1 5 1 3 ) T 由此可以确定网页的排序为c ,A ,B 可见随机冲浪模型下的排序结果更合理一些 1 0 O 0 0 1 2 20li I l 一4 f l 形 万方数据 第3 期赵国等:G o o g l e 搜索引擎的数学模型及其应用 4 8 3 3 页面等级算法P a g e R a n k 的应用 首先我们从图论的角度解释P a g e R a n k 算法的原理:一是看这个页面对应顶点的入度;二是要给指向该顶 点的边赋予权重,表明这个超级链接的重要性具体的讲,就是把所有的页面看作图里面的点,然后给每个页 面一个数量,用这个数量来刻画页面的重要性,这样网页的重要性就脱离了它的具体内容我们只需从网络拓 扑结构出发研究网页的重要性,这样就可以用图论来研究向互联网这样的随机复杂网络而且按照这个原理对 网页排序具有三个优点:第一,排序与特定搜索关键词无关;第二,网页排序与网页的具体内容无关;第三,只 需要知道网页所对应的图的结构 P a g e R a n k 算法的这个特点使得它可以被应用于社会领域的其他问题例如体育比赛的排名问题下面针对 1 9 9 3 年全国大学生数学建模竞赛B 题1 4 J ,利用P a g e R a n k 算法讨论足球队排名次问题,我们发现随机冲浪模型可 以有效克服数据缺损等方面的凼难 足球队排名次问题要求我们建立一个客观的评估方法,只依据过去一段时间( 几个赛季或几年) 内每个球队 的战绩给出各个球队的名次,具有很强的实际背景【5 J 通过分析题中1 2 支足球队在联赛中的成绩,不难发现表 中的数据残缺不全,队与队之间的比赛场数相差很大,直接根据比赛成绩来排名次比较困难下面我们利用 P a g e R a n k 算法的随机冲浪模型来求解 类比P a g e R a n k 算法,我们可以综合考虑各队的比赛成绩为每支球队计算相应的等级分( R a n k ) ,然后根据各 队的等级分高低来确定名次直观上看,给定球队的等级分应该由它所战胜和战平的球队的数量以及被战胜或 战平的球队的实力共同决定具体来说,确定球队Z 的等级分的依据应为:一是看它战胜和战平了多少支球队; 二要看它所战胜或战平球队的等级分的高低这两条就是我们确定排名的基本原理在实际中,若出现等级分 相同的情况,可以进一步根据净胜球的多少来确定排名 由于表中包含的数据量庞大,我们先在不计平局,只考虑获胜局的情形下计算出各队的等级分, 以说明算 法原理然后我们综合考虑获胜局和平局,加权后得到各队的等级分,并据此进行排名考虑到竞技比赛的结果 的不确定性,我们最后建立了等级分的随机冲浪模型,分析表明等级分排名结果具有良好的参数稳定性 3 1 获胜局的等级分 首先利用有向赋权图的权重矩阵来表达出各队之间的胜负关系用图的顶点表示相应球队,用连接两个顶 点Z 与丁,的有向边表示两队的比赛结果,同时给该边赋予相应的权重,表明Z 战胜丁,的次数由此,可以写出 表中1 2 支球队所对应的有向赋权图的权重矩阵 S = l2 l l ll ll 00 00 1l Ol ll O1 0 O ll 2O lO ll OO OO O0 0O0lOOOO OOOO0Ol0 1 O0O O0OO 0OO232l1 000 Ol 1 l O 00O2021l 0 O0lOOll lOOOO0OO l OO O 00 lO 例如,表中五与瓦比赛了两场,各胜一场,故瓦。= 1 ,瓦,= 1 同理,互。= 3 表明正曾3 次战胜正 注意到被战胜球队的等级分应该平均分配给各个获胜球队,将权重矩阵的各个列向量向量进行归一化,得 转移概率矩阵S = O 。) 为 万方数据 4 8 4 西南民族大学学报自然科学版 第3 6 卷 S = 00 2 5O 1 6 6 70 2 5 0 2O0 1 6 6 70 0 8 3 3 0 20 50 0 0 8 3 3 O0OO 00O0 0 8 3 3 0O00 0 8 3 3 0 400 1 6 6 70 1 6 6 7 O 20O 1 6 6 70 0 8 3 3 OOO 1 6 6 70 0 8 3 3 O0 2 50 1 6 6 70 0 8 3 3 O0OO 0O0O O 20 3 3 3 3 0 0 3 3 3 3 0 20 3 3 3 3 0 0 O0 0 2O OO 0O 0O OO 0 2O 0 2O 0 1 2 5 0 2 500 OO 1 2 500 0 1 2 50 1 2 50 1 6 6 7 0 0 1 2 5000 0O 00 1 6 6 7 0000 0 2 50 3 7 50 3 3 3 30 1 6 6 7 O0 1 2 50 1 6 6 7 0 1 6 6 7 0 2 500 3 3 3 30 1 6 6 7 0 1 2 5O00 1 6 6 7 OO0 0 OO0O 1 6 6 7 O 0 O 现设每个队Z 的等级分x ,这些等级分应由被Z 战胜的那些队的等级分确定,即 1 2 谤= 2 x j ,f - - 1 “2 一,1 2 , ( 3 ) = l 其中五为比例系数令X = ( x I ,一,X 1 2 ) 7 ,则由矩阵乘法,等式( 3 ) 可以写成 S x = 缸 即各个队的等级分的计算,转化求这个转移概率矩阵S 的最大正特征值旯所属的正特征向量直接利用 M a t l a b 软件计算得五= 1 ,相应等级分为( 0 2 7 3 1 ,0 2 0 8 5 ,0 7 1 4 4 ,0 0 3 0 2 ,O 0 0 2 6 ,O 0 0 3 , O 4 5 6 ,0 2 4 1 6 ,0 2 5 0 3 ,0 2 0 4 2 ,0 0 0 0 5 ,0 0 0 0 6 ) 由此可以确定只算获胜局的情况下各队的排名为 T 3 ,T 7 ,T l ,T ,T 8 ,T 2 ,T l 。,T 4 ,T 6 ,T 5 ,T l z ,T I t 3 2 加权等级分 在实际中,平局也会队双方的排名产生影响,因此也有必要考虑平局对等级分的贡献因为平局是相互的, 所以可以利用无向赋权图的权重矩阵来表达出各队之间的平局关系,即 P = OOO2OO 22 l lOO OO0OOO 0Oll00 0OO002 0OO0OO 0101 0 0 l0Ol0l OOOl0O l l lO O0 O00O02 0 l0 02 0 注意平局的权重矩阵尸是对称的同时注意到被战平球队的等级分也应该平均分配给各个与之战平的球队, 故将权重矩阵的各个列向量向量进行归一化处理,得转移概率矩阵 3 ; 铷 m m ,站弘O O O 0 O O ( m 仉 O O 0 O O O O O 0 O 0 O 0 O O 0 0 O O O O O O O 1 O 0 O O O O O 0 0 2 0 2 ,O O 0 0 0 l l O O l O O l O 0 O 0 O O O 0 l 0 0 2 1 O 2 2 1 l O O u v D D u D D , D D 万方数据 第3 期赵国等:G o o g l e 搜索引擎的数学模型及其应用 4 8 5 P = = oo 1 O 5oo oo o oo 2 8 5 700 0 2 5 000 40 3 3 3 300 50 40 3 3 3 3 0 1 4 2 9 00 O 2 5 000 20 0000000 00 2 0 5000000 3 3 3 30 1 4 2 9 0 0 OO 10000 0000 00 4 00 000 0 000000 OO 2O000 00 200 1 4 2 9 0 0 0O 2000 00 2 50 00 1 4 2 9 0 0 2 0O 100 200 0000 1 4 2 9 0 0 0 50 100 2000 2 50 20 3 3 3 30 0 0 0 00000 0000 00 4 0 0000 6 6 6 70 00 2 00l O 根据常识,在一场比赛中平局出现的概率为三同时,考虑到通常平局与获胜局的得分比为1 :3 ,我们可以 对平局和获胜局的转移概率矩阵进行加权处理,得到下面的加权权重矩阵 形= 二1 P + 二3 S = 33 00 5 3 3 30 50 50 40 6 6 6 700 2 5O 50 0 9 5 20 0 4 8 3 300 3 3 3 30 30 1 l1 10 6 6 6 70 1 6 6 70 1 3 3 3 0 3 6 l l0 0 4 7 6 0 0 4 8 3 3lO0 2 3 3 30 40 6 6 6 720 2 50 2 50 3 3 3 30 O0 0 6 6 7 0 1 6 6 70 0 000 2 50 1 1 l l0 0 4 7 60 O0 0 3 3 300 1 6 6 700 00 0 00 3 3 3 3 OOOO 1 6 6 70 4000000 O 80 0 6 6 70 3 3 3 30 3 3 3 3 0 000 5 6 6 70 7 50 7 1 4 30 3 3 3 3 0 40 0 6 6 70 3 3 3 30 1 6 6 7000 0 8 3 3 0 0 2 50 3 8 1 00 3 3 3 3 O0 0 3 3 30 3 3 3 30 2 3 3 30000 500 7 1 4 30 3 3 3 3 0 1 6 6 7 0 5 3 3 30 3 3 3 30 2 3 3 3 00 0 0 8 3 30 3 1 6 70 1 l1 lO0 3 3 3 3 O0O00 40 00 0 00 O0O00 6 2 2 2000 0 6 6 7000 6 6 6 7 0 O O O 0 1 3 3 3 O 0 6 6 6 7 0 0 6 6 7 0 6 6 6 7 0 6 6 6 7 0 1 3 3 3 0 同样,被战胜或战平球队的等级分也应该平均分配给各个获胜队或与之战平的球队,故将加权权重矩阵的各个 列向量向量进行归一化,得转移概率矩阵形= ( ) 为 = 0 o 2 0 7 l o 2 0 7 l 0 O 0 o 3 4 2 9 0 1 7 1 4 O 0 0 7 1 4 0 O o 2 2 8 6 0 2 1 4 3 O0 1 4 2 9 0 4 2 8 60 0 0 2 8 60 0 7 1 4 0 0 1 4 30 00 0 0 2 8 6 0 1 4 2 9 0 0 2 8 6 0 1 4 2 9 0 0 1 4 3 0 1 4 2 9 0 2 2 8 6 0 1 4 2 9 0O 00 0 2 1 4 3 0 1 7 1 40 3 3 3 30 0 1 0 7 l 0 1 2 8 6 0 0 4 7 6 0 3 3 3 3 0 0 7 1 40 0 5 7 l O 1O 1 7 1 4 0 3 3 3 30 8 5 7 l0 1 0 7 1 0 0000 1 0 7 l O 0 7 1 400 0 0 O 0 7 1 4 0 1 7 1 4000 0 1 4 2 9 0000 2 4 2 9 0 0 7 1 4000 0 3 5 70 0 10000 2 1 4 3 0 10 0 0 0 3 5 7 0 1 3 5 7 0O 1 7 1 4000 0 0 2 6 6 7 00 0 0 2 8 6 O 2 1 4 3 0 0 4 0 800 0 1 5 4 8 0 0 2 0 4 00 0 1 0 7 l0 1 4 2 900 0 0 4 7 6 0 0 2 0 400 0O 0 1 4 2 90 0 5 7 l OOOO O 3 2 1 40 3 0 6 10 1 4 2 90 2 8 5 7 0 1 0 7 l0 1 6 3 30 1 4 2 90 0 2 8 6 00 3 0 6 10 1 4 2 90 2 8 5 7 0 0 4 7 6 00 1 4 2 90 2 8 5 7 00 0 0 0 5 7 1 000 2 8 5 7 0 现设每个队z 的等级分为x ,这些等级分应由Z 所战胜或战平的那些队的等级分确定,即 = , L V 。,i = 1 , 2 ,1 2 , ( 4 ) 帚 佗一 万方数据 4 8 6 西南民族大学学报自然科学版 第3 6 卷 其中五为比例系数令x = ( x l ,一,X 1 2 ) 7 ,则由矩阵乘法,等式( 4 ) 可以写成 W x = A x 即各个队的等级分的计算,转化求平局的转移概率矩阵矩阵的最大正特征值名所属的非负特征向量直 接利用M a t l a b 软件计算得力= l ,相应等级分为 ( O 3l7 3 ,O 2 6 5 ,0 6 62 7 ,0 0 9 81 ,0 0118 , 0 0 0 9 ,0 4 4 3 5 ,0 2 4 7 3 ,0 24l9 , 0 2 5 21 ,0 0 0 2 6 ,0 01 lO ) 由此可以确定在综合考虑获胜局和平局的情况下各队的排名为 T 3 ,T 7 ,T l ,T :,T l 。,T 8 ,T 9 ,T 4 ,T 5 ,T l :,T 6 ,T l 。 3 3 等级分的随机冲浪模型 在大多数时候,竞技比赛的结果都是两队之间实力的客观反映但是,竞技比赛的结果有时具有一定的不 确定性,它很容易受到某些偶然或人为因素的影响为了消除这些不确定因素的影响,我们需要建立等级分的 随机冲浪模型 设球队的实力能确定比赛的结果的概率为d ,即强队因为不确定因素输掉给任意一支球队的概率为1 一d 则可得下面的转移概率矩阵 矿:d 木万+ 坐幸P P r 疗 其中,e 为分量全为1 的疗维列向量,从而e e 丁为全1 矩阵;d ( 0 ,1 ) 为权重因子,在实际中可以根据历史数据 确定同样,各个队的等级分的计算,转化求转移概率矩阵形最大正特征值所属的正特征向量 下面着重分析权重因子d ( O ,1 ) 的变化对排名的影响为此,我们利用M a t l a b 软件计算出权重因子d 取不 同的值时的排智隋况如表1 表1 权重因子d 取不同的值时的排名情况 d 取值范围球队排名 d = l 0 9 d 0 9 5 0 4 5 d 0 8 5 d = 0 4 T 3 ,T 7 ,T I ,T :,T 1 。,T 8 ,T 9 ,T 4 ,T 5 ,T l :,T 6 ,T l 。 T 3 ,T 7 ,T l ,T :,T l 。,T 8 ,T 9 ,T 4 ,T l :,T 5 ,T 6 ,T l , T 3 ,T 7 ,T I ,T :,T l 。,T 9 ,T 8 ,T 4 ,T l :,T 5 ,T 6 ,T l 。 T 3 ,T 7 ,T l ,T :,T 8 ,T 9 ,T l 。,T 4 ,T 1 :,T 5 ,T l 。,T 6 从表中可以看出,根据等级分的排名结果具有良好的稳定性;并且,权重因子的变化只对没有比赛场数较多 的球队的有较大影响例如,当0 4 5 d 0 8 5 时,排名均为T 3 ,T 7 ,T l ,T 2 ,T l 。,T 9 ,T 8 ,T 4 ,T l :,L ,T 6 ,T i 。因此, 等级分随机冲浪模型可以成功地处理数据缺损方面的困难 参考文献: 【1 】S E R G E YB R I N ,L A W R E N C EP A G E T h ea n a t o m yo f al a r g e s c a l eh y p e r t e x t u a lw e bs e a r c he n g i n e 【C 】I n :P r o eo f7 t l lW o r l dW i d e W e bC o n f D B O L I ( 1 9 9 8 5 0 1 ) 2 0L O - 0 3 i 0 1 h t t p :w w w 7 S C U e d u ,a u 0 0 i n d e x h t m 【2 】M A R K U SS O B E K AS u r v e yo f G o o g l e SP a g e R a n k 【D B O L I ( 2 0 0 6 5 0 1 ) 1 2 0 1 0 0 3 i 0 1 h t t p :p r e f a c t o r y d e 【3 】姜启源,谢金星,叶俊数学模型【M 】3 版北京:高等教育出版社,2 0 0 3 【4 】李大潜中国大学生数学建模竞赛【M 】2 版北京:高等教育出版社,2 0 0 1 【5 】5 蔡大用关于足球队排名次问题的几点评注【J 】数学的实践与认识,1 9 9 4 ,2 :9 5 9 6 T h em a t h e m a t i c a lm o d e lo fG o o g l es e a r c he n g i n ea n di t sa p p l i c a t i o n Z H A OG u o ,S O N GJ i a n - c h e n g ( S c h o o lo fC o m p u t e rS c i e n c ea n dT e c h n o l o g y , S o u t h w e s tU n i v e r s i t yf o rN a t i o n a l i t i e s ,C h e n g d u6 10 0 41 ,P R C ) A b s t r a c t :T h i sp a p e r , b a s e do nt h ea n a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论