版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
当今社会,网球这项体育运动越来越受欢迎。频繁的赛季转换、高密度的比赛安排和以赛代练是网球的显著特点[1],当描述比赛的整体走势出现了不可事件之后获得的一种能够提升比赛状态和气势的动力,它在网球比赛的走势中起到了相当重要的作用。[2]在2023年温布尔登网球公开赛男子单打决赛中,尽管阿尔卡拉斯在第一盘中落后了5分,他在第二、三、五盘中分别以7-6,6-1,6-4比分获胜,最终逆转局势,打败了德约科维奇。于是,一个自然的想法是,在这场比赛中“势头”在阿尔卡拉斯第一盘大幅度落后及后面乘胜追击时发挥作用,扭转了比员在比赛过程中拥有动力的主观感受,很难进行准确的刻画,无法衡量球员在用下比赛局势发生逆转的具体时刻,同时找出对“势头”影响较大的因素。本文利用2023年温布尔登网球公开赛男子单打比赛的数据进行研究,并考虑了如1.两个球员综合实力的差距可以用他们在ATP上的实时排名的差距来衡2.环境等客观因素如天气、场地等不影响球员的表现水平。这是因为比赛会因不理想的天气延后,并且承办比赛的场地均满足一定的标准。3.比赛轮次不影响球员的状态。即每个球员的比赛状态在不同场、盘及局4.每一分的比赛结果只影响球员下一分比赛中的表现水平,且每一分在比赛进程中的位置不影响球员的状态。由于比赛的盘数和比分在一定程度上能够体现比赛的进程,于是本文假定在局点和盘点时的关键分与非关键分对球员的影响是一样的。5.每一得分的性质相同。由于双发失误、ACE球、破发点等具有特殊性质的分已经在比赛结果比分中有所反映,故此处不加以考虑。二、数据集介绍及预处理2023年温布尔登网球公开赛男子单打比赛决赛的数据包含了31场比赛中每一分的信息。每一行数据含有比赛编号、盘数、局数、分、球员双方的名称等基本信息。本文将此数据集中的每行分别以两个球员作为主体,拆分为两行,将数据集整理成共含有了14568行的新数据集。则新数据集的各行拥有唯一主体,称为球员,同一分中的另一方被称为对手。数据集中与比赛表现相关的变量符号及含义如表1、表2、表3所示。此外,本文还定义了两个组合变量:Server_count×Server,Server×Speed_no,分别记为Server_no,Speed。根据假设5,P1_ace,P1_break等变量含有的特殊信息已蕴含在比分中,故不需要添加额外变量。本文利用随机森林填补了speed_no中含有的752个缺失值。经过检验,未发现不符合常识的离群值,故不进行其他处理。考虑到“势头”是一种比赛状态,本文利用与比赛表根据假设3与4,每一分所处位置不影响球员状态,故本文能够把每一分的信息作为被评价对象,并利用TOPSIS熵权法给出一个比赛状态评分。评分越高说明球员在这一分的“势头”越大,表现得越好,赢1.熵权法为指标赋权指标权重的确定是TOPSIS的重要环节,而采用熵权法可有效消除主观判断的影响。它利用熵值判断指标的离散程度,并把熵值更大的指标赋予更高的权重。接下来采用此方法计算权重。共有14568个被评价的分,24个评价指标。首先构建判断矩阵:X=(xij)14568*24(i=1,2,.….,14568;j=1,2,….,24)。对判断矩阵进行标准化处理,得到其中xjmax指第j个指标的最大值。接下来计算信息熵其中pij=xij'>14568i=1xij',k=1In14568。进一步得到第j个指标的权重其中wj∈[0,1],且∑24j=1wj=1。指标权重计算结果如表4所示。接下来使用TOPSIS对球员的比赛状态进行评价。首先确定各指标的最优理想解A+和最劣理想解A-。由于所有指标均已转化为极大型数据,所以各指A+j=max(r1j,r1j,...,r14568j),A-j=min(r¹j,r1j,….,r1然后计算每个球到A+与A-的距离进一步能够计算出球员在第i分时刻的比赛状态评分其中,Ci值越大表征第i分时刻球员的表现水平越优。决赛前14分阿尔卡拉斯的比赛状态评分及其排序如表5所示。每一分的比赛状态评分量化了每个球员在特定时态评分折线图与散点图如图1。为便于观察球员表现水平的整体走势,右图中态评分呈现上升趋势,说明表现状态在不断提升,(二)预测比赛结果的Logistic回归模型反映每一分的输赢情况。于是,将球员与对手在第i分时的比赛状态评分相令outcome=1,当此分中选手获胜时0,当此分中对手获胜时。根据outcome的取值分类0和1,可以将样本点分loss和win两类。绘制箱线图与小提琴图如图2。由图可看出,在win类别中,大部分△Ci取值为正,说明当球员在此分中获胜时,其比赛状态评分高于对手的评将outcome看作因变量,把△C当作自变量,建立Logistic模型其中β0与β1的估计值如表6所示。其中所有系数均是显著的。2.10折交叉验证为评估模型的预测效果,现进行10折交叉验证。首先将样本集随机地划分为样本量相同的10部分[3],把前9部分当作训练集,用于建立模型及拟合参数;最后1部分当作测试集,以此来估计平均预测准确率。其次,绘制ROC曲线如图3所示,由图可得到用于判断预测类别的最优的outcome被判为1;否则,outcome被判为0。将预测得到的outcome与测试集中outcome的真实值进行比较,计算得到预测准确率为0.8333。此外,计算得到AUC为0.929,非常接近1,说明此模型有很强的二元分最后将上述操作重复200次,计算得到平均预测准确率为87.9%,说明模(一)基于核回归方法的转折点识别在比赛中发挥作用。具体来说,希望找到在“势头”不断作用下,比赛走势从有从直观上来看,当一方选手的表现得更好时,比赛走势更有利于这一方。故首先考虑用球员比赛状态评分的差值当作自变量。但由图1右图可以看出,C变化特别大且迅速,故直接使用△C作为自变量难以识别出△C正负号的变化规律。因此接下来对C进行核回归,使得△C的变化更加平滑,便于识别转折点的发生。本文把C当作因变量,把分当作自变量,进行核回归拟合,记拟合后的比赛状态评分为RC,并绘制同一场比赛双方的核回归曲线如图4所示。两条曲线的交点就是转折点发生的时刻,距离转折点最近的分就是“势头”扭转比赛局势的那一分。为简化表达,本文把上述距离转折时刻最近的分简称为转折点。为了找到对“势头”影响较大的指标,并计算采用BPNN。此算法具有大规模并行结构、分布式存储等特点[5],有很强的分为充分利用在转折点出现之前的△RC随比赛进程不断减小的信息,本文把转折点与其前两个点一起看作“转折时刻”。定义出用于判断点是否位于转折时刻的指标reversion=1,此点位于转折时刻且△RC由负转正0,此点不位于转折时刻-1,此点位于转折时为了探究哪些因素影响转折时刻,现把reversion当做因变量,使用reversion=1或-1的点对应的数据,把各项指标当做自变量,使用BPNN对reversion的分类进行预测。计算得到预测准确率为75.9%。在进行BPNN时,训练集的样本点被分为几个批次,每个批次依次进行训练。而权重更新就是在两个训练批次切换之间进行的。[6]这些权重可以被理解为每个指标解释了多少因变量的变化,即每个指标对转折时刻的影响有多大。于是,指标的权重就是其重要性的一种量化。经过正态化的自变量重要性如表7所示。此外,为便于直观地观察自变量重要性的排序,绘制柱状图如图5。从图5可以看出,重要性最高的自变量是P1_continue_score,即球员连续得分与失分次数,占比达到17%。研究表明每局比赛中“连续得两分”和“连续论。当选手在比赛中连续得分时次数越多时,他获胜的概率越大。这是因为连续得分能够使球员更加有斗志,即增加了“势头”,从而他获胜的可能性也越高。因此,在运动员日常比赛中,应更加关注此因素,在球员连续得分时把握“势头”,一鼓作气;在连续失分时及时调整状态,恢复动力。重要性占比第二的变量是球员在破发点的情况,占比为11%。相关文献说明高水平球员在破发点关键分上的获胜率高于其他分数,即高水平球员在比赛的重要时刻能够表现出更好的状态,且这种能力具有相对的稳定性[8]。于是,在关键时刻以良好的状态面对压力,把握住每个破发点,能够为球员增加“势头”,提升获胜概率。对手打出ACE球的次数是重要性排名第三的变量,占比9%。当对手打出ACE球的次数增加时,球员的“势头”也会发生较大改变,从而影响了比赛结果。这为球员的训练提供了两点建议:第一,提高接发球的能力,降低比赛中对手打出ACE球的频率,能够减少“势头”的衰减;第二,锻炼球员在对手打出从而扭转比赛的不利走势。五、结论1],且C越高说明此分中球员的表现越好。2.在网球选手及赛况的研究中,过去的理论将比赛中的球员每一分的表现看作是相互独立的,但现在越来越多研究表明,过去比赛的分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现场应急处置方案编制实施指南
- 睡眠质量监测评估指南
- 产后骨盆修复护理标准
- 面诊望闻问切四诊合参操作流程
- 高浓度复合肥采购验收与使用标准
- 辣椒连作障碍综合防治方案
- 季节养生膳食制作手册
- 飞机播种作业技术标准质量验收规范
- 冷鲜肉冷链存储技术标准
- 护士资格证外科护理试题及解析
- 煤矿安全培训课件郑玉龙
- 2025年上海入团考试试题及答案
- 泉室施工方案
- 报联商培训课件
- 学堂在线 中国传统艺术-篆刻、书法、水墨画体验与欣赏 章节测试答案
- 民航安保业务知识培训课件
- DB37-2374-2018 锅炉大气污染物排放标准
- 广师大环境学概论课件第4章 自然资源的利用与保护
- 玉米施肥技术课件
- 护理礼仪与人际沟通说课
- 酒店业务外包服务方案投标文件(技术方案)
评论
0/150
提交评论