



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 一种基于聚类和相关性分析的nba球员评价方法 朱龙翔【摘要】本文提出了一种基于聚类和模糊决策的综合评价方法,利用k均值算法对评价样本进行初步分类,并对初步分类结果选取有价值的分类使用模糊决策进行进一步分析从而对该类样本进行评价.【关键词】k均值;灰度预测;相关性分析;综合评价聚类分析技术是数据挖掘技术的重要内容之一,聚类分析可以将样本集合中相似度高的个体聚合为一类,在样本处理阶段可以将样本预先分类以降低需要分析的样本集合容量.关联度分析方法可以根据因素之间发展态势的相似或相异程度来衡量因素间关联的程度.本文给出了一种基于聚类和关联度分析的综
2、合评价方法,解决无后验知识情况下对无差别数据样本进行分组评价的问题.最后以nba球员为例给出仿真结果和分析.一、综合评价方法设计针对nba球员的评价方法主要依据出场率,投篮命中率,得分等技术要素进行评估,但由于在对nba球员进行综合分析时评价方式受到球员所处位置等因素限制,且各项要素间关联复杂无法定量描述使得综合评价模型难以建立.聚类分析作为无指导学习的典型代表,能够按照特定标准对数据集进行合理划分,确定每个对象所属类别,从而将球员整体集合这个复杂数据集合分为由相似个体组成的多个个体集合,简化了问题复杂性.(一)k均值聚类分析设待分析的球员数据样本集x为n×m的矩阵,n为样本个数,m
3、为特征数量,分类数为k,分类特征集q=q1,q2,qk,样本间距离d为任意两个体样本间的欧氏距离,类归属矩阵w规模为n×k.k均值聚类解决问题为找到一个类归属矩阵w最小化类平方误差总和p(w,q)=kl=1ni=1wi,ld(xi,ql).同时需满足kl=1wi,l=1,1in,wi,l0,1,1in,1lk.其中,对每个wi,t需计算wi,t=1 if d(xi,ql)d(xi,qt),for 1tk,wi,t=0 for tl.解决以上问题可以以下方法遞归解决.1.选取初始的类特征向量集合q0然后针对q0计算得到w0.记步数t=0.2.w=wt依照以下方法计算qt+1.ql,j=
4、ni=1wi,lxi,jni=1wi,l.如果此时p(wt,q)=p(w,qt+1),则w,qt为类归属矩阵和类特征向量集,否则进行第3步.3.q=qt+1,然后针对q计算wt+1.如果p(wt,q)=p(wt+1,q)或步数t超过给定迭代次数t,则wt,q为类归属矩阵和类特征向量集;否则步数t=t+1然后继续第2步.通过聚类分析,样本集被划分为k类特征集合为q的数据子集,可通过q来观测不同类别赝本集合的特征,选取需要的样本子集进行进一步分析.同样可作为同类优选的第一步.(二)基于相关度分析在进行模糊决策前需要对样本中该分类的各要素进行相关性分析以确定每个要素的权重因子.1.相关性分析由主观给
5、定的权重因子通常在通用性和可靠性上存在问题,因此,本文通过对样本特征进行相关性分析来确定各特征的权重因子.针对不同类别(位置)的nba球员,可以选取历年公认该类别(位置)的最佳球员数据作为参考序列.(a0(1),a0(2),a0(n),则相应选取的m个特征序列为(am(1),am(2),am(n),m1.则ai与参考序列a0在k球员身上体现的关联系数i(k)计算方式如下:i(k)=minr mins|x0(s)-xr(s)|+maxr maxr|x0(s)-xr(s)|x0(s)-xr(s)|+maxr maxs|x0(s)-xr(s)|,ri=nk=1i(k)n.称ri为序列ai对a0的关联
6、度.其中分辨系数0,1,本文取=0.5.2.基于关联度的评价方法根据1给出的针对各特征与评价结果的关联度ri,可做如下变换得到该类球员的评价得分:g=mi=1(xi×ri).二、应用与评估(一)数据说明本文数据采用新浪nba数据库20162017赛季数据.为避免数值差异性造成不同特征对距离影响不同,对目标数据做如下归一化变换:a(1)0,f(a(k)=a(k)a(1)=b(k).(二)聚类分析综合得分,篮板等数据,可以推断第2类和第9类数据为优秀球员类.以出场率和得分能力为主要考虑对象,选取第9类为例进行进一步分析.(三)基于相关度评价1.相关性分析选取1116年五个赛季的mvp球员
7、数据作为参考序列,数据如下:由于失误和犯规对评价起负面影响,因此,关联度系数变更为负因子进行计算,最后计算评价得分如下:由上表结果可见,1617赛季mvp热门人选拉塞尔-威斯布鲁克,詹姆斯-哈登,勒布朗-詹姆斯,斯蒂芬-库里均在评价结果前十,算法结果命中率高.三、结果与评估本文提出的基于聚类与相关性分析的nba球员评价方法可以较好地根据往年数据对新赛季球员数据进行量化评价,经过检验预测结果对实际候选人命中率高,可以作为一种客观评价模型使用.【参考文献】1王悦,冷泳林,鲁富宇,鄂旭.k均值聚类在高校教师评价分析中的应用研究j.计算机技术与发展,2014(5):204-206+210.2金玲玲,汪文俊,王喜凤.大学生综合素质
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- BLX-3887-生命科学试剂-MCE
- 宁夏葡萄酒与防沙治沙职业技术学院《中国文学导读》2023-2024学年第一学期期末试卷
- 沧州师范学院《综艺节目编导》2023-2024学年第一学期期末试卷
- 内蒙古师范大第二附中2024年化学九年级第一学期期末达标测试试题含解析
- 武昌首义学院《中外经典戏剧作品选讲》2023-2024学年第一学期期末试卷
- 2024年河北省石家庄市桥西区九年级化学第一学期期末质量检测模拟试题含解析
- 共享出行信用保险与信用体系构建研究报告
- 2025全球劳动力趋势报告第1期
- 2024年山东省青岛市广雅中学七年级数学第一学期期末达标检测模拟试题含解析
- 遵义医科大学《透过影像看健康》2023-2024学年第一学期期末试卷
- 码头承包经营合同
- DB37T2367-2022《回弹法检测砌筑砂浆抗压强度技术规程》
- 对生活饮用水的卫生监督
- 2022江苏省中央财政补贴型奶牛养殖保险条款
- 乐山市口腔医院门诊牙科诊所医疗机构企业地址名单目录
- WTO世界贸易组织概论期末复习题
- 外贸业务员KPI考核量表
- 智慧物业管理系统解决方案
- 幼儿园教育活动设计与指导幼儿园教育活动设计的基本模式
- 数字声音广播7-drm技术系统与二
- 嵌顿疝病人应急预案
评论
0/150
提交评论