版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
如何写一份好的数据分析报告分类(Classify)聚类(Cluster)常用分析算法AB预测(Predication)D相关(Correlation)CK-means、K-medoids回归、slopeone……贝叶斯、K-NN……Pearson、欧式……在互联网的数据挖掘中,爬虫类算法〔深度优先、广度优先、最正确优先〕也经常被用于数据采集工作什么是分类?鸟类占50%以上所以把这个群体定义为鸟什么是聚类?物以类聚什么是相关?喙相关性强喙相关性强喙相关性弱经典算法描述——贝叶斯待分类内容拆分关键字分类字库分类完成自我学习①②③④⑤经典算法描述——K-means随机选K个点作为临时中心点①把每一个点配给最近的中心,并计算新的中心②N次循环第2步完成最终聚类③经典算法描述——slopeone?筛选数据源①衡定内容间关系②?≈预测结果③分析常用图形散点图善于发现因果关系用于探索性数据分析目的是探索自变量和因变量之间的关系直方图不仅能够度量被计量事物的数目、频数,还能表达各个区间所代表的整个数据集的百分比雷达图善于描述某实物各个属性的强弱分布除此以外,一些组合图也常用于分析描述,如柱-线图,柱-饼图……
年份
XXX普及率1月2月3月4月5月6月7月8月9月10月11月12月2008年74.01%78.45%72.66%72.11%75.64%74.25%73.64%74.42%74.97%73.11%72.51%74.00%2009年79.04%74.91%72.06%71.71%73.34%71.58%73.11%72.50%70.80%71.80%69.27%69.99%2010年71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%2011年69.99%74.08%69.26%
?
案例分析下表为X省XXX普及率,08-10年,及11年1-3月数据。从往年数据明显看出,普及率逐年、逐月都在呈下降趋势,为使11年4月普及率能保持环比/同比不下降,预计需要开展多少0活动用户?确定分解评估决策普及率开展趋势?普及率=?普及率到达效果?活动客户数/总客户数逐年逐月下降环比持平〔69.26%〕自问自答确定分解评估决策
年份
XXX普及率平均1月2月3月4月5月6月7月8月9月10月11月12月2008年74.01%78.45%72.66%72.11%75.64%74.25%73.64%74.42%74.97%73.11%72.51%74.00%74.15%2009年79.04%74.91%72.06%71.71%73.34%71.58%73.11%72.50%70.80%71.80%69.27%69.99%72.51%2010年71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%70.84%2011年69.99%74.08%69.26%
?
平均73.52%75.69%71.23%71.13%73.16%72.26%72.85%73.05%72.30%71.55%69.99%70.88%普及率在2月有大幅提升,处全年最高年均下降1.65%确定分解评估决策图表为月平均普及率散点图,趋势线为一次线性回归拟合线,并通过回归统计分析,计算拟合系数及调整拟合系数均远低于标准置信度0.95。因此普及率呈非线性趋势。因此试选用slope
one算法,处理个性化的预测分析。回归统计MultipleR0.566194RSquare0.320576AdjustedRSquare-1.22222标准误差0.013286观测值11月2月3月4月5月6月7月8月9月10月11月12月2010真实71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%2010预测73.22%74.50%70.16%69.46%71.59%70.56%71.14%71.31%70.59%69.91%68.34%69.27%经评预测平局,10年全年预测误差0.0092,去掉1、2月波动后误差0.0065〔即0.65%〕经过SLOPEONE预测,11年4月普及率=67.97%±0.65%确定分解评估决策经过以上分析及预测,XX省
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水电站内部控制制度
- 江铜集团内部管理制度
- 研会部门内部考核制度
- 钢琴培训班内部制度
- 银行严肃内部问责制度
- 2025年恒丰银行青岛分行社会招聘10人备考题库及答案详解(易错题)
- 2025年贵州省黔西南州崇文高级中学招聘数学、英语、化学等紧缺专业教师8人备考题库及答案详解参考
- 2025年玉林市玉州区城西街道社区卫生服务中心招聘编外人员备考题库含答案详解
- 2025年榆林市第五幼儿园招聘备考题库有答案详解
- 2025年轻工所公开招聘备考题库及答案详解一套
- 2022低压有源电力滤波装置
- 数控刀具行业现状分析
- 北航机械方案说明书齿轮减速器
- 机动车维修竣工出厂合格证
- 2023年计算机科学导论题库期末考试汇总
- GB/T 18998.3-2003工业用氯化聚氯乙烯(PVC-C)管道系统第3部分:管件
- GB/T 17711-1999钇钡铜氧(123相)超导薄膜临界温度Tc的直流电阻试验方法
- 2023年一级建造师机电实务真题及答案解析
- 北京建筑大学2016年高职升本科专业课考试试卷《城市轨道交通车辆构造》试卷
- 事业单位人事管理条例完整版x课件
- 中国地理概况-课件
评论
0/150
提交评论