




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 大数据挖掘技术及数学学科的应用 嵇俊杰 雷霓摘要:当今社会,人们无论在生活中,还是在学习中,都在不断地处理信息。如何从海量的数据信息中有效地提取出高质量的数据,一直是众多专家学者关心的问题。大数据挖掘不可能没有先进的数学知识和方法,在大数据挖掘与处理分析中有效地利用数学知识,可以有效地提高数据处理与分析的效率,帮助人们在最短的时间内获取有价值的数据信息。关键词:大数据挖掘技术;数学;学科;应用引言:大数据是网络信息技术发展的一项重要科技成果。针对不同区域的海量数据,通过统计,进行数据整合,形成数据分析。本文首先从大数据挖掘中的数学知识及其处
2、理入手,阐述了数学在大数据挖掘中的应用。大规模的数据挖掘技术能够有效地促进人们的研究与开发。数学知识与方法的应用是大数据挖掘的关键。数理统计是大量资料分析处理的基础,是从大量资料中提取有用资料的关键。为此,研究者应将数学专业知识纳入大数据的挖掘和处理之中,不断提高数据处理和分析的水平。1大数据挖掘技术分析伴随着计算机网络技术的普及与应用,产生于社会生活各个领域的海量数据越来越多。大量的数据在不同的领域有着不同的价值,需要人们去研究和利用,为社会企业做出科学的决策。"欧洲大数据"是指传统软件工具收集的数据,这些数据不能进行计算、处理、管理和使用。大数据要求高级处理,以提高决策
3、、洞察和发现能力,以及流程优化。与传统数据仓库应用分析相比,大数据应用分析的最大特点是:数据量大、变化多、查询困难复杂。当前,在通信、制造、营销、网络信息等领域都有大量数据挖掘的工作。怎样利用数据挖掘来帮助人们解决实际问题已经成为人们关注的焦点。2数据挖掘的概念和特征2.1大数据概念21世纪以来,由于传统的数据分析和分类工具不能对数据进行及时、全面、全面的分析和分类,信息资源的快速发展促进了信息技术的进步和大数据时代的到来。研究结果表明:大数据领域包括天文学、生物学、计算机、电子技术、自动化、信息管理等;它能根据用户浏览的内容和查找的信息,为用户提供准确、满意的服务,节省大量的人力、財力、物力
4、。在互联网压力下,传统企业可以通过分析和整理大量数据,确保产品与时俱进。2.2数据挖掘概念数据采掘是大数据的核心领域,是时代发展的必然产物,也是独立发展的主题。研究发现,数据采掘与商业计划紧密相关。目前,数据挖掘技术已经在教育、科研、机械自动化、市场营销、互联网等诸多领域得到了广泛的应用,能够实现复杂的、大规模的数据采集和排序,推动了数据挖掘技术的发展和创新。获得巨大的经济效益,带动了很多行业的快速发展。2.3数据挖掘的特征及方法数据挖掘就是根据大量数据之间特定的关系,自动发现隐藏的信息。有价值的信息可以通过统计、联机分析、智能探索、机器学习和专家系统等方法来收集和分类。在人工智能知识发现过程
5、中,数据获取是一个重要环节,知识获取包括准备、挖掘、执行和解释。在数据分析方面,计算机技术寻求大量数据规律,并将相关数据整合为新的数据源;包括关联分析、聚类、异常分析、特殊群体分析和进化分析。资料的获取和编辑不够全面。未来世界的发展属于大数据时代,数据挖掘将在未来社会发挥重要作用。深入研究信息采集方法、规范数据挖掘技术在经济领域中的应用、引入新的技术体系以适应社会发展是数据挖掘的主要趋势。3数学学科在大数据挖掘中的应用3.1数学在数据处理分析中的应用对于资料处理与分析,数学家可采用多种分析方法。把回归分析和相关分析有机的结合起来。基于关联分析,通过对两个或多个相关变量间的定量相互作用进行有效观
6、测。同时,研究人员还必须了解运用大量的数学理论来处理和分析数据,如数学测量学知识,即通过两种或多种单调测度的操作,来产生新的单调测度。研究者可以合理使用数据而减少数据维度。与传统的因素分析方法相比,定量的理论分析方法既能保证数据处理和分析的完整性,又能提高数据的科学准确性。3.2目标函数模糊聚类法目标函数模糊聚类方法在大数据挖掘中的数据分析和图像处理中得到了广泛的应用,而配置函数模糊聚类是大数据挖掘中的主流方法。利用模糊关系,客观事物的联系与相似,综合各因素,建立数据库,进行分析与研究。利用模糊聚类算法对所需数据进行聚类分析,再利用模糊聚类算法进行聚类分析,最后利用模糊聚类算法进行聚类分析,并
7、结合网络编译法和极大值法对聚类结果进行排序。3.3区间算法区间算法是一种用数学方法分析、整理数据间关系,并利用中值锁定数据获得重要信息的聚类方法。大规模数据挖掘过程中,不完整的系统信息可以被整合、分解,大型数据挖掘技术人员通过区间算法将挖掘得到的数据转化为可比较的数据,并应用科学的方法对数据进行分类和分析。经过实证研究,研究者们提出的区间聚类算法主要有三种:矩阵和区间聚类、数和区间聚类。其中应用最多的是数值方法和区间聚类法,它可以帮助工作人员根据科学的算法快速、高效、准确地提取不完整的系统信息。运用最新的统计手段和方法,以一定的时间间隔进行科学检验。每一个环节都能进行一系列的分析整合工作,通过
8、实际积累对评价信息进行分析。3.4灰色关联分析法本文以系统中各因素发展趋势的相似性和差异性为基础,以灰色关联分析为数学方法,对系统中各因素之间的相关性进行了度量。这种方法适用于动态开发过程中的数据分析。其具体形式为s=(x,r),其中x表示影响因子集合,而r点表示各因子之间的趋势相关性集合。灰度数字化是数据挖掘中常用的方法之一。通过对不同几何曲线几何形态的科学分析和比较,实现了数据分析和处理。在两个几何图形之间的几何曲线越靠近,表明数据链越大;相反,两个图形越窄表明数据链越小。在数据挖掘过程中运用数字灰色关联分析方法,可对数据不完整或数据量较少的样本数据进行分析和处理,以提取有价值的数据。结语数据处理技术是随着信息时代的到来而不断发展的。信息资源是任何生产和生活所必需的,随着国家对数据挖掘的重视,数据挖掘已成为数据挖掘技术的一大创新,越来越多的人开始有效地利用生产和生活中的数学知识,以支持大数据挖掘技术的发展,提高数据的处理和分析能力,更好地推动人们对大数据挖掘技术的深入研究。参考文献1卢秋羽,蒋薇,解文琦,等.大数据挖掘技术支持下抽油机井系统效率影响因素分析j.数学的实践与认识,2020,50(19):246-252.2李思辰,张公社,纪国法.基于大数据挖掘技术的页岩气井压裂液产出规律分析j.科学技术与工程,2019,19(25):130
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 银行岗位试题预测试卷附答案详解【能力提升】
- 醉酒驾驶与毒驾相关法律法规试题及答案
- 2025年有色金属行业资源循环利用产业链产业链绿色生产与清洁生产研究报告
- 考点解析北师大版9年级数学上册期中试题含答案详解AB卷
- 2025至2030年中国银杏茶叶市场调查研究及行业投资潜力预测报告
- 押题宝典执业药师资格证之《西药学专业二》试题及参考答案详解【a卷】
- 护士企业编制面试题库附完整答案详解【必刷】
- 2025年智能路灯控制系统开发合同
- 2025年度特种设备安全检测第三方服务合同
- 2025版自驾租赁公司司机入职合同范本
- 相控阵超声波检测技术培训
- 2025-2030中国催化裂化催化剂行业前景展望及需求趋势预测报告
- 职业培训学校管理制度
- 中信集团管理制度
- 卫生间6s管理制度
- 左上颌骨囊肿护理查房
- 2025年重庆市中考数学试卷真题及答案详解(精校打印版)
- 抗凝药物试题库及答案
- 民航气象专业面试题及答案
- 浙江仙琚制药股份有限公司年产2.5亿粒性激素软胶囊生产线技术改造项目环评报告
- T/CADBM 33-2021水性丙烯酸防腐涂料
评论
0/150
提交评论