已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析与处理,主讲:数理与信息工程学院何国龙2011年8月8日,数学建模基础选讲,数据导入与导出,从外部文本文件导入数据到MatLab的工作区;1)File/Importdata2)利用内置函数,MatLab程序区数据,外部数据文本,外部Excel文件,数据交换示意图,2.将MatLab的工作区数据写出到外部磁盘文件;1)save(e.g.save123.txttest-asciisave123test-123.mat)useloadtoretrieve2)dlmwriterefpdfhelpfile3)fprintfrefout_data.m3.从Excel文件导入数据到MatLab工作区1)importdata,工作区变量data,textdata2)用xlsread调入数据,4.从MatLab写出数据到Excel文件xlswrite函数e.g.s,t=xlswrite(filename,var)从MatLab操作Excel文件Excel=actxserver(Excel.Application);Excel.Visible=1;将Excel作为ACtiveX服务器打开,与MatLab交互,refVBAe.g.test_Excel.m,数据预处理,1.数据的平滑处理smooth函数的使用smooth_1.mref:smooth.pdf对于多元数据,当各变量的量纲和数量级不一致时,往往需要对数据进行预处理,以消除量纲和数量级的限制,便于分析.2.数据的标准化变换3.数据的极差归一化变换,数据的标准化变换,极差归一化变换,经过极差变换,每个元素位于0,1,列的最大最小元分别变换为1与0,数据拟合,0.观察数据的散点图,辅助判别数据拟合应采纳的模型plot_1.m数据文件:cliamate_data.xlsplot_2.m数据文件:data2009.xls一元线性回归分析函数regressregress函数可用于多重线性或广义线性回归分析,特别地也适合作一元线性回归分析,Ref:editregress.m,p-重广义线性回归模型,Y的n次独立观察数据,模型设计矩阵X,需要拟合估计的系数向量,误差向量,p-重线性回归模型,最简单的情形:一元线性,多重回归分析,假设的关联数据dchg.xls,一次项多重回归,一次项交叉项二次项多重回归,研究样本或指标之间存在程度不同的相似性(亲疏关系以样本间距离衡量)。根据一批样本的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样本(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样本(或指标)又聚合为另一类,直到把所有的样本(或指标)聚合完毕,这就是分类的基本思想。在聚类分析中,根据分类对象的不同分为Q型聚类分析和R型聚类分析两大类。,聚类分析,常用的样品对距离,Ref:pdist,常用聚类方法,最短距离法(singlelinkagemethod)最长距离法(completelinkagemethod)中间距离法(medianmethod)重心法(centroidhierarchicalmethod)类平均法(averagelinkagemethod)离差平方和法(Wardmethod),与系统聚类法相关的MatLab函数包括:pdist;squareform;linkage;dendrogram;cophenet;inconsistent;cluster;clusterdata,G6=g1,g2,G7=g3,g4,G8=g5,g7,G9=g5,g8,聚类分析示意图,主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的多元统计方法,这些主成分能够反映原始变量的大部分信息,通常表现为原始变量的线性组合,为使得主成分所包含的信息互不重叠,要求各主成分之间线性无关.MatLab的主成分分析函数pcacov;根据相关系数矩阵进行主成分分析princomp;根据样本观察值矩阵进行主成分分析pcares;根据主成分重建原始数据,主成分分析,Ref:zcffx.m,pcares函数重建数据,为了分析丢掉后面的主成分所造成的信息损失,设原始样本数据矩阵为,由前m个主成分重建的样本数据矩阵为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年急性鼻炎的考试题及答案
- 地下人防设施的环境控制方案
- 2026-2031年中国三穗草属行业市场发展趋势与前景展望战略研究报告
- 2026-2031年中国数据复制软件行业市场现状供需分析及投资评估规划分析研究报告
- 预算管理与资金分配方案
- 2025浙江南太湖控股集团有限公司下属子公司招聘10人笔试历年常考点试题专练附带答案详解试卷2套
- 2025浙江丽水青田县农业旅游发展投资有限公司招聘丙类人员拟聘用人员(二)笔试历年典型考点题库附带答案详解试卷2套
- 亚克力板生产加工项目技术方案
- 2025江铃汽车股份有限公司招聘战略研究员1人(物流规划物流运营管理等)笔试历年常考点试题专练附带答案详解试卷2套
- 2025江西吉湖矿业发展有限公司招聘采矿专业技术员安排及通过笔试历年常考点试题专练附带答案详解试卷2套
- 平台与内容广告-品牌营销手册
- 博士组合物80问
- 《文化和旅游领域重大事故隐患判定标准》知识培训
- 粮食仓库建设标准
- 《市场调查与分析说》课件
- 啤酒厂筹建项目可行性研究报告
- 物业咨询知识培训课件
- 展会活动中如何提高观众的参与度与满意度研究报告
- 智能化与低碳化的关系
- K12教培咨询师培训
- 【MOOC】《运筹学》(北京科技大学)中国大学MOOC慕课答案
评论
0/150
提交评论