判别和聚类分析模拟成分模糊均值谢组_第1页
判别和聚类分析模拟成分模糊均值谢组_第2页
判别和聚类分析模拟成分模糊均值谢组_第3页
判别和聚类分析模拟成分模糊均值谢组_第4页
判别和聚类分析模拟成分模糊均值谢组_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘析法、模糊C均值聚类法和建立了特征峰提取模型、肠溶片包衣厚度聚类模型和最优包衣厚度终点判别模型,运行编程得到合理结论,最终对模型的结果做出了效210100Xtrain550个样本Xtest10组得到平均训练集XtrainMean。然后对各数据集进行标准化处理,对每组的所有样品点通过Excel软件105分钟时的99.91%99.97%。所有样本点进行分类,因此采用模糊C均值聚类法对平均训练集和训练集建立肠溶片22类、3类、4类、5类、6336种情况,以此进行对比分25类时效果显著。本文主要应用软件对相关的模型进行编程求解,计算方便、快捷、准 编

(Nearinfraredspectroscopy,NIRS)分析技术是近年来用于制药行业technology,T,1510150 1015150个样本点的近红外线光谱图。首先对样本进行划分,针对每个时刻的15个样本,每个时刻的前面10个样本乘以10种时刻10051050个样本作为测试2323210个时刻的样本点,然后针对平均值样本和总体训练集样本,分别采用模糊C均值分类法进行分2类、3类、4类、5类、655407.65-3795.38cm1吸收波值画出每个样本105分钟时刻,以此验证聚类对于问题三,在解决问题二的前提下,在已经分好类的前提下,建立模型Ⅲ, X10100个样X550个样平均训练集:训练集的每一时刻的所有样品平均值(10个样本点符 意

将Excel1501015151201515片素片(未包衣)组和15X,便于包衣时间段的数据进行趋势分析。并且,用Excel15个样本数据的均值,用来分对150个样本点记为X进行数据划分,针对每个时刻的15个样本,每个时1010100Xtrain,而每个时刻51050Xtest,并且计算训练集的每一时XtrainMean。数据标准化处理150X,每个样本点对应波xij即:

xijxj,i1,,n,n;j1, ,

jxjxjsjxj的样本标准差。XtrainXtest出初步的判断。用excel815分钟、30分钟……12015分钟、45分钟、75105分钟,分别见下图(图1图2图3图4 包衣15min-包衣15min-通过以上四张图可知,由11515min波长随吸收度折线图、2图3和图4可以粗略地观察出随着包衣时间的增加,三个特征波长段,4860-47604860-4760cm1波长范围内,151050.9500降至约0.8100;4200-4100cm1波长范围内,151050.96000.8700;15最优包衣-最优包衣-包衣包衣包衣包衣15105分钟时间段,4860-cm1、4200-4100cm14000-3900cm1三个曲线特征段的近红外线吸收峰有较为明显120105210个变量,即吸收值数据,210个变量在实际中较为难以分析,并且题目中提供的原始数据有可能210个变量进行除噪和降由问题分析可知,需要对原始数据进行降维和除噪处理,而主成分分析法[2]降低数据维数的模型,即通过降噪和消灭一些冗余持数据原有的特征不失真,从而降低后续计算的复杂度,达到选取特征点的目的。主成分分析的工作对象时一张样本点定量变量类型的数据表。它的工作目标就是要对这p个变量F1,F2, ,Fp(mp),主成分分析将考虑对这个数据表中的信息重新调整组合,从中提 ,Fp(mp),使这m个综合变量能最多地概括原数据表中的2维数据表(p2)为例,若数据的离差越大,所反映的数据信息也最1维数据系统。设原始数据表中的变量为x1,x2, ,xp,主成分分析通过对原坐标系进行平移和旋转变换,是的新坐标的原点与样本点集合的重心重合,新坐标系的第1轴与数据变异的最大方向对应,即为第一主成分,以此类推,经过舍弃少量信息后,由原来的p维空间降至m维。当m2时,就称其为主平面。在数据预处理中,我们已经将数据进行标准化(即每个变量的均值为0,方差为1,在这里不再赘述。X是一个有npeTX(x

1,xp12(,xp1ijn eT

(x,x ,

)TRn

n(x,x ,

)TRn 1 2

1 2 X就是题目中提供的原始数据矩阵,行数为样本点个数,即n150;列p210。现在要求一个综合变量F1,且其是x1,x2, ,xp的线性组合,要使F1所携带的最多地原变异信息即要求F1的方差最大。F1的方差为:1nVar(F) F21aTXT1n

这里,记VN

XTXXX的变量均是标准化变量,Vmax a11 通过拉格朗日乘数法进行转化计算,只需要计算V的前m m,以及对应的特征向量a1,a2 ,am,要求它们是标准正交的X数据表的第h主轴ah,它是协方差矩阵V的第h个特征值h所对应的标准化特征向量,而第hFh为Fh

Var(F)1aTXTXaaTVaaT(a)

n h 称ahFhVar(F1)Var(F2) Var(Fm

F2次之……如果抽取了m个主成分,这m个主成分所携带的信息综合为 Var(Fh)

上述条件中,最多提取m个主成分,而主成分个数mX的秩,也就是说最多可以提取rX个主成分。根据其特征值占所有特征之和的比例可以计算出X的信息。Xtrain(100个样本点)Xtest(50个样本点)、XtrainMean(10个样本点)2种2将Xtrain、Xtest和XtrainMean代入如上模型,通过编程(程序见附录1)从2个主成分的得分向量和特征值为:

XtrainMean:其t

解释比例rat37.7605 XtrainXtest的特征值和得分向量不展示其结果,因为其行数分别为10050172.0755,解释比例rat37.7605 3将Xtrain、Xtest和XtrainMean代入如上模型,通过编程(程序见附录6)从3个主成分的得分向量和特征值为: XtrainMean:其t 37.7605,解释比例rat XtrainXtest的特征值和得分向量不展示其结果,因为其行数分别为1005037.7605,解释比例rat0.9997 一致,21023维99.9%。3类(如最优包衣厚度、包衣厚度不足、未包衣),但是具体于类别的不确定性描述[4],能更客观地反映现实是世界。而模糊C均值聚类分析法有糊C均值聚类分析[5]引进权向量,能够减少这种差异,因此我们采用模糊C均值模糊CNN

m

ck1c0uik11ic,1kNuik11kNs.t

0uik

其中dij

ci

1m 指默认取2ci为模糊组ii类的聚类中心,聚类准则取JU,Vc的极小值将原始数据矩阵统一标准化处理得到无纲量矩阵data,计算其相关系数矩阵R再求出相关系数矩阵R的特征值j,将特征值归一化得到权向量ww1,w2, ,wk,其中ww j

根据限制条件,取定cm和初始隶属度矩阵U0,迭代步数l0计算聚类中心mxulmx vk

,c;l

i NiN

ul修正U,然后重新回到步骤(2)进行计算

2

i,

(ijj1d对给定某个确定的阀值0maxulul1Xtrain(100个样本点)Xtest(50个样本点)、XtrainMean(10个样本点)23个主成分情况下,22 Vmean

Xtrain

Vtrain Uaverage和训练集隶属度UXtrainMean,XtrainMean只有10个样本点(平均训练集),2类,由于Uaverage(10个样本点)在计算中列是样本点,行是类,为了方便展示,将其 XtrainMean,画出其分为286

素第2第20

原点

第1得分72种得分组成的维分布——平均值聚类(2类Xtrain和平均训练集,计算出隶属度矩阵U,因为U有100个样本点,82种得分组成的维分布——训练集聚类(2类3XtrainVmean

Vtrain

XtrainMeanXtrain392种得分组成的维分布——平均值聚类(3类102种得分组成的维分布——训练集聚类(3类4XtrainMeanXtrainVmean

Vtrain

XtrainMeanXtrain3素86优第2第2 0

原点

第1得分112种得分组成的维分布——平均值聚类(4类122种得分组成的维分布——训练集聚类(4类5XtrainMeanXtrainVmean

Vtrain

XtrainMeanXtrain3132种得分组成的维分布——平均值聚类(5类142种得分组成的维分布——训练集聚类(5类6XtrainMeanXtrainVmean

Vtrain

XtrainMeanXtrain386优

素第2第20

原点

第1得分152种得分组成的维分布——平均值聚类(6类162种得分组成的维分布——训练集聚类(6类33类的效果图如下:第2173种得分组成的维分布——训练集聚类(3类(二)模型设论域U上有两个模糊子集A,B,Bi(i1,2, ,20)是U上待识别的模糊子集,若d(Bi,A)d(Bi,B)(若d(Bi,A)d(Bi,B)),则将Bi划归于A(则将Bi划归于B),其中A,B分别是已知A,B两类的特征矩阵的均值向量,d(Bi,A)、d(Bi,B)是Bi(i12, 20AB的贴近度[6]。而贴进度计算有以下:1

NH(A,B) A(xi)Bnn

NE(A,B)

11n((x)(x2n n(AB2iiNG(A,B)

nnn(AB2ii

其中m为模型Ⅱ中的指数,默认取2nnA(xi)B(xinNM(A,B) nA(xi)B(xi

2对于训练集分别划分2类、3类、4类、5类、6类,利用编程(程序见附1,2,3,4,5)求出的聚类中心VtrainXtest素素105优优105素605905第2第2 第1得分182种得分组成的维分布——测试集判别(2类素素优105优105素059050第2第2 第1得分192种得分组成的维分布——测试集判别(3类素素优105优105素059050第2第2 第1得分202种得分组成的维分布——测试集判别(4类素素优105优优优素055第2第2 第1得分212种得分组成的维分布——测试集判别(5类素素105优优105素059050第2第2 第1得分222种得分组成的维分布——测试集判别(6类23在训练集分完之后,利用训练集的求出的聚类中心Vmean对测试集进行分类,通过232种得分组成的维分布——测试集判别(3类 good和优的字样划分为最优类,而图中最左边含有bad和素的字样划分为类,中间为过度类,通过此类划分,再经过测试集Xtest检验,可得到模型Ⅱ和Ⅲ的效率和误差分析表如下:1主成分划分个 类2

6 考虑到聚类模型对自己本身训练集有很好的拟合性和训练集的最优和素片错判个表125 利用和Excel软件对数据进行处理并作出折线趋势图,简便、直观、快捷灵活利用模糊C均值聚类法建立聚类模型,有成数学理论基础[1].数学建模[M].哈尔滨:哈尔滨工程大学[2]福.数学模型与数学建模 师范大学李玉珍,王宜怀.主成分分析及算法[J].苏州大学学报(自然科学版),2005(1):32-曹明飞.能源与环境系统规划的不确定性及风险分析[D].华北电力大学(杨桂元,黄己立.数学建模[M].合肥:中国科技大学.两阶段模糊生产计划期望值模型[J].应用数学学报,2009(4):648-X为原始数据波长降序和分组处理的数据集,因数据量过大,disp('2个主成分,2种得分,C2种分类disp('针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为51050个样本作为测试集');%%针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为训练集51050%---------------提取训练集(10条*10100条数据)------------fori=1:10%10个时间段%---------------提取测试集(5条*1050条数据)--------------fori=1:10%10个时间段,Xtest5条增加 fori=1:10%10%

C=S'*S/(size(S,1)-1);%CLambda=diag(Lambda);%val%Lambda210特征点w=[P(:,ind(1)),P(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量t=S*w;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('10行,10个样本,S10*210矩阵(210个点),2%

trainC=trainS'*trainS/(size(trainS,1)-1);%CtrainLambda=diag(trainLambda);%val由正矩阵变成了一列%Lambda210特征点trainw=[trainP(:,ind(1)),trainP(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量traint=trainS*trainw;%traint叫得分向量,,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2%

disp('trainww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心Uholdon;%cluster_n标量,表示聚合中心数目,即类别数title('2种得分组成的维分布——平均值聚类(2类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10text(data(i,1),data(i,2),biaoji(i),'FontSize',10);%15data145行之后,我们看 %x,yholdoff; ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心U为每个样本holdon;%cluster_n标量,表示聚合中心数目,title('2种得分组成的维分布——训练集聚类(2类)'),xlabel('1得分'),ylabel('2得分');gridon分%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10for由于最优 %x,yholdoff;%

testS=zscore(Xtest);%Xtest为测试集testC=testS'*testS/(size(testS,1)-1);%C提出对角线元素%Lambda210特征点testw=[testP(:,ind(1)),testP(:,ind(2))];%testw是主成分转换系数(2个列向量)testw权重向量testt=testS*testw;%testt叫得分向量disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2

disp('testww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); center;%center为训练样本聚类中心,每一行为一个特定类的聚类中心U为每个样本点对每个聚类distzeros(size(center1size(data1 fork1:size(center1),%%dist(k,:)=sqrt(sum(((data-expo=2;%隶属度矩阵U2,2tmp=dist.^(-2/(expo-=,holdon;'),ylabel('2得分gridon分%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10for %x,yholdoff;disp('2个主成分,2种得分,C3种分类disp('针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为51050个样本作为测试集');%%针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为训练集51050%---------------提取训练集(10条*10100条数据)------------fori=1:10%10个时间段%---------------提取测试集(5条*1050条数据)--------------fori=1:10%10个时间段,Xtest5条增加 fori=1:10%10%

C=S'*S/(size(S,1)-1);%CLambda=diag(Lambda);%val%Lambda210特征点w=[P(:,ind(1)),P(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量t=S*w;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('10行,10个样本,S10*210矩阵(210个点),2%

trainC=trainS'*trainS/(size(trainS,1)-1);%CtrainLambda=diag(trainLambda);%val由正矩阵变成了一列%Lambda第一个数是最大值210trainw=[trainP(:,ind(1)),trainP(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量traint=trainS*trainw;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2%

disp('trainww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心holdon;%cluster_n标量,表示聚合中心数目,即类别数title('2种得分组成的维分布——平均值聚类(3类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10text(data(i,1),data(i,2),biaoji(i),'FontSize',10);%15data145行之后,我们看 %x,yholdoff; C ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心U为每个样本holdon;%cluster_n标量,表示聚合中心数目,title('2种得分组成的维分布——训练集聚类(3类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10fordata145行之后, %x,yholdoff;%

testS=zscore(Xtest);%Xtest为测试集testC=testS'*testS/(size(testS,1)-1);%C提出对角线元素%Lambda210特征点testw=[testP(:,ind(1)),testP(:,ind(2))];%testw是主成分转换系数(2个列向量)testw权重向量testt=testS*testw;%testt叫得分向量disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2

disp('testww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); center;%center为训练样本聚类中心,每一行为一个特定类的聚类中心U为每个样本点对每个聚类distzeros(size(center1size(data1 fork1:size(center1),%%dist(k,:)=sqrt(sum(((data-expo=2;%隶属度矩阵U2,2cluster_n;%标量,表示聚合中心数目,即类别数,3tmp=dist.^(-2/(expo-1));=,holdon;分'),ylabel('2得分gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10for %x,yholdoff;disp('2个主成分,2种得分,C4种分类disp('针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为51050个样本作为测试集');%%针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为训练集51050%---------------提取训练集(10条*10100条数据)------------fori=1:10%10个时间段%---------------提取测试集(5条*1050条数据)--------------fori=1:10%10个时间段,Xtest5条增加 fori=1:10%10%

C=S'*S/(size(S,1)-1);%CLambda=diag(Lambda);%val%Lambda210特征点w=[P(:,ind(1)),P(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量t=S*w;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('10行,10个样本,S10*210矩阵(210个点),2%

trainC=trainS'*trainS/(size(trainS,1)-1);%CtrainLambda=diag(trainLambda);%val由正矩阵变成了一列%Lambda210特征点trainw=[trainP(:,ind(1)),trainP(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量traint=trainS*trainw;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2%

disp('trainww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心holdon;%cluster_n标量,表示聚合中心数目,即类别数title('2种得分组成的维分布——平均值聚类(4类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10text(data(i,1),data(i,2),biaoji(i),'FontSize',10);%15data145行之后,我们看 %x,yholdoff; C ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心U为每个样本holdon;%cluster_n标量,表示聚合中心数目,title('2种得分组成的维分布——训练集聚类(4类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10fordata145行之后,%plot([center([12],1)],[center([1 %x,yholdoff;%

testS=zscore(Xtest);%Xtest为测试集testC=testS'*testS/(size(testS,1)-1);%C提出对角线元素%Lambda210特征点testw=[testP(:,ind(1)),testP(:,ind(2))];%testw是主成分转换系数(2个列向量)testw权重向量testt=testS*testw;%testt叫得分向量disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2

disp('testww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); center;%center为训练样本聚类中心,每一行为一个特定类的聚类中心U为每个样本点对每个聚类distzeros(size(center1size(data1 fork1:size(center1),%%dist(k,:)=sqrt(sum(((data-expo=2;%隶属度矩阵U2,2cluster_n;%标量,表示聚合中心数目,即类别数,3tmp=dist.^(-2/(expo-1));=,holdon;分'),ylabel('2得分gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10for%plot([center([12],1)],[center([1 %x,yholdoff;disp('2个主成分,2种得分,C5种分类disp('针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为51050个样本作为测试集');%%针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为训练集51050%---------------提取训练集(10条*10100条数据)------------fori=1:10%10个时间段%---------------提取测试集(5条*1050条数据)--------------fori=1:10%10个时间段,Xtest5条增加%

fori=1:10%10%

C=S'*S/(size(S,1)-1);%CLambda=diag(Lambda);%val%Lambda210特征点w=[P(:,ind(1)),P(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量t=S*w;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('10行,10个样本,S10*210矩阵(210个点),2%

trainC=trainS'*trainS/(size(trainS,1)-1);%CtrainLambda=diag(trainLambda);%val由正矩阵变成了一列%Lambda210特征点trainw=[trainP(:,ind(1)),trainP(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量traint=trainS*trainw;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2%

向量,212得分 ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心holdon;%cluster_n标量,表示聚合中心数目,即类别数title('2种得分组成的维分布——平均值聚类(5类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10text(data(i,1),data(i,2),biaoji(i),'FontSize',10);%15data145行之后,我们看 %x,yholdoff; C ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心U为每个样本holdon;%cluster_n标量,表示聚合中心数目,title('2种得分组成的维分布——训练集聚类(5类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10fordata145行之后, %x,yholdoff;%

testS=zscore(Xtest);%Xtest为测试集testC=testS'*testS/(size(testS,1)-1);%C提出对角线元素%Lambda210特征点testw=[testP(:,ind(1)),testP(:,ind(2))];%testw是主成分转换系数(2个列向量)testw权重向量testt=testS*testw;%testt叫得分向量disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2

disp('testww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); center;%center为训练样本聚类中心,每一行为一个特定类的聚类中心U为每个样本点对每个聚类distzeros(size(center1size(data1 fork1:size(center1),%%dist(k,:)=sqrt(sum(((data-expo=2;%隶属度矩阵U2,2cluster_n;%标量,表示聚合中心数目,即类别数,3tmp=dist.^(-2/(expo-1));=,holdon;分'),ylabel('2得分gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10for %x,yholdoff;disp('2个主成分,2种得分,C6种分类disp('针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为51050个样本作为测试集');%%针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为训练集51050%---------------提取训练集(10条*10100条数据)------------fori=1:10%10个时间段%---------------提取测试集(5条*1050条数据)--------------fori=1:10%10个时间段,Xtest5条增加 fori=1:10%10%

C=S'*S/(size(S,1)-1);%CLambda=diag(Lambda);%val%Lambda210特征点w=[P(:,ind(1)),P(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量t=S*w;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('10行,10个样本,S10*210矩阵(210个点),2%

trainC=trainS'*trainS/(size(trainS,1)-1);%CtrainLambda=diag(trainLambda);%val由正矩阵变成了一列%Lambda210特征点trainw=[trainP(:,ind(1)),trainP(:,ind(2))];%trainw是主成分转换系数(2个列向量)trainw权重向量traint=trainS*trainw;%traint叫得分向量,traint为取得的特征峰(2个)(新的波峰)disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2

disp('trainww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心holdon;%cluster_n标量,表示聚合中心数目,即类别数title('2种得分组成的维分布——平均值聚类(6类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10text(data(i,1),data(i,2),biaoji(i),'FontSize',10);%15data145行之后,我们看 %x,yholdoff; C ]=fcm(data,cluster_n);%center每一行为一个特定类的聚类中心U为每个样本holdon;%cluster_n标量,表示聚合中心数目,title('2种得分组成的维分布——训练集聚类(6类)'),xlabel('1得分'),ylabel('2得分');gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10fordata145行之后, %x,yholdoff;%

testS=zscore(Xtest);%Xtest为测试集testC=testS'*testS/(size(testS,1)-1);%C提出对角线元素%Lambda210特征点testw=[testP(:,ind(1)),testP(:,ind(2))];%testw是主成分转换系数(2个列向量)testw权重向量testt=testS*testw;%testt叫得分向量disp('通过以上分析,2个主成分是比较合适的')disp('150行,150个样本,S150*210矩阵(210个点),2

disp('testww,我们可以对每个样本计算其样本得分,2个权重列向量,212得分'); center;%center为训练样本聚类中心,每一行为一个特定类的聚类中心U为每个样本点对每个聚类distzeros(size(center1size(data1 fork1:size(center1),%%dist(k,:)=sqrt(sum(((data-expo=2;%隶属度矩阵U2,2cluster_n;%标量,表示聚合中心数目,即类别数,3tmp=dist.^(-2/(expo-1));=,holdon;分'),ylabel('2得分gridon',%%biaoji15'30'4560'75'90'105'120''素''优fori=1:1:10%10for %x,yholdoff;disp('3个主成分,3种得分,C3种分类disp('针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为51050个样本作为测试集');%%针对每个时刻的15个样本,每个时刻的前面10个样本*10种时刻共100个样本作为训练集51050%---------------提取训练集(10条*10100条数据)------------fori=1:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论