下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 基于模糊k最近邻规则的葛根类药材的模式识别【摘要】 目的: 探讨模糊k最近邻算法运用于葛根类药材模式识别的可行性。 方法 :选择6种化学成分的含量,对不同产地的多种葛根类中药的药理抗内毒素活性建立了模糊k最近邻规则识别模式。结果: 模糊k最近邻规则对葛根类中药的药理抗内毒素活性识别正确率达100%,优于经典k最近邻法与Bayers判别法。结论:模糊k最近邻算法可用于中药模式识别 研究 。 【关键词】 模糊k最近邻算法; k最近邻算法; 模式识别; 葛属模式识别技术是一种借助数学方法和 计算 机技术来对样品的内部 规律 及隐含性质进行 分析 的综合
2、技术,包括判别分析、聚类分析、机器 学习 等多种方法。该技术已经广泛 应用 于各个领域,随着中药 现代 化进程,该项技术逐渐在中药领域深入应用。k最近邻法已被广泛应用于模式识别的分类器设计,所谓k最近邻法(KNN)就是取未知样本的k个近邻,看这k个近邻多数属于哪一类,就把其归于哪一类,在分类过程中KNN是采用简单多数投票法来确定未知样本的分类1。 问题 是,当学习样本类别分布不均的时候,如果仅考虑排序后的k个最近邻而忽视样本间的不同距离,势必会降低KNN的分类精度2。模糊k最近邻算法(FuzzyKNN,FKNN)就是将模糊 理论 与k最近邻法相结合的一种监督学习技术,它有效解决了上述问题,它将
3、未知样本与k个最近邻的距离模糊化,并为每个类别都设置了相应的隶属度,而不象KNN那样简单的将未知样本的归类定为“属于”或者“不属于”3。FKNN已被成功的应用于多个领域,在蛋白质结构预测3及文本分类2都有着不错的性能,本研究将FKNN应用于中药的模式识别, 目前 国内尚未见报道。1 FKNN算法的原理及实现本研究的FKNN算法4不同于聂生冬等5将模糊c均值聚类与KNN简单结合,而是在KNN的基础上结合模糊理论进行归类决策实现的,其具体算法安排如下: 设已知样本集合Pp1, p, pn,n为已知分类的样本数,c代表分类数,u代表一个c×n的矩阵; 确定未知样本的最近邻数k的值; 选择欧
4、式距离范数d作为距离测度; 对每个未知样本x: 计算n个距离dd(x,pj),并对其进行排序:piP,且x Pd(1)d(2)d(3) dd(k+1) d(n)其中d(1)到d是未知样本x的k个最近邻与x的距离。 在u中找出对应于k个最近邻距离的k个列uj,其中j1,2, k。 利用上一步从u中获得的k个列uj,计算4:ui(x)=kj=1uij1d(x,pj)2m-1 kj=11d(x,pj)2m-1其中m为模糊权重调节因子,对于z1,2, ,c,如果ui(x)=maxuz(x),zi,则x属于第i类。取下一个未知样本转到(4)继续,上述算法不是迭代过程,每个未知样本都必须按照上述算法处理一
5、遍。2 中药葛根类药材的模式识别中药模式识别通常是根据中药所含化学成分的整体进行分类或描述,识别该中药的真伪与优劣。葛根为豆科植物野葛或甘葛藤的干燥根,全世界已知的葛属植物大约有18种,我国是葛属植物的原产地之一,分布极其广泛,葛属植物有9个种和2个变种,其中7种与药用有关, 研究 结果表明,不同葛属植物中药用成分异黄酮含量和组分差异显著。曾明等7对8个来源共17个药材样本的葛属植物的总黄酮X1、葛根素X2、大豆苷X3、大豆苷元X4、3甲氧基葛根素X5及多糖X6,6个化学成分进行了测定6,并测定了相应的抗内毒素活性强度,按照 文献 8 方法 对各药材的抗内毒素活性强度进行分类,强度较弱者记为1
6、,强度较强者记为2,结果见表1。本研究运用模糊k最近邻算法以6个化学成分的含量为输入变量,药理活性强度分类为目标类别建立模式识别模型。从表1原始数据随机选取5个作为未知数据进行测试,剩余12个作为已知数据进行 学习 ,将各数据进行归一化处理后,运行FKNN算法,算法实现语言为MATLAB。对于FKNN,k值对分类器的性能有显著 影响 ,表2是不同k值下FKNN的分类精度。由表2结果可见当k值大于等于7时,FKNN具有最好的分类精度,对未知数据集及整个数据集的识别正确率都达到了100%,在本例中k取7进行建模识别,识别结果见表1。我们也尝试用经典KNN法对数据进行分类,结果见表3,可见,在相同k
7、值下FKNN都要比KNN表现出更好的分类性能。就本例数据而言,无论我们怎么调整参数,KNN法的分类精度都不能令人满意。张汉明等8也对同样的数据进行了Bayers判别 分析 ,结果回判的识别正确率也仅有88%与94%。表1 17个药材样品的化学与药理模式数据(*为测试数据)(略)表2 不同k值下FKNN的分类精度(略)表3 不同k值下KNN的分类精度(略)3 结果与讨论FKNN作为一种监督学习技术,将对每一个未知样本进行相同的算法处理,且由于其算法不是迭代过程,因此也不存在不收敛的现象。另外,对于模糊权重调节因子m的取值, 理论 上可以是任意的,根据文献4,本研究取值m=2,我们也对m在1,3范
8、围内,以0.1为步长考察了不同m值对FKNN分类精度的影响,结果发现并无差异。在m=2,k=7时FKNN对17种葛根类中药的药理抗内毒素活性识别正确率达100%,识别精度要优于k最近邻法及文献8的Bayers判别法,FKNN可以用于中药的模式识别研究。【 参考 文献】1 Jiawei Han,Micheline Kamber. 著. 范明,孟晓峰,等译. 数据挖掘概念与技术. 北京:机械 工业 出版社,2001:209.2 Shang Wenqian,Qu Youli,Huang Houkuan,etal. Fuzzy knn text classifier based on gini ind
9、ex. Journal of Guangxi Normal University:Natural Science Edition,2006,24(4):8790.3 Rajkuar Bondugula,Ognen Duzlevski,Xu Dong. Profiles and Fuzzy knearest neighbor algorithm for protein secondary structure prediction. AsiaPacific Bioinformatics Conference, 2005:8594.4 J. M. Keller,M. R. Gray,J. A. Givens. A fuzzy knearest neighbor algorithm. IEEE Trans on SMC, 1985,15(4):580585.5 聂生东,聂斌,章鲁,等. 基于模糊k近邻规则的多谱磁共振脑图像分割方法的研究. 中国 生物医学工程学报,2002,21(5):471477.6 曾明,张汉明,郑水庆,等. 葛属植物根的异黄酮类成分分析. 第二军医大学学报,1998
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 6.3.3 生物进化的原因 课件(内嵌视频)-2025-2026学年人教版生物八年级下册
- 2026年快消评估数据资产管理协议
- 2026年航天营销金融科技合作合同
- 2026年物流施工产业园区运营合同
- 2026年大数据推广采购供应协议
- 村居代办工作制度汇编
- 预防接种工作制度汇编
- 领导定期汇报工作制度
- 领导活动安排工作制度
- 风险控制系统工作制度
- 2026年医学伦理学期末试题及参考答案详解【培优A卷】
- 国际珍稀动物保护日课件
- 2026年南京大数据集团有限公司校园招聘考试参考试题及答案解析
- 2025年湖南省益阳市事业单位招聘笔试试题及答案解析
- 认识情绪拥抱阳光心态+-2026年高一下学期情绪管理与压力调节主题班会
- 《安全注射标准》WST856-2025解读
- 2026年中国烟草招聘考试试题及答案
- 2026秋招:上海银行笔试题及答案
- 华电新能首次覆盖报告:央企底色稳成长新能赛道具优势
- JJF 2380-2026检验医学定量检测项目基于患者数据的质量控制算法溯源方法
- 产妇生产陪伴制度
评论
0/150
提交评论