基于风格匹配的电子商务购物推荐系统(仅供参考).doc_第1页
基于风格匹配的电子商务购物推荐系统(仅供参考).doc_第2页
基于风格匹配的电子商务购物推荐系统(仅供参考).doc_第3页
基于风格匹配的电子商务购物推荐系统(仅供参考).doc_第4页
基于风格匹配的电子商务购物推荐系统(仅供参考).doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于风格匹配的电子商务购物推荐系统(仅供参考)为了丰富电子商务的推荐功能,优化用户网络购物体验,在基于内容的图像检索技术上提出一种新颖的基于风格匹配的电子商务购物推荐方式.借助基于内容的图像检索技术提取商品图像的颜色、纹理和形状特征,通过反馈技术计算出具有相似图像内容特征的商品聚类,应用于风格匹配模型,按照用户的风格认知推荐给用户.开发了基于风格匹配的购物推荐引擎,并整合到电子商务推荐系统中,帮助用户完成风格认知和网络购物导向,验证了基于风格匹配的电子商务购物推荐系统理论.电子商务 图像检索 推荐系统 风格匹配引言近年来,电子商务进入迅猛发展期,网络购物市场取得了爆发式增长1.随着网上商品数据库信息海量的增长,特别是大量基于图片描述的商品,如何利用这些价值丰富的图像内容引导用户完成购物过程成了亟待优化的问题.为了更好地引导用户购物,电子商务推荐系统(Recommend System)的研究与应用也越来越受到人们的重视2.作为传统推荐系统的补充,研究人员也开始重视个性化购物推荐系统的研究,满足用户按商品潜在风格的购物习惯.目前的电子商务系统主要提供两种方式帮助用户更容易找寻到自己需要的产品.一种是基于语义的搜索引擎3,由于局限于语义层的特质,它并不能满足用户的模糊化需求和情感化的购物心理,特别是用户并不确定自己所需要的商品的严谨描述时,这种矛盾就越发突出.例如,当用户浏览到某种帽子,并希望能查询到类似风格的帽子,就无法通过现有的文本搜索引擎来完成这种需求.在这种情况下,很多电子商务系统开发了推荐系统来引导客户更容易发现自己喜欢的商品.这就是另外一种方式,它一般从客户的浏览记录和购物记录中获得客户喜爱的产品信息,然后向他推荐可能满足客户购物需要的商品.但是这种推荐系统的缺点也非常明显,那些没有足够客户操作的记录的电子商务系统一开始并不能发现客户的潜在需求;而且,在面对用户的模糊需求时,系统也不能提供更多的帮助.本文针对网络购物的特点和用户网上购物的模糊化需求,借助于基于内容的图像检索技术,建立了商品风格匹配模型,研究如何将基于风格匹配的商品推荐应用于电子商务的推荐系统的设计中去,以实现网络购物系统的新体验方式基于商品风格匹配的购物推荐,并实现了一个典型的网上鞋城电子商务网站的购物推荐系统.体系架构与模型体系架构基于风格匹配模型的购物推荐系统体系架构如图1所示:图1 基于风格匹配模型的购物推荐系统体系架构该体系架构主要可分成三大部分:数据显示层:该层由WEB页面发布,由用户提供输入选择,系统反馈匹配结果于用户界面.业务逻辑层:该层由风格匹配模型分析引擎、特征信息数据提取、反馈引擎等组成.风格匹配模型分析引擎将来自数据层的特征数据进行智能分析,通过已经建立的商品风格特征库,把粗糙的原始数据进行特征匹配;特征信息提取引擎是核心模型和算法层的最重要模块,通过图像预处理,提取图像的特征,建立相关的特征数据库.3、数据访问层在本系统中,风格匹配模型的主要数据来源是基于内容的图像检索系统和特征匹配数据库4.图像特征数据库向核心风格匹配模型和算法层中的图像数据分析引擎提供原始匹配特征数据.风格特征提取方法根据分析用户鞋靴购物的特点,我们发现,鞋靴的外形、质地和品牌是用户购买所关注的重点.而网上购物用户则更加重视鞋靴的外形特点是否适合自己.与其它购物种类,比如书籍,3C产品等相比,更加重视外形的展示和设计,也更重视网上图片的展示.鞋靴用品的这一特点,使得网上鞋靴用品的交易中,鞋靴图片质量成了用户最为关注的信息集中点.但是此类产品的外观风格很难剥离出合适准确的语义描述,给用户按照风格选鞋带来困难.商城可以在入库的时候对个体进行编辑信息,添加消费者的意见.但是人工进行操作具有较大的困难,一方面数据的录入工作量过大;另一方面,风格的剥离是依赖于数据操作员的主观判断,缺乏可信度.目前,网络商品的图片数据已经较为丰富,相应的数据库和图片库已经提供了较好的格式化特征数据.依据基于内容的图像检索技术(Content Based Image Retrieval ,CBIR)5,结合产品固有的语义信息(如男式女式,运动休闲等)可以分析出鞋靴的意象风格,有助于用户在购物时从海量的产品信息中比较分析出自己喜欢的鞋靴用品,轻松地置于到自己喜欢的风格的鞋靴产品中.鞋靴用品的外观风格提取方法是基于图片搜索技术,他提供了另外一种用户可能感兴趣的推荐方式.用户在浏览产品的过程中,如果对某一个商品感兴趣,可以方便快捷的找到类似风格的推荐产品,使得搜索技术更加人性化.一般来讲,鞋靴用品风格特征的提取主要包括颜色、纹理和形状三种视觉特征.本文采用的方法如下:颜色特征的提取方法图像的颜色是图像最直观的特征,是人们记忆图像的主要特征,在基于内容的图像检索中,颜色是使用最广泛也最重要的特征之一.颜色特征的提取也是关系到整个搜索效率和准确性的关键.本系统采用基于HSV空间的18色非均匀量化算法6,与传统的基于RGB的颜色特征检索算法相比,该算法明显的降低了时间和空间的复杂度.该算法的大致思想如下:首先对HSV空间进行适当的量化后再进行计算直方图,以减少计算量.在HSV空间中,H从0到360变化时,色调依次呈现为红、橙、黄、绿、青、蓝、紫,并且每一种色调对应的H分量的区域并不均匀.因此,根据视觉对颜色的心理感觉,将H、S、V三个分量按照人的颜色感知进行非等间隔的量化,将 H分量分为不等间隔的七份.当 V很小时,视觉感知的颜色就基本接近于黑色,从而可以忽略H的影响,仅需要一个量化值即可.颜色量化后的具体编码如下:按照以上的量化级,把H,S,V三个颜色分量合成为一维特征矢量L: L=HQsQv+SQv+V式中:Qs和Qv分别是分量S、V的量化级数, 取Qs=2,Qv=1,可得这样,就把H,S,V 三个分量在一维矢量上分布开来.根据表达式可知,L的取值范围为0,17所以计算L可以获得 18柄的一维直方图,这样量化可以有效地减少图像受光照的影响.其次,计算颜色直方图.彩色直方图 H定义为: 其中hdk表示第 k中色彩的像素在图像中出现的次数.度量两幅图像的色彩直方图相似性的方法采用直方图相交法:直方图交距离(Histgram inter-section)可以认为是 L1距离的一种特殊形式,Swain7等用来计算图像颜色之问的相似性.图像 I和图像 J的直方图之间的交距离定义为:纹理特征的提取方法图像纹理描述的是图像的一种局部结构化特征,具体表现为图像像素点某邻域内像素点灰度级后者颜色的某种变化.在本方法中采用 Gabor小波变换来提取图像的纹理特征8,该方法提取过程如下: 纹理特征的提取是相似匹配的基础.本文采用基小波为 Gabor函数的小波变换来提取纹理特征过程,如下:对一幅图像I(x,y)其Gabor小波变换可定义为式中: m为尺度数, n为方 向数 , 对二维Gabor函数进行尺度扩张和旋转变化后得到的滤波器,*为共轭复数.相应的变换系数均值和方差 为为了消除不同特征范围的特征值影响,本文采用了规范化的L2距离测度来描述图像p和图像g之问的距离式(9)即为求两图像之问纹理距离的公式.形状特征的提取方法本文采用基于边缘检测表示方法来提取图像形状特征89,主要是有三个步骤.首先进行图像分割,将图像中具有特殊含义的不同区域区分开来,这些区域是互相不交叉,每个区域都满足特定区域的一致性.在文中采用的是全局阈值分割技术,其原理是令位于(X,Y)点的像素灰度为F(X,Y),选择灰度阈值为 ,则分割的二值图像为:其次,进行图像锐化和边缘检测,图像锐化主要是为了加强其边缘特征,使边缘易于识别.文中主要采用拉普拉斯卷积核的锐化方法.其锐化卷积和模板为:边缘是图像最基本的特征,可以体现图像的空间信息,本模型采用微分算子边缘检测,其原理是根据灰度梯度值来将二值分割图像进行边缘的确定.最后进行边界匹配,傅里叶描述子具有与起始点无关,旋转不变性和转置不变性的特点,因此采用傅里叶描述子来描述形状轮廓向量,以此作为图像的形状特征.其相似性度量公式如下:C(I,Q)=(fjq(u,v)-(fji(u,v)式中fjq(u,v)为傅里叶描述子.在基于相似性图像商品的检索中,单独利用这三种特征是不够的,必须要综合三个特征的搜索以克服使用单一特征带来的问题,例如颜色和形状特征的结合,颜色和纹理特征的结合等,这样将会使图像检索的质量得到一定的提高.风格匹配模型和算法风格匹配是指通过风格匹配算法从特征图像数据库中搜索到与选定的图像风格类似的图像.匹配算法负责如何快速地找到与所选图像风格匹配的商品,是推荐系统的核心功能.匹配特征变量的数据结构匹配特征变量是三维变量,是以图像的纹理、形状和色彩特征属性匹配为基础,其索引结构见图2所示,并由以下数据结构定义:定义1特征变量节点(VNodei):是由图像内容的不同热点来定义,字段名为图像内容中的定位变量;定义2特征变量的特征属性哈希表(VHTi):和节点通过一定特性进行映射后连接,其特征属性(Xi,Yj,Zk)由特征提取引擎提取获得;图2 特征变量结构风格匹配算法的实现在建立了匹配模型数据结构的基础上,模型匹配算法的实现主要分两个部分:去除不相关图像,语义层的过滤,减少了数据处理量,增加了数据处理的效率,达到语义层面的匹配.进一步检查约束条件,进行图像层相似性度量,实现图像内容风格层面的匹配.在匹配算法的第一阶段,主要是针对图像的语义特征属性进行过滤,对符合语义特征的图像进行筛选.在商品的语义特征数据库中,搜索结果不为空的情况下,符合特征的图像将进入筛选池,取得图像节点并加入到PList待选队列中.在匹配算法的第二阶段,针对VNodei的每个特征属性(Xi,Yj,Zk),对PList待选队列进行匹配,针对每个VNodei对象首先检查VNodei的三元特征数据.如果按公式特征值距离在匹配范围内,则将相应VNodei变量加入到FinalPList匹配队列中;反之若不匹配,中断返回,重新对其每个VNodei变量进行类型判断和过滤.图片相似性度量距离计算公式如下:D(x,y,j)=Wt S( I, J) +WsD(P,Q)+WcC(I,Q) Wt+Wc+ Ws =1式中S( I, J),D(P,Q),C(I,Q)计算色彩,纹理,形状度量距离.Wt,Wc,Ws为相应的加权值.第二阶段匹配算法伪代码如下:Algorithm match(P)/ match phase two1. foreach(VNodei V in PList)2. if(V.XCheck()&V.YCheck()&V.ZCheck()3.VHTi.Add(V.X, V.Y, V.Z)4. foreach(VialableFeature vf in VHTi.)5. if(vfi. FeatureDistance vfj. FeatureDistance)6.foreach(VNodei V in PList)7.FinalPList.Add(Vi)8. return FinalPList应用实例鞋靴用品网上购物系统的总体模块架构图如图3所示:图3 鞋靴用品网上购物系统的总体模块架构图该系统主要分为4大部分:商品信息管理、语义搜索引擎、智能推荐系统和传统购物流程系统.其中智能推荐系统是网站系统核心功能,系统基于FLEX技术构架,后台采用MS SQL SERVER提供数据支持,富客户端的设计可以尽量减少用户浏览大量的响应时间,提高用户体验.商品信息管理:该部分主要用于管理商品信息的录入,修改,删除等操作.语义搜索引擎:该部分主要用于过滤,搜索适合用户的商品,也是本文所述的基于语义的搜索和过滤部分.可以按照价格,色彩等属性进行过滤,可以根据关键词查询.智能推荐系统:该部分主要用于实现本文所述的按风格推荐商品的功能,为用户提供类似风格的商品列表.并可以进一步迭代查询.传统购物流程系统:该部分直接提供传统购物系统所需的购物车,比较,订单管理等模块功能.基于风格匹配推荐系统的鞋靴用品网上购物系统界面如图4所示.图4 鞋靴用品网上购物系统界面用户的操作过程如下:(1)按文本属性筛选.第一层是文本描述的特征如男式、休闲款式等,用户选择希望购买的鞋子的诸如颜色、鞋码等特征.用户提交的查询要求经过搜索引擎处理,系统会提供满足这些属性的鞋子图样给用户选择. (2)按意向图像查询.用户如果对某个鞋子的图片感兴趣,可以选择该幅图像要求系统检索与之风格类似的图像.系统可以在该属性池中进行风格特征的匹配搜索,搜索与用户要求匹配的图像特征,并按相似度大小排列返回给用户与该商品匹配程度最高的一系列商品.(3)继续筛选,直到找到最满意的商品.该流程图见图5所示:图5 基于风格匹配模型的购物推荐系统操作流程结语将基于风格匹配的购物推荐系统应用于电子商务中,使得电子商务系统具备了以下特点:1)满足用户按风格购物的潜在情绪习惯;2)优化了用户购物针对性和购物体验;3)有效地提取了图片信息的潜在价值.基于内容的图像检索技术主要集中在基于特征的查询,将其应用到电子商务行业中,将使检索速度或检索效果都取得一定的进展.随着数据库技术和相关检索技术的发展,这种方便、人性化的图像检索技术会有更加广阔的发展前景.下一步的工作是继续深入研究基于风格匹配的购物推荐系统的技术,拓宽在电子商务中的应用.感谢本文得到浙江省自然科学基金资助,项目编号Y1080457.参考文献刘娜.我国网络购物的发展及现状J. 中国商界(上半月) , 2008,(05)J. Ben Schafer, Joseph A. Konstan, and John Riedl,J.E-Commerce Recommendation Applica

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论