基于智能手机传感器数据的人类行为识别研究_第1页
基于智能手机传感器数据的人类行为识别研究_第2页
基于智能手机传感器数据的人类行为识别研究_第3页
基于智能手机传感器数据的人类行为识别研究_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Computer Engineering and Applications 计算机工程与应用2016,52(23)1热点与综述基于智能传感器数据的人类行为识别研究ZHU Xiangbin, QIU Hu,浙江 金华 321000浙江师范大学 数理与College of Mathematics, Physics ana,321000,ZHU Xiangbin, QIU Huiling. Humanand Applications, 2016, 52(23):1-5.Abstract:Recognition of human activity from t fields, such as heal

2、thcare services, intelligent envir methods is not enough in many applications, especiallproposes a Random Forest(RF)approach to recognize h(SpLPP)as the method of feature reduction. Firstly, the oppplications in many n accuracy of most existedder to improve accuracy, the paper hoose Sparse Local Pre

3、serving Projectionure subsets are determined by LPP. Secondly, theresults of activity recognition are classified by RF ensemble classifier. Compared with other methods, the method uses thesignificantly less number of features, and the over-all accKey words:human activity recognition;randombeen incre

4、ased.y preserving projections; smartphone摘 要:运用智能应用。目前,大多数的智能环境和网络空间安全等领域有许多重要为了提高行为活动的识别准确率,先利用稀疏局部保持投影降维,将实验的数据集进行特征约简得到最优的实验特征人类行为识别。实验结果证明,该了提高了整体精确度。文献标志码:A1 引言人类行为识别的目的是通过一系列的观察,对人的 动作类型、行为模式进行分析和识别,并使用自然语言等方式对其加以描述。人类的行为可分为单一和多样两种,单一的行为识别只需要将给定的数据准确已知的几个行为类别;多样的行为较为复杂,往往识别的是多种行为,系统需要根据给定的数据自动

5、识别出行 为的类别。目前,人类行为识别已被广泛地应用于医疗服务、智能环境和网络空间安全等领域。随着速度正以展,可穿戴的流行了多种多样的传感器,如:高清相机,光传感器,陀螺仪传感器感器等 。智能已经达到近 80%的使用率,并且在 2020 年将会达到 80预见,这种功能强大的方便、有效并且易于使用的工具去自动 为(Activities of Daily Living,ADL)3 。灵活、基基金项目ZH125);浙江省公益技术研究 No.LQ13F020007,No.LY16F030上海市作者简介收稿日期:2016 06 06修回日期:2016 07 11文章编号:1002 8331(2016)2

6、3 0001 0522016,52(23)Computer Engineering and Applications 计算机工程与应用于智能传感器数据的人类行为识别是一个很热门3 提出的3.1 基本思路的研究方向。本文结合了降维和器设计。由于实验获2国内外研究现状目前,基于智能得的时间序列数据集具有连续且局部相关性高等特点。稀疏局部保持投影优化保留了邻域结构的数据集9 , 并且可以自适应地选择领域的个数以及计算权重值 0 。因此选择稀疏局部保持投影(Sparse Local PreservingProjection,SpLPP)对数据进行降维阶段的特征约简。传感器的人类行为识别研究已经吸引了大

7、量的国内外研究,并且也获得了一些成果。L.Bao和S.Intille等人收集了来自20 个用户的实验数据,他们分别将 5 个双轴度传感器节,腕关节,踝关节,大腿和素放在大腿上的动4 。J.Kwapisz.G.Weiss和S.Moore等用户的裤子口袋中的Andriod 智能放在右髋关,并且出现想,本文选用随机森林作为分进行识别。速度传感器中的数据,结果表明:J48 决策树本文先利用稀疏局部保持投影的降维,将动地识.-实验的数据集进行特征约简,进而得到最优的实验特征子集,再用随机森林集成器完成人类行为的识别。态活动,值得注意的是没有一种别所有的活动,尤其是上楼D.Lee.和W.-Y.Ch如图 1

8、 所示,信号于嵌入在智能中的度传感器和陀螺仪传感器。实验选用了人类日常活动的六类常见行为,分别为:走、上楼梯、下楼梯、坐、站、躺。、信号也融入了不同频段的度。HAR 数据包的贡献者Auguita 等人,进行了包含上下楼梯的 6 种活动感器数据进行多类支持法对参数进行解释,所以结果缺乏透明性3 。S.-B.Cho 和Y.-S.Lee 同样也使用了智能数据,采用分层隐们的结果强调了HHMMs 在处理低和能量、频偏和间角度等特征。接下来是对提取出的集用于实验的器对最优特机森林的集成单的 HMMs 和人工神经网络更有效6 。Charissa Ronao 等人在同样数据的基础上,运用两尔科夫模型Huyn

9、h 采用随机森林对同样的数据进行Ann高精度地识别出六类行为。RF分果准确度都超过了 83%,整体精确度达到了 96%(http:/ M基于谱聚类和隐Hidden Markov M有效地挖掘了不同时间片段之间的关联性,从而提高了 动作的识别率,最后达到平均 93.48%的识别率8 ,但是这种算法在区分上下楼梯时表现得不太理想。以上的这些研究成果无论图1 人类行为识别流程图性降析(Principal Component(MultidimensioAnalysis,PEmbedding,LLE)、拉斯特征(Laplacian Eigen-要目的是减少实验的特征数量,但目前,很多实验数据maps,L

10、E)、局 部 切 空 间 排 列(Local Tangent Space Alignment,LTSA)和局部保持投影(Locality Preserving Projections,LPP)等。PCA 和LDA 这类经典算法目前已经有了丰富的理论知识储备,并且在处理执行和分析操 作时相对简易。但是这类算法有一个缺点:较易忽略高维数据空间的内在几何结构特征,最终导致低识别率 3 。在经过数据处理后,仍然特征数太多的问题,如:Anguita 等人和Ngan Huynh 的实验中都使用了561 个特征。大量的特征数加大了实验的计算复杂度并且增加了计算内存。同时,也将一些与实验相关度不高的特征变量带

11、入实验中,从而导致最后的识别精确度低问题。因此,迫切地需要一种有创新性去提高算法的性能。人类 为:基于智能传感器数据的人类行为识别研究2016,52(23)3如果实验用的数据集为人工的,LEE、Isomap 和LE 等这类流行学习算法可以得出比较优越的结果。但是面对处理实际数据时,性能往往达不到预期效果,并且会产 生“外样本(out-of-sample)”问题。而LPP 不仅可以克服 “外样本(out-of-sample)”问题还能够提升流行学习在处理实际数据时的性能。局部保持投影是一种流行并且有效的线性的流行学习算法,它兼顾了流行学习点 4 ,最大限度地保持数据上运用Laplace Belt

12、rami 算子找到最佳线性近似的特征函数得到。LPP 实质上是拉求解稀疏表示的最优解 6 ,使得局部邻域包含样本的嵌目的。i ,通过计算 l1 范它的稀疏重构权重系数 wi 。法中的数问题,xi - Xwi w+ wi ; wi j 0 j = 1 2 m21 0 w w 是一个 m 维列数元素为 0,其他系数元素 wi j j ¹ i 表示每个样本元素 xj线性逼近 。给定一个集合x x x ÎRn ,找到一其中,wi 为稀疏表示1 2m个转移矩阵 A ,使得 m 个点保持投影的 感器数据降维Rl (l n) 上,通过 y = Ax算1 得到了原始传感器数据ii其准则函数

13、为:的投影数据集 Y据空间到了低维数据空n nJ = åå间,但是保留了传感器数据作为新的输入数据用于下一算法1 SpLPP feature redInputs:X train:train data;y test data;y test:test label;Optains;WOutput:Ytrain;Ytest For j = 1 Ò nj Ø j + 1X train(j y tr2yi - yjWij(1)i 1 j 1式中,Wij 为样本 xi 和样本 xj 之间的投影权重。为了得到转移矩阵 A ,需要计算最小化目标函数, 具体计算推导如下所示

14、:;X test:matrixæöøn nAopt = arg minç åå2yi - yj=Wijè i 1 j 1æöøn n2Wijarg minç ååA xi - A xj=è i 1 j 1arg min tr(A XDX A - Aarg min tr(A XLX A)XWX A) =(2)low dimen式中,D 是一个对角矩阵,它的输入是 W 的列总Dii = åWij ;L = D - W 是一个Laplacianj 1个

15、 m ´ m 阶的稀疏对称矩阵,Wn和 j 的权重值,如果不为了消除任意缩放因子 ,加 入限制约束条件YDY = 1 ,那么,求解最小化目标函数的转移矩阵 A 问题就可以转化为求解广义特征值中的最小特征值问题来解决:Ytes(t m1,:) Y(m,:); End for3.4随机森林随机森林是一种基于模型聚合思想类器,由 L.Breiman 在 2001 年时对样本进行训练和单的决策树XLX A = XDX A(3)根据求解的最小特征值 1 2 d 得到相应的特征xi Ò yi = A xi A = (a1 a2 ad )式中,yi 是一个 d 维的局部保持投影算法的缺陷

16、是在对选择局部邻域包含的样本个数时不能自适应,并且领域图容易因为噪声 的影响发生改变 0 。稀疏局部保持投影将局部保持和稀疏性两者有效地结合,它通过在 LPP 算法中引入 L1(4)式中,k 是类结果。随机森林算法结合了思想和bagging 技术。目前已经证明了,当处理很多特征冗余问题时,随机子空间选取的效果往往比 bagging42016,52(23)Computer Engineering and Applications 计算机工程与应用的要优秀 8 。这类算法也具有一些其他的重要特征,例如:内部错误估计、强度、变量重要性和相关性等。随机森林目前在很多不同的领域都展现出了它的4 实验4.

17、1 数据分析实验的数据来自于公开UCI 的机器学习知识强大功能。RF 良表现性能与每棵树的质量相关,库,HAR 数据集机上传感器数据,的是SamsungGalaxy SII 智能手感器和陀螺与森林中的树的相关性小 9 。这里,定义的树之间的相关性为OOB样本的每次抽样后会出现接近 1/3 的袋外数据OOB,OOB 样本是观察值的集合,并不用于建立现在的树,在文献20-22 中,作者都建议可以用 OOB error 作为泛化误差估计的一个重要组成部分,并且文献20通过经验性实例证明OOB 错误估计与相同训练集一样容量的测试集得到的精度一样,这也说明袋外数据(OOB)误差估计是一种可以取代测试集的

18、误差估计3.5 基于随机森林的人类行为识别在随机森林重要参数以及一个最终的示的是每次分割时随机选择输入变量的数目,mtry 数目越大,模型中每棵决策树强度越大,本文实验设置的mtry 数目 sqrt(size(Xtrain 2) ;ntree 表示的是树的数目,它决定了模型中集成的决策树数目,ntree 越大,模型收敛性越好,本文实验设置的 ntree500。最终的h30 名志愿者被要求楼梯、下楼梯、坐、站、的皮带上,第二次对内,分别嵌有信号的预处理采样(128上 放在左侧环 器和陀螺仪传感器,收集到的窗口以及 50%的重叠。最后,通(均值、标准差、信号幅度、熵以及信号对相关性等)。每描述,并

19、且对数据进行标机地将 70%的数据集用于训练,30%用于测试。(a)坐(b)站åiK (x) = arg maxI (k(x) = Y )(6)Yi 1表示了随机森林定最终的个决策树在传感器数据进行特征约简的基础下,新的特征子 集用于随机森林的(1) 给定训练数据集 Xtrain ,训练数据集 Xtest ,测试(2) 从训练数据集 Xtrain 中有放回随机采样出m个样本,作为决策树的输入样本。(3) 从 Xtrain 特征数中随机选择出sqrt(size(Xtrain 2)个特征子集,作为每一个结点的输入变量。(4) 以 sqrt(size(Xtrain 2) 个特征的最优该结点

20、的(5) 随机森林中的每棵树的完全生长过程,不需要剪枝。(6)个测试样本 Xtest 进行投票测试数据集了最后的输出。(7) 识别率计算,通过本的Ytest 得到每类行为的最终识别率。(c(e)下楼梯(f)上楼梯图2 人类日常行为示例图值得注意的是,本文的实验设的活动类别者进本文的实验只选用了较为基础的6 项人类行为活动。:基于智能传感器数据的人类行为识别研究2016,52(23)54.2实验结果分析本文的实验是对数据先进行降维处理后再运20 00用器识别。如图3,同样的经过比图可以 的识别率都到了非常高的器,进行了数据60 00显地看到,原来因40 00为者佩戴移动的物理位置不同,站是最难识

21、别出的活动高了13.54%。站实验结果对比图躺0 00SpLPP-R RF00%98 8700 0097 34%影结合随机森林类的一些普遍行为,并且证的有效性。SpLPP 算法可以非常专业地处仪传感器数的9 0%90 0080 00于其他的单一器,高效70 00躺站坐下楼梯上楼梯走图3 数据降维前后行为识别率对比图文算法已经取得了高性能的表现,但于未来的实验研究,还有很多需要做的:在 SpLPP约简的过程中,时间复杂度相对较高,还有一本文运用的SpLPP 特征约简算法思想源自龙的文章 6 。基于SpLPP 降维后,特征数量由 561 降到了 84。为了评估SpLPP 算法的表现,还在同样的 HAR 数据以及相同的随机森林他们的法有:SpLPP(84)、RFIM(132)、PCA(118)和 L

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论