(应用数学专业论文)高维数据统计学习及其在人脸识别、微阵列分析中的应用.pdf_第1页
(应用数学专业论文)高维数据统计学习及其在人脸识别、微阵列分析中的应用.pdf_第2页
(应用数学专业论文)高维数据统计学习及其在人脸识别、微阵列分析中的应用.pdf_第3页
(应用数学专业论文)高维数据统计学习及其在人脸识别、微阵列分析中的应用.pdf_第4页
(应用数学专业论文)高维数据统计学习及其在人脸识别、微阵列分析中的应用.pdf_第5页
已阅读5页,还剩122页未读 继续免费阅读

(应用数学专业论文)高维数据统计学习及其在人脸识别、微阵列分析中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高维数据统计学习及其在人脸识别 微阵列分析中 的应用 专 业 博士生 导师 应用数学 阳文辉 戴道清教授 摘要 高维数据经常出现在许多现代模式识别的应用中 例如人脸识别 微阵列分析 人脸 识别技术在国家安全 军事安全 公共安全和家庭娱乐等领域具有广泛的应用前景 虽 然人类可以毫不费力地识别出人脸及表情 但机器自动识别却是一个极具挑战的难题 最近十几年 自动人脸识别已经成为计算机科学与信息技术领域的研究热点 另外 九 十年代发展的微阵列技术能同时测量数千个基因的表达水平 这项技术期待能实现肿瘤 早期的精确诊断 从而为肿瘤的治疗做出显著贡献 如何对基因芯片实验产生的海量数 据进行有效的管理和分析已成为使用这一高通量技术的瓶颈 已有的分析软件虽然提供 了聚类分析和一定程度的统计分析 但仍然很难从结果中得到有价值的生物学知识及数 据背后隐藏的相互联系 近年来基于统计学习的模式识别方法引起了极大的关注 在人脸识别和微阵列分析中 取得了很大的成功 代表算法包括不相关判别分析 二维判别分析和双聚类等等 本论 文就是针对统计学习算法在自动人脸识别和基因表达数据分析中的各个环节中的应用展 开的 论文的主要工作包括 一 基于极大间距准则 m m c 的不相关判别分析 u d a 方法 模式分类中 判别向量的统计不相关性是一个非常有用的性质 统计不相关的特征包 含有最小的冗余信息 而经正交特征向量集投影的特征空间因可能包含一些冗余信息而 导致分类性能下降 本文提出了一种新颖的不相关判别分析 u d a 方法 首先 我们对 高维数据进行降维处理 讨论了利用奇异值分解得到的两种降维方法 一种是对总的散 第i 页 共u 9 页 中文摘要 度矩阵投影 另一种是对类问散度矩阵投影 并且证明了对总的散度矩阵投影可以保持 各类样本之问的线性可分 而对类间散度矩阵投影可以保持各类均值向量之间的距离不 变 其次 基于具有较强鲁棒性 稳定性和有效性的极大问距准则 m m c 提出了一种 不相关判别分析 u d a 算法 该算法不需要考虑数据维数和样本数目的限制 克服了经 典l d a 的局限 由于不是所有的判别向量都是有用的 在判别向量选取阶段 我们定义 了一个优化判别子空间去限制判别向量的数目 从而建立了一种完全自动化的方式验证 参数 二 基于二维极大间距准则 m m c 的特征提取 在人脸识别中所处理的人脸图像数据都是二维的 如果要使用一维判别分析方 法 就必须把人脸图像矩阵转化为向量 这种转化会带来两个问题 高维小样本问 题和图像结构信息丢失问题 近年来 二维判别分析正是基于这两点而成为了人脸 识别中的一项新技术 本质上 二维判别分析是基于图像的行或列去找判别向量 从而挖掘出图像的局部特征 但是从整体上来看 二维判别分析得到的投影矩阵仍 然可能含有冗余信息 而一维判别分析是基于整幅图像去找判别向量 考虑的是全 局特征 本文结合二维判别分析和一维判别分析的优势 提出了一个基于两个处理阶 段的人脸识别框架 2 d 2 m m c l d a 第一阶段 提出了一个二维双向特征提取技 术 f 2 d 2 m m c 2 d 2 m m c 可以看成是m m c 方法在二维数据上的直接推广 第二阶 段 在 2 d 2 m m c 的降维子空间里运行l d a 三 基于奇异值分解 s v d 的显著常量双聚类方法 双聚类是对微阵列数据进行分析的一个重要途径 使用双聚类算法 我们可以识别出 微阵列中的局部结构模型 在特定实验条件下 部分基因具有一致表达 这种模型可能 对我们理解不同生理状态下的生物过程提供关键的线索 本文将网答 在特定条件下 哪些基因表达上调 哪些基因表达下调 哪些基因不 显著等问题 这些信息能为我们提供许多有价值的基因网络调控信息 通过特殊的数据 预处理 寻找特定实验条件下的表达上调基因组或表达下调基因组可以通过检测显著常 量双聚类来实现 本文介绍了一种新颖的思想 以s v d 为框架 把挖掘基因表达数据中 的常量双聚类问题转换为两个全局聚类问题 在全局聚类问题中 应用统计方法 我 们估计了分层聚类里的剪枝阈值 我们的方法能识别出重要的相互调控基因组 并且 能有效的把相同类型的样本聚类在一起 在三个公共数据库 h u m a nt i s s u e s l y m p h o m a 和l e u k e m i a l 上的实验结果展现了良好的可视化特征和解释能力 第i i 页 共1 1 9 页 四 基于奇异值分解 s v d 的相关双聚类方法 一般地 两个基凶的相关性是基于所有的实验条件来度量的 但当我们仅对部分实验 条件感兴趣时 这种相关性的求法显得不恰当 另外 目前大多数双聚类算法仅去寻找 正相关的双聚类 然而 生物学家认为不仅要识别包含正向相关 也要识别包含负向相 关基因的双聚类 本文定义了一类更加广泛的双聚类类型一相关双聚类 这种类型具有 更直观的生物解释 基于这种新类型 我们定义了一个新的得分公式对其评价 接下来 我们利用奇异值分解的两个矩阵与原矩阵之间的关系 把识别相关双聚类问题转化为在 两个分解矩阵上寻找可加模型的问题 本文提出的算法得到的双聚类的特点是允许任意 位置 可以重叠 而且是内包最大的 该算法在人类器官数据库上显示了良好的生物意 义 我们将该算法与一些著名的双聚类方法 o p s m i s a s a m b a 和c c 应用于酵母数据 库上 并比较它们的处理结果 我们所提出的算法得到的双聚类有更高的比例是高度显 著丰度的 关键词 高维数据 特征提取 小样本问题 不相关判别分析 极大间距准则 奇 异值分解 二维判别分析 双聚类 人脸识别 微阵列分析 第i i i 页 共1 1 9 页 s t a t i s t i d a t aa n d m a j o r a p p l i e dm a t h e m a t i c s n a m e w 6 n h u i m g s u p e r v i s o r p r o 麟s o rd a o q i n gd a j a b s t r a c t n h i g h d i i i l e 璐i o n a ld a t ao f t e no c e u r si nm a n ym o d e mp a t t e r nr e c o g i l i t i o na p p l i c a t i o 璐 s u c ha u s er e c o g i l i t i o na n dg e n ee x p r e s s i o nd a t aa n a l y s i s f k er e c o g i l i t i o nh a se 赋e n s i v ep e r s p e c t i v eo fa p p n c a t i o ni nt h ef l e l d 8o fh o m e l a n ds e c u r i t y m i l i t a 巧s e c u r i t y p u b l i c s e c u r i t ya n df 缸i l ye n t e r t a i n m e n te t c a 1 t h o u g hh u m a nc o u l dr e c o g l l i z et h eh l l m a nf 如e a n de x p r e s s i o nw i t h o u ts t r h n gab l o w i n g i ti sab i gc h a e n g ef o rc o m p u t e r e a c er e c o g n i t i o nh a u sb e c o m eo n eo ft h em o s ta c t i v er e s e a r c ha r e a si nc o m p u t e rs c i e n c ea n di n f o r m a t i o n t e c l u l o l o 舒a v e rt h ep a s tf 打d e c a d e s b e s i d e s t h er e c e n t l yd e v e l o p e dm i c r o 盯r a yt e c h n o l o 时a l l o w sf o rm e a s u r i n ge x p r e s s i o nl e v e l so ft h o u s a n d so fg e n e 8s i m u l t a n e o u s l y w l l i c ha r e e x p e c t e dt oc o n t r i b u t es i g i l m c a n t l yt op r o g r e s si nc a n c e rt r e a t m e n tb ye n a b h n gap r e c i s e a n de 8 r l yd i a g n o s i s m a n a g e m e n ta n d a n a i y s i so ft h eh u g e 锄o u n t so fd a t ap r o d u c e db y i i l i c r o a r r a ye x p e r i m e n t sa r eb e c o m i i 堰o n eo ft h em a j o rb o t t l e n e c l si nt h ea p p l i c a t i o no f t h i sl l i g h t h r o u g h p u tt e d h n o l o g y m a n ys o 允砌f et o o l sh a eb e e nd e v e l o p e dt os u p p o r tm i c r o a 盱a yd a t aa n a l y s i sb ym e a 肌so fc l u s t e r i n ga n ds t a t i s t i ca n a b 厂s i s b u ti ti ss t i l lh a r df o r r e s e a r c h e r st oi 1 1 f 醯f h n c t i o n so ft h eg e n 腭a n dt h e i rr e l a t i o i l s t l i p sf 而mt h er e s t l l t si nt h e c o n t e 妣o fe 凼t i n gk n o w l e d g e i i lr e c e n t 躺 p a t t e r nr e c o g n i t i o nm e t h o d sb a u s e do ns t a t i s t i c a ll e a r l l i n gh a v ea t t a u e h e d ag r e a td e a lo fa t t e n t i o nw h i c hh a ea c l l i e v e dg r e a ts u c c e s si nf 如er e c o g n i t i o n 龇l dm i c r o 甜 r a ya n a l l y s i s t h er e p r e s e n t a t i v ea l g o r i t h i n si n c l u d em l c o n e l a t e dd i s c r i m i n a n ta n a l y s i s t w o d i m e n s i o n a ld i s c r i m i n a n ta d l a l y s i sa n d b i c l u s t e r i n g t h i sd i s s e r t a t i o ni sj u s td i r e c t e da tt h e 印p l i c a t i o no fs t a t i s t i c a ll e a r n i n ga l g o r i t h m si nt h ev 盯i o l l ss t a g e so fa u t o m a t i cf a u c er e c o g n i 第v 页 共1 1 9 页 英文摘要 t i o na n dg e n ee x p r e s s i o nd a t aa n a l y s i s t h em a i nw o r ka n di n n o v a t i o no f 七1 1 i sd i s s e r t a t i o n i n c l u d e 8 1 u n c o r r e l a t e dd i s c r i m i n a n ta n a l y 8 i s u d a a k o r i t h mb a s e do nm a x i m u mm a r 西nc r i t e r i o n m m c i np a t t e r nc l a s s i 矗c a t i o n t h es t a t i s t i e a l lu n e o r r e l a t i o no fd i s c r i m i n a r l tv e c t o r si sa 缸 v o r a b l ep r o p e r t y u n c o r r e l a t e df 舀a t u r ec o n t a i l l sm i n i m u mr e d u n d a n c ya n dt h es t a t i s t i c a l u n c o r r e l a t i o np r o p e r t yi sv e 巧d e s i r a b l ef o rf b a t u r ee x t r a c t i o n i nt h i sd i s s e r t a t i o n w ep r m p o s ean o v e lu n c o r r e l a t e dd i j s c r i m i n a 础a n a l y s i s u d a a l g o r i t h m d i m e i l s i o n a l i t yr e d u c t i o n i san e c e s s a r ys t e pt od e a l lw i t hl l i g h d i m e n s i o n a la i l ds m a us 锄p l es i z ed a 吨a f i r s t l y w e i n t r o d u c et w od i m e 璐i o n a l i t yr e d u c t i o nm e t h o d su s i n gs v d t h ef i r s to n ei sp r o j e c t i o no n w bp r o v et h a tf o ra i l yh n e a u rm e t h o d p r o j e c t i o no n d o e sn o tl o s ea n 7c l a s s i f l c a t i o n i n f o r m a t i o n a n o t h e ro n ei sp r o j e c t i o no n w bp r o v et h a tp r o j e c t i o no n p r e s e r v e 8t h e d i s t a n c eo ft h ec l a s sc e n t r o i d s s e c o n d l y w ep r o p o s et h ee 髓c t i v eu d am e t h o db a s e do n m m c b e c a u s ef b a t u r ee x t r a c t i o nb a s e do nm m cc r i t e r i o ni sr o b u s t s t a b l e a n de 伍c i e n t t h eu d ai sa p p l i c a b l er e g a r d l e s so ft h ed a t ad i m e l l s i o na n ds a m p l es i z e c i v e r c o m i n gt h e l i h d t a t i o no ft h ec l a s s i c a ll d a b e s i d e s w ed e 矗n ea no p t i m a ld i s c r i m i n a n ts u b s p a u e ew l l i c h c a ns c r e e no u ts o m es u i t a b l ed i s c r i m i n a n t 地t o r s t h eu d as e l e c t sd i s c r i m i n a n tv e c t o r s 矗o mo p t i m a ld i s c r i m i n a n ts u b s p a u e e 丽t h o u tp a r a m e t e rv a l i d a t i o n a ne n t i r ea u t o m a t i c s t r a t e g yi se s t a b l i s h e d f i e a t u r ee x t r a c t i o nf r o mf a c e sb a s e do n 饥w d i m e 璐i o n a lm m c o nf a c er e c o g i l i t i o n m o s tp r e v i o u sw o r l so nd i m e n s i o n a h t yr e d u c t i o na n dc l a u s s i f i c a t i o n w o l l l d 矗r s tt r 龇l s f o r mt h ei n p u ti m a g ei n t oo n ed i m e n s i o n a lv e c t o r w h i c hi g n o r e 8t h eu n d e r l y i n gd a t as t r u c t l l r ea n do f t e nl e a d st ol l i g h d i m e n s i o n a la n ds m a l l ls a m p l es i z ep r o b l e m m o r er e c e n t l y t w 0 d i m e n s i o n 以d i s c r i m i n a t i o na n a l y s i s 2 d d a h a sb e c o m ea ni n t e r e s t i n g t e d m i q u ew h i c hc a n0 v e r c o m et h ea b o v ed r a w b a u c k s e s s e n t i a l l y 2 d d ae t r a u e t s f e a t u r e s b a s e do nt h er o w so rt h ec o l 啪n so fi m a g e sw h i c hc a nu n c o v e rt h el o c a li n f o r m a t i o n b u t 矗o mt h eg l o b a l t h ef e a t u r e su s i n g2 d d as t i l lc o n t a i ns o m er e d u n d a n ti n f o r m a t i o n o n 争 d i m e i l s i o n a ld i s c r i m i n a t i o na n a l y s i s 1 d d a w h i c hc o i l s i d e r st h eg l o b a li n f o r m a t i o ni st o 6 n dt h ed i s c r i m i n a i l tv e c t o r sb a s e do nt h ew h o l ei m a g e s i nt l l i sd i s s e r t a t i o n w es t u d y 第v i 页 共1 1 9 页 t h ec o 邛 b i n a t i o no f2 d d aa 1 1 d1 d d a a n d p r o p o s ean o n p a r a m e t r i ct w o s t a g ef r 锄e w o r k 2 d 2 m m c l d a i nt h e 矗r s ts t a g e at w 昏d i m e l l s i o n a lt 矾协d i r e c t i o n a lf e a t u r ee x t r a c t i o nt e c h i l i q u e 2 d 2 m m c i sp r e s e n t e d 2 d 2 m m ci sa n e x t e i l s i o no fm m co nt h em a t r 仅 r e p r e s e n t a t i o no fi m a g 罄 i nt h es e c o n ds t a 零 t h el d a s 乞e pi sp e r f o r m e di nt h e 2 d 2 m m c s u b s p a c e 3 f i n d i n gs i g l l i 矗c a n tc o n s t a n t b i c l u s t e r sb a s e do ns i n g u l a rv a l u ed e c o m p o s i t i o n s v d b i c l u 8 t e r i n gi sa ni m p o r t a n ta p p r o 施hi nm i c r o a r r a yd a t aa n a l y s i s u s i n gb i c l u s t e r i n g 出9 0 r i t h m s o n ec a ni d e n t i 匆s e t so fg e n e ss h a r i n gc o m p a t i b l ee x p r e s s i o np a t t e r l l sa u c r o s s s u b s e t so fs a m p l e s t h e s ep a t t e r 瑚m a yp r o v i d ec l u e sa b o u tt h em a i n b i o l o g i c a lp r o c e s s e s a s s o c i a t e dt od i 虢r e n tp h y s i o l o 西c a ls t a t e s i nt h i sd i s s e r t a t i o n w ew i ua n s r e rm l d e rc e r t a i ne x p 鲥m e n t a lc o n d i t i o l l s w 王l i c hg e n e s a r eu p r e g u l a t e d 8 n dw h i c hg e n e sa r e i 嘲 n r e g u l a t e d t h e s ei n f o r m a t i o nc 趿d e l i v e rm u c h v a l u a b l er e g m a t i o ni n f o 咖a t i o no fg e n en e t w 0 r k w i t ht h es p e c i a ld a t ap r e p r o c e s s i n g t h e u p r e g u l a t e dg e i 螂o rd o w n r e g u l a t e dg e n e su n d e rc e r t a i nc o n d i t i o n sc a nb ed i s c o v e r e d b yd e t e c t i n gs i g n i f i c a n tc o 璐t a n tb i c l u s t e r s w ei n t r o d u c ean o v e li d e a t h ep r o b l e mo f d i s c o v e r i n gc o n s t 锄b i c l u s t e r si st r a 璐f o r m e di n t ot w o 西o b a ld u s t e r i n gp r o b l 锄s t h i s t e c b 皿i q u eu s e ss v d a si t s 矗a m e w o r k i nt h eg l o b a lc l u s t e r i n gp r o b l e m a p p l y i i l g8 t a t i s t i c 甜 t h e o 巩w e e s t i m a t et h et h r e s h o l di nh i e r a l r c h i c a lc l u s t e r i n gt oc u tt h ed e n d r o 耵锄a ta p a r t i c u l a rt h r e s h 0 1 dl e v e l u s i n gt l l i sa p p r o a c h w ea r ea b l et oi d e n t 毋t h ei m p o r t a n tc 伊 r e g u l a t e dg e n e sa n d 留o u pt h e8 a m p l e se m c i e n t l ya tt h es a m et i m e t h ee x p e r i m e n tr e s u l t s 在o mt h r e ew e l l k n 0 硼d a t a s e t s h u m a n t i s s u e s 工 m p h o m aa 芏1 dl e u k e m i a d e m o 璐t r a t e d t h a to u ra p p r o a c hh a u sg o o dv i s u a l i z a t i o na n d 砒e r p r e t a t i o na b i l i t y 4 f i n d i n gc o r r e l a t e db i c l u s t e r so fm i c r o a r r a yd a t ab a s e do ns v d n a d i t i o n a l l y t h ec o r r e l a t i o nb e t 俄nt w dg e n e 8 c o n d i t i o z l s i sm e a s u r e da c r o 豁t h e w h o l ep r o 丘l i e s t l l i si sn o t 印p r o p r i a t ew h e n ea r eo n l yi n t e r e s t e di nas u b s e to fg e n 瞄 c o n d i t i o l l s b e s i d e s m o s t0 fe x i s t i i 培b i c l u s t e r i n ga p p r o a c h e sa r ed e s i g i l e df o r 丑n d i n g p o s i t i v er e g i l l a t e dg e n eb i c l u s t e r s h 觏r e r a se x p l o r e db yb i o l o g i s t s t h e r ei sar e a l l n e e dt oi d e n t 毋c 0 r e g u l a t e dg e n ec l u s t e r s w l l i c hi n c l u d eb o t hp o s i t i v e n e g a t i v er e g u l a t e d g e n eb i c l u 8 t e r 8 i nt h i 8d i s s e r t a t i o n w e 矗r 8 ti n t r o d u c eam o r eg e n e r a lp a t t e r n c o r r e l a t e d b i c l u s t e r w h i c hh 8 si n t u i t i v eb i o l o 舀c a li n t e r p r e t a t i o n t h e nw ep r o p o s eai l o 他lt r a 瑚f o r m 第v 迂页 共1 1 9 页 英文摘要 t e c h n i q u eb a s e do ns v ds o t h a ti d e n t i 黟i n gc o r r e l a t e db i c l u s t e rp r o b l e mf r o mg e n e e x p r e s s i o nm a t r i i st r a n s f o r m e di n t ot w og l o b a lc l u s t e r i n gp r o b l e m s t h em i x e d c l u s t e r i n g a l g o r i t h ma n dt h el i f ta l g o r i t h ma r ed e v i s e dt oe 伍c i e n t l yp r o d u c e 口e o r b i c l u s t e r s t h e b i c l u s t e r so b t a i n e du s i n go u rm e t h o da r ea r b i t r a r i l yp o s i t i o n e do v e r l 印p i n ga n di n c l u s i o n m a x i m a l t h eb i c l u s t e r so b t a i n e du s i n go u rm e t h o ds h a wu s e f u lb i o l o g i c a lm e a n i n 寥o n t i p l eh 伽 1 a no r g a n sd a t a s e t c o m p a r e dw i t hf o u rp r o m i n e n tb i c l u s t e r i n gm e t h o d s o p s m i s a s a m b aa n dc c o u rm e t h o ds h o w sa1 a r g e rp r o p o r t i o no ff u n c t i o n a l l y e n r i c h e db i c l u s t e r sa td i 髓r e n ts i g n i f i c a n c el e v e l so ny e a s ts o c c n m m 可c e sc e r e 钉i s t o ed a t a s e t k e yw b r d s h i g h d i m e 瑚i o n a ld a t a f b a t u r ee t r a c t i o n s m a us 锄p l es i z ep r o b l e m u n c o r r e l a t e d d i s c r i m i n a n ta n a l y s i s m a x i m u mm a r g i nc r i t e r i o n s i n g u l a rv a l u ed e c o m p o s i t i o n t w o d i m e n s i o n a ld i s c r i m i n a 砒a n a l y s i s b i c l u s t e r i n g f a c er e c o g n i t i o n m i c r o a r r a y a n a l v s i s 第v i i i 页 共1 1 9 页 论文原创性声明 本人郑重声明 所呈交的学位论文 是本人在导师的指导下 独立进行研究工 作所取得的成果 除文中已经注明引用的内容外 本论文不包含任何其他个人或 集体已经发表或撰写过的作品成果 对本文的研究作出重要贡献的个人和集体 均已在文中以明确方式标明 本人完全意识到本声明的法律结果由本人承担 学位论文使用授权声明 本人完全了解中山大学有关保留 使用学位论文的规定 即 学校有权保留 学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版 有权将学 位论文用于非赢利目的的少量复制并允许论文进入学校图书馆 院系资料室被查 阅 有权将学位论文的内容编入有关数据库进行检索 可以采用复印 缩印或其 他方法保存学位论文 导师始u 昌游 日期 钟年r 月1 日 当日 沪厌 少q 名 f 撇俨 作 严 文 弘 脚 可 凌 h p 孙丫 轹j 糍p一臂 文 矽 敝 矽 位 期 1 1 高维数据 第一章绪论 随着计算机技术的发展 人们经常会遇到各种类型的海量数据 如航天遥感数据 生物数据 图像数据 金融市场交易数据和网络数据等 在统计处理中通常称之为高维 数据 卫星遥感图像 人类基因表达数据 图像数据 金融市场交易数据等等 其表象 均是高维的 以人脸识别里的人脸图像为例 按通常的处理办法是把人脸图像转换成向 量 如一幅大小为n 2 9 2 的图像必须转换成维数为1 1 2 9 2 1 0 3 0 4 的向量 从而每幅图 像均可看作1 0 3 0 4 维空间的一个观测 因此 向量的维数非常高 但是观测点的数目却比 较少 往往只有几百或几千个 又如 微阵列数据分析里的基因表达数据 人类大约含 有3 5 万个基因 基因表达矩阵中至少有数千个 有时甚至几万个基因 而样本数可能 只有几十个 这种类型的数据在机器学习的术语里称为高维小样本f 1 3 1 下面对本文应用的领域 生物特征识别和微阵列数据分析 分别进行详细的介绍 在 这些应用领域中都需要处理高维数据 1 1 1 生物特征识别 随着科学技术的突飞猛进 计算机及网络的高速发展 信息的安全性 隐蔽性越来 越重要 传统的身份验证和识别方法 如身份证 工作证 智能卡 密码等存在携带不 便 容易遗失 因使用过多或不当而损坏 不可读和密码易被破解等诸多问题 因此 目前广泛使用的依靠证件 个人识别号码 口令等传统方法来确认个人身份的技术面临 着严峻的挑战 并越来越不适应现代科技的发展和社会的进步 生物特征识别是通过利用个体特有的生理和行为特征来进行身份识别和 或 个体验 证的一门科学 依据各种生物特征 可将对它们的识别分别应用于不同的领域 生物特 征识别技术可分为基于生理特征的生物识别技术和基于行为特征的生物识别技术 各种 生物特征的分类见图l l 第1 页 共1 1 9 页 第一章绪论 图1 1 生物特征的分类 经过数十年的研究 生物特征识别在人脸 虹膜 指纹 手型 掌纹 签名等方面都 取得了一定的成功 1 人脸识别技术 人脸识别是基于生物特征进行身份认证中最主要的方法之一 基于人脸识别的自动身 份认证具有重要的理论意义和应用价值 早在六七十年代就引起了研究者的强烈兴趣 对人脸自动识别方法的研究已成为当前模式识别和人工智能领域的一个研究热点 4 5 它的研究涉及到计算机图形学 计算机视觉 模式识别 机器学习 感知科学 人工智 能 计算智能等诸多学科的知识 并与基于其它生物特征的身份鉴别方法以及计算机人 机感知交互的研究领域都有密切联系 与指纹 视网膜 虹膜 d n a 掌纹等其它人体 生物特征识别系统相比 人脸识别系统具有直接 友好 方便的特点 易于为使用者所 接受 人脸识别技术应用背景十分广泛 可用于公安系统刑侦破案的罪犯身份识别 身份 证及驾驶执照等证件验证 银行及海关的监控 自动门卫系统 视频会议 机器人的智 能化研究以及医学等方面 正因为人脸识别应用的广泛性与挑战性 人们提出了许许多 多有关人脸识别的算法 另外关于人脸识别的理论也有了长足的发展 关于这方面的文 章 可参考人脸识别的综述 4 5 人脸识别主要分为人脸检测 人脸特征提取和人脸识别三个过程 人脸检测是指对任 意给定图像 检测其中是否有人脸存在 如果有 给出人脸的位置 大小等状态信息 人脸检测问题的难度主要在于三方面 一是人脸具有外貌 肤色 表面粗糙度以及表情 等模式可变性 二是可能存在眼镜 胡须甚至伤痕等附属物 三是人脸作为三维影像不 第2 页 共1 1 9 页 己囱 蠹囱 1 1 高维数据 可避免地受到光照影响 人脸检测的结果直接关系到后面两个过程的准确性 近年来 人脸检测已成为独立的研究课题受到研究者的关注 人脸特征提取是将现实空间的图像映射到机器空间的过程 人脸的表征具有多样性和 唯一性 只有保持这种多样性和唯一性 才能保证人脸图像的准确描述和识别 人脸图 像信息数据量巨大 为了提高检测和识别的运算速度 提高图像传输和匹配检索速度 必须对图像进行数据压缩 降低向量维数 即用尽可能少的数据表示尽可能多的信息 事实上 特征提取是许多方法及理论中研究的重中之重 总的来说 这些方法与理论的 目的就是找出一种在较低维空间中具有较大判别能力的人脸特征表示技术 计算机人脸识别的研究始于6 0 年代末 近几十年来人脸识别研究逐渐发展 并在9 0 年 代成为科研热点 人脸识别就是对新的人脸用所得出的特征表示出来并进行识别分类 6 1 虽然人类能够很容易地识别人脸及表情 但人脸的自动机器识别却是一个极其复杂 的课题 这主要表现在 人脸是非刚体 存在表情变化 人脸随年龄增长而变化 人脸 所成图像受光照 成像角度及成像距离等影响 此外人脸识别技术研究与相关学科的发 展及人脑的认识程度紧密相关 这诸多因素使人脸识别研究成为一项极富挑战性的课 题 目前 大部分人脸识别的工作是基于二维图像 5 因为人脸是一个三维对象 它的 二维投影对姿势 光照 表情的变化比较敏感 因而利用三维人脸信息可以改善人脸识 别的性能 7 1 1 2 基因芯片数据分析 基因 g e n e 作为一个基本的遗传功能单位 也称为遗传因子 它的原始功能是 编码组成蛋白质或多肽的氨基酸序列 基因是可以转录成心a 的基因组片断 如果这 种r n a 是编码蛋白质的 称为信使r n a m r n a 它能翻译成蛋白质 这类基因就称 为编码蛋白质基因 如果r n a 是非编码的核糖体r n a r r n a 和转运r n a t r n a 它不能翻译成蛋白质 这类基因就称为编码r n a 基因 基因的转录是基因表达的第一步 也是基因表达调控的关键步骤 在这一过程中 基因组中的基因将在不同的转录信号调控下 开放或关闭该基因地表达 呈现不同的表 达程度及不同的表达方式 基因转录的几个关键步骤 转录起始 转录延伸 转录后加 工 转录起始指转录起始蛋白复合物在基因上游的组装 这些蛋白复合物负责将d n a 转 第3 页 共1 1 9 页 第一章绪论 录成r n a 基冈能否表达是由这一步决定的 转录的延伸r n a 聚合酶沿基冈移动合成初 级转录本 即基因的直接拷贝 转录后加工是对初级转录本的加工和修饰 转录的调控 也针对这三个步骤 其中最重要的是在转录起始阶段的调控 这是基因能否表达的关 键 基因的转录与翻译过程见图1 2 秽躁 蓥 洲职 意 毒 图1 2 旗渊的转录与翻泽过程 该图引自t h eh u m a ng e n o l n ep r o j e c t a t h t t p r w w o r n l g o v h g m j s p r o j e c t i n f b h t m l 随着人类基因组草图绘就的完成 人类基因组研究计划 h u m a ng e n o m e p r 0 j e c t h g p 进入到了后基因组时代 序列的解码仅仅是获得一部 天书 为 今后全面认识人基因组的功能提供了结构基础 但要读懂这部 天书 还需要解码这 些d n a 的生理功能 后基因组时代研究的重点由基冈序列研究上升为基因功能研究 旨 在弄清从基因组到蛋白组 冉到复杂生命系统运行的奥秘 基因功能组学 f u n c t i o n a l g e n o m i c s 是以全面研究所有基因功能为中心 并结合基因功能解决生物医学中的基础和 应用问题 如此庞大的系统 利用传统的方法是无法完成的 科学家们既需要研究成千 上万条基因的功能 又需要研究基因之间表达与调控的复杂网络关系 这迫切需要高效 的方法和实验手段 能大规模 高质量检测众多基因在各种生理状态下的表达全貌 生 物芯片技术是对传统技术的一 个重大突破 为同时研究成千上万个基凶提供了高通量的 第4 页 共1 1 9 页 1 1 高维数据 解决方案 生物芯片也称微阵列芯片 主要包括c d n a 微阵列 寡核苷酸微阵列 蛋白质微 阵列和小分子化合物微阵列 基因芯片又称d n a 芯片 是专门用于核酸检测的生物 芯片 也是目前运用最广泛的微阵列芯片 1 9 9 1 年 f o d o r 等人首次提出d n a 芯片的概 念 之后短短几年 以d n a 芯片为代表的生物芯片技术就得到了迅猛发展 其中 美 国a 母m e t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论