AR眼镜AI用例盘点:从单薄的功能一窥广阔的生命力_第1页
AR眼镜AI用例盘点:从单薄的功能一窥广阔的生命力_第2页
AR眼镜AI用例盘点:从单薄的功能一窥广阔的生命力_第3页
AR眼镜AI用例盘点:从单薄的功能一窥广阔的生命力_第4页
AR眼镜AI用例盘点:从单薄的功能一窥广阔的生命力_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AR眼镜AI用例盘点:从单菌的功能一窥广阔的生命

今年Connect大会上,扎克伯格抛出了一个有意思的话题:〃让我特

别感兴趣的一个领域是,如何将AI的进步与下一代计算平台相结合。〃

伴随着因ChatGPT爆火而引发的新一轮热潮,AI开始加速与千行百业

融合,如今年三月微软宣布将GPT接入Office办公套件,谷歌将其AI

助手Bard集成到谷歌日历等应用全家桶中等。

同样,对于AR或者是其他可穿戴式设备而言,AI也成为了其不可或缺

的卖点之一。本文将对目前AR眼镜上的主流AI功能进行盘点,一窥

技术发展趋势。

以AI驱动的可穿戴式设备,图源:Humane

一、MetaAI引入智能眼镜;ARKnowAl支持AI三件套

早在GPT爆火之前,VR、AR产品中已经出现了很多有关AI的用例,

如结合了AI算法的手势识别、基于AI预测用户的全身追踪等。不过这

些功能多停留在用户无法直接感知的隐性层面。现如今随着LLM.AIGC

等技术的发展,AI进一步走到了台前。

以Meta最近发布的新T弋智能眼镜产品Ray-BanMeta为例,它与老

款产品比较重要的差异点在于,产品正式实现了对MetaAI的支持。

Meta官网指出,MetaAI由Llama2大模型驱动,并与微软Bing搜

索引擎达成了合作,目前已经可以通过Instagram、WhatsApp等Meta

社交平台进行访问。

今年MetaConnect期间,扎克伯格对于MetaAI进行了演示(基于

其社交APP),MetaAI具备很强的上下文理解能力,可以快速响应用

户的各种提问。此外,它还集成了Meta的AI图像生成工具Emu,可

以基于用户的需求生成相应的图片。

MynameisMetaALThinkofme

likeanassistantwho'shereto

helpyoulearn,plan,andconnect.

oWhatcanIhelpyouwithtoday?

…a

图源:Meta

除应用于自家社交平台,MetaAI还搭载到了自家的硬件产品Ray-Ban

Meta中。由于Ray-BanMeta并没有配备屏幕,所以只能以语音的方

式输出,这使得它并不能承担太多复杂的工作。基于发布会演示,Meta

AI的作用主要体现在两方面:一是偏向于功能交互的场景,如通过语音

命令拍摄照片,通过语音将图片视频分享到Messenger等;二是充当

一个类似于ChatGPT式的AI助手的角色,用户可以与之进行闲聊、询

问出行建议等。

除MetaAI外,扎克伯格透露明年将会为Ray-BanMeta新增更多AI

的能力,如用户在旅游时可以通过AI询问眼前建筑的具体信息;协助

翻译外语广告牌上面的内容、询问水龙头的一些维修建议等。

Ray-BanMetaAI功能的落地离不开新处理器骁龙ARIGenl的应用,

据了解,该处理器可实现眼镜侧AI,这使得硬件厂商可以在眼镜中接入

系列AI模型。高通官网指出,骁龙ARIGenl搭载了第三代Hexagon

NPU和用于视觉分析的AR级引擎,可用于增强图像和音频质量、视

觉搜索、实时翻译等。

近日,雷鸟创新官宣了其下T弋AR眼镜新品雷鸟X2Lite,产品同样

搭载骁龙ARIGenl,具备更强的AI能力也是产品的重要卖点之一,

产品可实现实时翻译、智能出行建议等AI功能。

ixak

supplyar

COMINGNEXTYEAR

图源:Meta

除Ray-BanMeta以及雷鸟X2Lite,今年以来发布的大多数AR眼镜

产品均配备了AI相关能力,比较典型的是致敬未知于今年7月发布的

致敬未知创始人吴德周曾表示,〃和的结合一定

ARKnovvAloAIAR

是方向,我们希望能够深度结合AI,让AR眼镜真正能够成为更有效率、

更好玩的工具。"

产品定位方面,ARKnovvAl与Ray-BanMeta有较大不同,前者采

用分体式设计,但是补充了双目Micro-OLED屏幕。此外,前者配备

了单目摄像头,但并不聚焦于拍照摄影,而是用于实现SLAM等相关

玩法。

在AI功能方面,ARKnovvAl分为了三大块:基于AI大模型驱动的语

音助手、借助摄像头以及CV实现的现实大爆炸(可识别建筑物、植物、

餐厅等)以及基于开源绘图大模型StableDiffution打造的AI图生图

功能。

A^KFIOVVIAR三大件

AR导航

手机相册秒变3D空间全程抬头显示“永远不低头”法见什么炸M

一键风格化

图源:致敬未知

近日李未可茹忆公布了其下T弋眼镜李未可

CEOARMetaLensS3O

茹忆认为,当下AI在交互计算平台领域的重要性越来越突出,AI交互

能力将成为AR眼镜的核心能力。

产品方面,李未可团队正在将AI大模型深度整合到AR眼镜中,AI模

型采用〃重云轻端云端一体〃的搭建模式,云端构建以认知、推理、

服务、任务等模型为基础的AI大脑,并实时响应AR终端的用户需求。

二、除增强现实、AI如何赋能产品构建更前沿的生活方式

可以发现,如何结合AI为用户提供更加高频更加有趣的玩法已经变成

了如今AR/智能眼镜产品所探讨的重要议题。不过由于产品多聚焦于大

众消费市场,使得功能也相对趋同,当然也有厂商试图从中挖掘更加垂

直化的用例。

如海外企业Envision专门面向视障群体开发了一款眼镜产品Envision

该产品基于开发而来,产品搭

GlassesoGoogleGlassEnterprise2

载骁龙XR1,配备800万像素摄像头。由于产品面向视障群体,它更

依赖于AI所支撑的环境感知以及理解能力,而屏幕或者AR反倒成为

了无关紧要的功能。

以下是EnvisionGlasses所对外展示的一系列用例:

•可以扫描书籍、信件等手写或印刷文本信息并通过语音的方式向

用户播报,它可识别超过60种语言;

•借助摄像头进行第一视角的通话;

•从一堆白色的衣服中挑出红色的袜子,判断室内的灯是否亮着;

•识别亲人朋友等,提醒用户打招呼。

图源:Envision

值得一提的是,Envision的前身是一家OCR和物体识别应用开发商,

2017年,企业上线《EnvisionAI》APP,该APP同样瞄准了视B赣体。

EnvisionGlasses需要搭配其手机APP使用,官网指出眼镜在正常情

况下可提供约5-6小时的使用时长。

图源:Envision

扎克伯格曾表示眼镜将会是AI最佳的硬件载体之一,因为眼镜能够见

你所见、听你所听,很好洞悉用户的一切。不过,这并不只是当前的唯

一解。

今年9月底,TheInformation爆料称,OpenAICEOSamAltman、

软银集团CEO孙正义与前苹果首席设计师JonyIve进行了洽谈,三方

或将成立一家专注于研发新一代AI硬件的新公司,不过对于AI时代下

的新硬件究竟会是什么样子,目前他们仍没有达成共识。

10月中旬的WSJ公开采访中,Altman曾表示AI时代下计算机可以

独立思考,所以什么样的硬件都有可能,它或许是新一代手机、或许是

智能音箱、甚至有可能是某种AI驱动的机器人。不过外界猜测称,关

于前沿AI硬件最佳实践或许正是Altman曾多次投资的科技企业

Humaneo

Humane团队打造了一款AI投影设备AIPin,设备体积小巧,可像一

枚胸针一样挂于胸前。该产品集成了无唤醒词的AI助手,除此之外,

AIPin内置了一个投影模组,它可将一些来电联系人等简单的信息投射

于手掌中。

据了解,AiPin将会搭载专用系统,甚至有可能会结合OpenAI的

GPT-4,基于过往的一些案例,用户可以向设备发送拨号指令、询问就

餐建议、旅行安排、检测食物卡路里等。此外,AiPin的AI助手还将

具备一定的上下文联系能力。

其他方面,AiPin售价可能会高达1000美元,配备高通骁龙芯片,性

能可以比肩智能手机。此前该产品已经在9月底的巴黎时装秀上有所亮

相,并即将于11月9日召开新品发布会。更多信息可查看VR陀螺过

往文章《iPhone核心团队成员创业,融资2.3亿美元,要做〃另类〃

下一代计算平台》。

图源:Humane

三、AI持续进化,未来眼镜终端还将如何发展?

目前AR眼镜/智能穿戴仍处于探索期,而AI如何与新一代计算终端所

结合也同样如此。基于前面的一些硬件终端其实也不难发现,各家厂商

对于AI的理解以及侧重点会有一定差异,但是共识是AI将会在新一代

计算设备革命中发挥重要用途。

对此,茹忆则提出了一个简单明了的观点,如果AR眼镜是iPhone,

那么AI就是iOS,即AI将成为硬件驱动的核心。

从当前来看,眼镜产品上的AI用例仍多集中于基于LLM的语音助手、

简单的识图功能等,目前的佥仍相对单薄。此外,由于隐私以及设备续

航所限,设备的AI能力很多时候只能处于被动触发状态,如只有按下

按钮或者呼出特定语音指令才能有所响应(这有点类似于搜索与信息推

送的差异)。这种单项互动在一定程度上阻碍了AI功能的黏性。

此外,根据海外平台SparkToro调查数据f聊天机器人模型ChatGPT

的用户会话中,编程协助以及教育用途最为广泛,分别达到了29.1%和

11.9%,而聊天互动等私人用途占比反而并不算高。未来,如何实现大

语言模型与眼镜终端更为有机的结合也是一个值得持续思考的问题。

图源:SparkToro

其他方面,AR眼镜的算力薄弱,目前仍以云端侧AI为主。高通今年发

布《混合AI是AI的未来》白皮书里面提到,云端和终端协同处理的混

合AI是AI的未来,这样才能高效推动AI规模化落地,并发挥其最大

潜能。随着端侧AI能力的增强,未来设备可以构建更加个性化以及安

全的AI助手,可以在离线状态下工作,并且响应速度也会更快。

而AGI(通用人工智能)是AI的下一个发展阶段,AGI具备更强的感

知、推理与学习能力,未来当AGI引入A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论