智能眼镜近在眼前:辅助交互式远程指导,将有怎样的机遇与挑战?
引言
随着科技的发展,中国传统产业正在往智能化方向升级发展,以此赋能产业升级。
在这个大背景之下,国产黑科技AR智能眼镜应运而生,并悄悄崛起了。智能眼镜就是通过第一视角进行可视化,它可以实现远程指导、虚实结合等工作模式。
它不仅能提高国民的生活质量、工作质量,降低工作出错率,还能提高企业的生产量,降低企业安全隐患。
智能眼镜的辅助交互式远程指导,是研究者们广泛研究的课题。
那么智能眼镜辅助交互式远程指导,将会有什么样的机遇与挑战?未来的发展方向是怎样的?
研究简介
人们在日常生活中遇到的计算设备数量正在增加,除了台式计算机的典型外形尺寸之外,计算设备正变得越来越小、越来越丰富,并且无处不在。
由于被称为物联网的无数互联日常设备,“无处不在的计算”的愿景更加明显,无处不在的计算和物联网都强调以环境为中心的传感和通过环境智能提供服务。
另一方面可穿戴计算补充了上述以环境为中心的观点,通过始终在线、始终可访问和始终连接的可穿戴设备,实现的亲密第一人称视角。
无处不在的计算和可穿戴计算的快速发展,已经建立了一个可行的基础设施,可以远距离连接人们,以消除物理位置的障碍。
最近的新冠疫情大流行加速了此类技术的使用,其形式包括远程协作、在家工作、电话会议、在线教育和元宇宙,丰富了数字孪生、增强现实、虚拟现实、混合现实和扩展现实的各种配置。
在可预见的未来,有许多报告和调查支持可穿戴设备、XR和元宇宙的广泛传播和采用,根据数据调查的结果显示,XR的市场正在增长,到30年将分别达到7亿美元,到2021年将达到300亿美元。
相关机构的另一份报告预测,消费者在AR和VR技术上的支出约为2024.6亿美元,占36年全球AR和VR支出的53%。
可穿戴显示器
远程协作尝试消除远程工作人员之间的物理障碍,其中一种技术是共享远程工作人员的视图并将其显示在本地站点的显示器上的能力。
协作者佩戴的头戴式显示器(HMD)等,可穿戴显示器可以共享其他用户的视图,并自然地支持免提操作。
可穿戴显示器向佩戴者提供额外的信息,这一特性使得各种应用能够使用可穿戴显示器实现,可穿戴显示器可分为光学透视(OST)或视频透视(VST)显示器。
并且有许多权衡,在OST和HMD中,佩戴者可以通过放置在佩戴者眼前的半透明镜子自然地看到现实世界。
这些镜子将真实图像和计算机生成的图像的组合光学反射到眼睛上,而不会产生处理延迟或延迟,在VSTHMD中。
首先使用安装在HMD上的更宽视场的摄像机捕获现实世界,然后将计算机生成的图像以电子方式组合在捕获的视频上。该显示器具有足够的计算单元,可提供连接性和多模式用户接口。
基于触摸的用户界面
基于触摸的用户界面(UI)是许多远程指导系统中使用的常见直接交互样式,大多数用户已经熟悉智能手机和平板电脑上的触摸屏,因此基于触摸的UI不需要太多的培训时间。
但是在医疗和外科领域,严格限制或禁止使用手以保持卫生,对于其他领域,可穿戴设备的基于触摸的UI很受欢迎。
基于语音的用户界面
基于语音的UI是远程指导系统中的另一种常见交互方式,导师和学员之间使用基于语音的UI来提供及时的反馈,并使用对话进行口头交流以请求适当的指导。
与触摸的UI不同,基于语音的UI可以完全免提实现,避免了医疗和外科远程指导的卫生问题,使用自然口语是直观和高度表现力的,此外语音识别器的性能最近通过人工智能大大提高。
涉及许多扬声器、嘈杂的工作场所、麦克风质量,以及大量词汇要求的情况和环境会带来实施和部署问题。
麦克风与用于远程指导的设备集成在一起,以前使用智能眼镜的远程指导研究,提供了基于语音的UI的变体。
基于手势的用户界面
基于手势的UI主要是指在远程指导系统中利用手势,部分商用智能眼镜通过计算机视觉或单独的控制器提供手部跟踪。
不利的一面是,表现力较差的基于手势的UI通常需要额外且昂贵的传感器、处理单元和大量计算。
一些研究在其系统中纳入了基于手势的UI,并演示了典型的基于手势的非接触式交互样式。
伸缩用户界面
望远镜是指可以在静止图像或视频图像上绘制草图的设备,在许多远程指导系统中,类似的指向、注释和绘图功能称为远程。
这种远程传输使导师能够直观地指导,并快速指出感兴趣的领域,此外学员的遥测可用于突出问题区域,综述中的几项研究也在其系统中使用了某些形式的遥测,通常使用基于语音的UI。
其他类型的用户界面
还有其他交互方式,例如使用有形的UI、脚踏和头像,认为使用脚踏板可以很好地配合上述类型的UI,并弥补这些交互样式的缺点。
脚踏板可以取代医疗和外科环境中的设备上和基于触摸的UI,此交互样式可用于确认正确识别的手势,或取消错误识别的手势。