Stereo Vision

基于双目视觉的 位置追踪与定位技术

双目视觉通过两台摄像头同时拍摄场景,分析视差(Disparity)并计算深度(Depth)信息,从而对物体进行三维识别。通过该技术可以精准推算人员、车辆、资产的距离与位置,在现场环境中也能支持稳定的定位与实时位置追踪。

什么是双目视觉?

双目视觉是一种使用两个摄像头拍摄图像,并据此推算3D空间深度信息的计算机视觉技术。为此,两个摄像头从不同位置拍摄同一物体,利用获取的图像对计算深度信息。具体通过计算两幅图像之间的视差(disparity)来推算深度。 该技术与人类利用双眼推算深度信息的原理相似。通过它可以在3D环境中掌握物体的位置和距离,广泛应用于机器人工程、自动驾驶汽车、视频游戏、图像处理等多个领域。相比传统的计算机视觉技术,它能提供更准确、实用的结果,在各种应用领域中发挥着重要作用。

基于双目视觉的RTLS特长

基于双目视觉的RTLS(实时定位系统)是通过分析由两个摄像头采集的视觉信息,实时追踪并监控物体或人员位置信息的系统。 这种双目视觉可以实现非常精准的位置推理,保证高准确度和可靠性。此外,由于可以实时更新位置信息,因此能在物流、制造、建筑等领域提供重要的实时位置信息。 另外,基于双目视觉的RTLS不使用标签(Tag),因此无需购买和维护针对目标的额外标签或信号发生设备。这降低了系统构建成本,减少了系统维护费用,在成本方面非常高效。同时,由于目标位置追踪的准确性和可靠性很高,在成本效益和系统性能方面都非常优秀。因此,基于双目视觉的RTLS是能同时实现成本降低和性能提升的极具实用价值的技术。

基于双目视觉的定位是如何运作的?

物体检测 (Object Detection)

在基于视觉的RTLS中,使用深度学习物体识别技术来追踪图像中的目标。该技术是经过学习的深度学习算法,可以识别并分类图像中的各种物体。目前可识别约80种物体,并可根据客户要求通过追加学习识别更多种类的物体。

深度估计 (Depth Estimation)

为了追踪物体位置,我们利用从不同角度拍摄的2张图像来推导深度信息。这与人类使用双眼感知空间深度的原理相似。我们采用了深度学习技术,相比传统的计算机视觉技术,能更准确地感知深度。

坐标计算 (Coordinate Calculation)

利用计算机视觉技术执行物体识别、距离估计、角度计算等,从而计算物体的位置信息。通过该技术可以实现实时追踪物体、掌握位置等多种应用。

ORBRO双目视觉RTLS的核心技术

原始图像流 (Original Image Streaming)
为了提高RTLS中的位置追踪准确度,高水平的深度图推理技术必不可少。人类可以通过经验和直觉,仅凭大致轮廓就能快速准确地感知距离,但深度图技术专注于图像细节,精密的推理直接关系到位置追踪。因此,我们不使用普通CCTV中使用的有损压缩视频流方法,而是利用无损视频来最大限度地减少低级特征(Low Level Feature)的损失。通过这种方式,基于双目视觉的RTLS最大限度地减少了位置信息的损失。
通过利用无损原始视频,深度图中物体的表面表现得更加连续。
Predict Image

推理背景

Original Image

原始

Encoding Image

编码

高级深度估计 (Advanced Depth Estimation)
利用双目摄像头图像进行深度推理一直是计算机视觉研究领域关注的重点。特别是近10年来,应用深度学习方法显示出了比以前传统算法更卓越的结果。然而,许多领域仍在延用传统算法的原因是它们能保证适当的准确度和高实时性。这通常意味着可以以15 FPS以上的帧率进行处理。
Others Picture Image
Others Vision Image

使用计算机视觉的他社深度图

利用传统计算机视觉算法的深度推理结果在细节部分和物体轮廓处存在发生扭曲的问题。例如,握鼠标的手的上部或被隔板遮挡的人头等部分无法被推理出来。但是,我们开发的基于深度学习的模型克服了这些问题。该模型针对“基于双目视觉的RTLS”进行了优化,通过轻量化和微调保证了实时性(>15 FPS)。虽然在处理多个摄像头输入时,处理速度可能会降至约4 FPS,但考虑到画面中人员的移动速度,仍能提供令人满意的位置信息。
Orbro Picture Image
Orbro Vision Image

使用深度学习的ORBRO深度图

深度估计微调 (Depth Estimation Finetuning) 技术
自然光和人造照明下拍摄的图像具有不同的特性,即使照明仅照射在双目摄像头的一个镜头上,这种情况也会出现。此时,由于左/右图像传感器的曝光值差异,左/右图像的特性会变得不一致。
Light Left Image
Light Right Image

由于照明直接照射导致的左右双目图像特性差异

除了这些外部环境因素外,还必须考虑双目摄像头制造过程中可能产生的内部因素。例如,将图像传感器安装到电路板上时可能发生的上/下对齐误差或旋转误差,以及镜头与图像传感器之间距离变化导致的倍率差异等。
WideLens Deviation A Image

(a)

WideLens Deviation B Image

(b)

WideLens Deviation C Image

(c)

WideLens Deviation D Image

(d)

广角镜头导致的扭曲模式及摄像头A、B间的个体偏差 (绿色:2.7m,紫色:6.3m,红色:8.8m)

为了解决这些问题,精确建模扭曲模式并进行校正使其与实际深度一致的过程是深度推理技术的重要组成部分。这一校正过程必须考虑摄像头的个体不确定性,例如镜头生产过程中产生的偏差或组装工序中产生的偏差。如果不应用扭曲校正模型,广角双目摄像头推算的深度值通常会出现30%以上的偏差。但如果应用扭曲校正模型,不仅可以消除这些误差,还能获得使深度推理平均误差率降低约50%的效果。因此,我们在所有双目摄像头出货前,都会利用自主开发的高级扭曲校正模型进行校正。通过这种方式提供优秀的深度推理技术,为客户提供最佳的性能和可靠性。

双目视觉的主要优点

准确的位置推算

使用双目摄像头可以同时获取两张图像,从而在三维空间中准确把握物体的位置。通过这种方式可以精确推算物体的位置和运动。

可扩展性

双目视觉技术不受空间大小限制,可应用于各种规模和类型的室内外环境。此外,基于双目摄像头的RTLS系统可以根据需要通过追加传感器来扩展功能。

成本效益

与其他位置推算技术相比,双目视觉技术相对便宜。此外,由于可以利用现有的双目摄像头构建RTLS系统,因此可以降低安装成本。

通过双目视觉实现的 ORBRO解决方案

通过基于双目视觉的RTLS精准连接资产与人员的实时位置数据,查看各现场的代表性解决方案。

实时管理停车场车辆流向,减少拥堵
公共机构解决方案

实时管理停车场车辆流向,减少拥堵

利用针对停车场优化的AI技术,实时掌握车辆位置和各空间效率,并调整停车流向

了解更多
实时感应行人动态,提前预防交叉路口事故
公共机构解决方案

实时感应行人动态,提前预防交叉路口事故

利用基于AI的感应技术识别人行道周围的行人,并自动向车辆发出危险警告

了解更多
自动统计钢铁资产库存并分析流向
制造解决方案

自动统计钢铁资产库存并分析流向

利用AI自动记录卷材和板材的分时段库存,并直观分析资产流向

了解更多
实时感应危险行为,即时应对校园安全
学校解决方案

实时感应危险行为,即时应对校园安全

通过AI视频分析实时感应学生的暴力或跌倒迹象,并立即向管理员发送通知

了解更多
咨询引入

咨询引入

与专家一起引入位置追踪解决方案

提供世界级的技术与经验。

基于双目视觉的位置追踪与定位技术 :: ORBRO | 位置追踪与数字孪生专业平台