基于KongTech立体视觉的实时定位系统(RTLS)核心技术
原始图像流传输
为了提高RTLS的位置跟踪准确性,高水平的深度图推断技术是必不可少的。人们通常通过经验和直觉就能快速准确地识别出物体的大致轮廓并估计距离,而深度图技术则着重于图像的细节,直接影响位置跟踪的精确推断。因此,我们不使用普通CCTV中常用的图像有损压缩方法,而是利用无损图像来最小化低级特征的损失。这样,基于立体视觉的RTLS能够最大程度地减少位置信息的损失。
利用无损原始图像的深度图表现出物体表面更加连续。
高级深度估计
应用立体相机图像进行深度推断在计算机视觉领域受到极大关注。特别是最近10年,应用深度学习方法比传统经典算法表现出更优异的结果。然而,许多领域仍然使用传统经典算法,因为它们可以保证适当的准确性和较高的实时性。通常,这意味着可以处理每秒超过15帧的帧率。

使用第三方深度图的计算机视觉
利用传统计算机视觉算法进行深度推断的结果存在问题,例如细节部分和物体边缘出现畸变。例如,手持鼠标的上部或被隔离墙挡住的人的头部等部分未能被推断出来。但是,我们开发的基于深度学习的模型克服了这些问题。该模型已经优化,以供"基于立体视觉的RTLS"使用,并通过轻量化和微调来保证实时性(>15 FPS)。但是,如果处理多个相机输入,处理速度可能会降低到约4 FPS,但在考虑屏幕上人物移动速度时,仍能提供令人满意的位置信息。

使用深度学习的KongTech深度图
深度推断微调技术
采用自然光和人工照明拍摄的图像具有不同的特性,即使在立体相机的一个镜头上也可能出现光照差异。在这种情况下,左/右图像传感器的曝光值差异会导致左/右图像的特性不一致。
由直接光照引起的左/右立体图像特性差异
除了这些外部环境因素,还必须考虑在立体相机制造过程中可能发生的内部因素。例如,安装图像传感器时可能出现的上/下对齐误差、旋转误差以及镜头和图像传感器之间距离变化导致的缩放差异等。

(a)

(b)

(c)

(d)
(a): 亮度差异, (b): 图像传感器旋转误差, (c): 图像传感器上/下对齐误差, (d): 焦距误差
通过克服这些现实问题,基于立体视觉的RTLS可以提供高可靠性。KongTech的深度估计微调技术和专业知识使这成为可能,并最终使深度估计技术不依赖于特定硬件,且在环境变化下仍能正常运行。
考虑相机的目标偏差计算距离
使用立体相机获取的图像通过基于深度学习的深度推断技术转换时,会出现由广角镜头引起的深度失真问题。这种失真随着距离的缩短而增加,从光轴越远,表现出更加非线性的行为。

相机 A

相机 B
广角镜头引起的失真现象和A、B相机之间的目标偏差
(绿色:2.7米, 紫色:6.3米, 红色:8.8米)
为解决这个问题,关键是准确建模失真现象,以使其与实际深度相匹配。这个校正过程是深度推断技术的重要部分,并考虑了相机在生产过程中可能发生的偏差或组装过程中的偏差等相机的个体不确定性。如果不应用失真校正模型,通常会在广角立体相机推断的深度值中观察到30%以上的偏差。但是,应用失真校正模型后,不仅可以消除这些误差,还可以将深度推断的平均误差率减少约50%。因此,我们在所有立体相机发货之前,使用我们自己开发的高级失真校正模型进行校正。通过这样做,我们能提供优秀的深度推断技术,为客户提供最佳性能和可靠性。
立体视觉的主要优势

使用立体相机,可以同时获取两幅图像,从而精确地识别物体在三维空间中的位置。通过这种方式,可以准确地估计物体的位置和运动。

立体视觉技术不受空间大小的限制,适用于各种室内和室外环境的不同规模和类型。此外,基于立体相机的RTLS系统可以通过添加附加传感器来扩展功能。

与其他位置估计技术相比,立体视觉技术相对较便宜。此外,由于可以利用已安装的立体相机来构建RTLS系统,因此可以减少安装成本。