Monocular Vision
基于单目视觉的 位置追踪及定位技术
单目视觉(Monocular Vision)是利用单个摄像头获取并分析图像的计算机视觉技术。与其相对应的是双目视觉(Stereo Vision)技术,双目视觉使用两个摄像头测量深度并将其应用于定位。
什么是单目视觉?
单目视觉是利用单摄像头获取二维图像信息的视觉技术。该技术非常简单,只需普通的单摄像头即可轻松实现,因此被广泛应用于诸多领域。由于其易于导入的特性,在各种工业领域得到了广泛应用。 单目视觉应用于目标识别与追踪、自动驾驶、机器人工程等多个领域。例如,在目标识别领域,利用深度学习算法识别并追踪单目图像序列中的目标技术已普及。此外,在自动驾驶领域,它被用于识别道路上的车道线、信号灯、标志牌、行人等,并估算周围车辆的位置和速度,以确保安全行驶。
基于单目视觉的RTLS特点
单目视觉技术由于使用单摄像头,构建系统的成本相对较低。与双目摄像头相比,单摄像头的单价较低,因此在进行大规模安装或广域RTLS构建时,比其他技术更具成本优势。此外,结合机器学习技术,可以根据先前学习的数据实现精确的位置估算。这保证了高准确度,利用最新的深度学习技术,即使数据量较少也能进行学习,从而降低了构建和运营成本。 基于单目视觉的RTLS不需要标签(Tag),与传统的RTLS相比,具有显著的成本节约效果。无需单独的标签终端意味着安装和运营更简便,与现有设施的兼容性更高,易于导入。此外,由于不需要安装用于接收标签信号的设备(基站/Anchor),提高了空间利用率,并以此为基础提升设施效率。
基于单目视觉的定位是如何工作的?
目标检测 (Object Detection)
在基于视觉的RTLS中,使用深度学习目标检测技术来追踪图像中的目标。该技术是经过学习的人工智能算法,可以识别并分类图像中的各种物体。目前可识别约80种物体,并可根据客户需求通过追加学习识别更多种类的物体。
透视变换 (Perspective Transform)
利用透视变换(Perspective transform),可以将二维图像上的特定点转换为现实世界的坐标。为此,利用摄像头的内外部参数构成相机矩阵,并使用该矩阵将二维图像上的点转换为实际空间中的点。
基于单目视觉的RTLS与基于双目视觉的RTLS有何不同?
单目视觉和双目视觉的工作原理基本不同。单目视觉仅使用一个摄像头追踪物体位置,而双目视觉使用两个摄像头,并利用两个摄像头之间的视差信息来追踪物体位置。单目视觉可以以较低的成本实现,且安装和维护简便。然而,由于仅凭摄像头提供的二维图像追踪物体位置,其准确度和可靠性可能相对较低。 相比之下,双目视觉由于硬件实现的复杂性,其导入及安装在内的总成本高于单目视觉,软件处理也更复杂。即使处理相同的图像,由于需要计算视差,双目视觉RTLS比单目视觉RTLS需要更多的计算资源。因此,选择哪种技术实现RTLS可根据用途和预算等因素综合决定。
单目视觉的主要优点
成本相对低廉
单目视觉仅使用一个摄像头,因此硬件构成成本低廉。此外,由于使用单一图像传感器,软件处理也相对简单,计算能力要求较低,即使使用低配置硬件也能实现。
安装限制少
无论摄像头安装在何处,单目视觉都能追踪物体的位置和移动。这意味着其应用领域非常多样。例如,室内位置追踪、自动驾驶车辆的行人检测与追踪、体育赛事中的运动员追踪等。
应用领域广泛
该技术仅需一个摄像头即可追踪物体,因此安装和维护简单且成本低。因此,可应用于日常生活中广泛使用的智能家居、机器人、汽车等领域。
利用单目视觉实现的 ORBRO解决方案
通过基于单目视觉的RTLS精准连接资产与人员的实时位置数据,查看各现场的代表性解决方案。




