冰点科技
BUILD DREAM
3D 机器视觉为什么将逐步取代 2D 识别技术?
来源:与非网 | 作者:YUAN LI | 发布时间: 1498天前 | 968 次浏览 | 分享到:
3D 机器视觉为什么将逐步取代 2D 识别技术?

机器视觉是指利用相机、摄像机等传感器,配合机器视觉算法赋予智能设备人眼的功能,从而进行物体的识别、检测、测量等功能。简单说来,机器视觉就是用机器代替人眼来做测量和判断。

机器视觉是在 20 世纪 50 年代从统计模式识别开始的,当时的工作主要集中在二维图像分析和识别。如今,随着 5GAI 等技术的日益发展,为机器视觉的升级带来可能,将加速信息显示从二维向三维过渡。

3D 机器视觉为什么将逐步取代 2D 识别技术?

三维机器视觉是在二维机器视觉的基础上增加了物理空间的深度信息,更全面、更真实地记录了物理世界。因此,业内一致认为三维机器视觉技术是机器视觉领域新的技术突破,也是机器视觉领域新的商业风口。

目前,机器视觉是正在快速发展的一个领域,正处于不断突破、走向成熟的阶段。它的发展不仅将大大推动智能系统的发展,提高生产效率和自动化程度,也将拓宽计算机与各种智能机器的研究范围和应用领域。

3D 视觉如何取代 2D?

纵观行业发展,2D 视觉虽为当前主流,但随着测量精度要求越来越高,被测物体条件越来越复杂,2D 系统的缺陷也愈发突出。目前市场上可见的 2D 识别,实质上属于软件层面验证技术,虽然能够做检测,但是存在可靠性不高、局限性、安全性差等诸多缺陷。

相比之下,3D 视觉技术在精度、灵活性和速度方面都是 2D 无可比拟的。的卢深视创始人兼 CEO 户磊向笔者说道,3D 机器视觉能够精准识别视野内空间每个点位的三维坐标信息,通过算法复原智能获取三维立体成像。不但可以提高测量和识别的效率,从三个维度获取信息,更增加了信息的准确性和可靠性。

从技术角度来看,普通的 2D 成像是用平面传感器接收被拍摄物体反射或者发出的可见光,从而形成二维图像。由于现实世界是三维世界,2D 成像存在物体特征信息损失的情况,这意味着 2D 成像并不支持与物体三维信息的测量。例如 3D 人脸识别、三维建模、人机交互、AR、智能安防等功能。

为了弥补 2D 人脸识别的不足,3D 人脸识别应运而生。3D 传感技术实现了物体实时三维信息的采集,为后期的图像分析提供了关键特征,智能设备能够根据 3D 传感复原现实三维世界,并实现后续的智能交互。

根据 Yole 的数据,2017-2023 年全球 3D 成像和传感器市场规模的复合年均增长率为 44%,预计 2023 年,3D 传感市场规模将达到 184 亿美元。

不难判断,在此趋势下,3D 机器视觉将面临较快的增长趋势,3D 视觉未来将逐步取代 2D 识别技术,在许多“痛点型应用场景”中大显身手,发展成为主流视觉系统。

安全问题凸显

众所周知,随着人脸识别技术的深入,千万级人脸大库的重要性日益显现。采集建库既是三维人脸识别应用的基础,也是三维人脸识别技术落地的关键。

近日《2019 年中国刷脸支付技术应用社会价值专题研究报告》显示,2019 年成为刷脸支付的“新元年”,刷脸支付用户将达到 1.18 亿人,到 2022 年有望突破 7 亿人,或取代扫码成为主流支付方式。现在人脸识别方式越来越为大众所使用,但关于个人信息安全等问题也随之而来。

对此,户磊表示,“人脸识别领域没有绝对的安全,安全是与成本息息相关的。从商业层面考虑,安全更多是取决于安全成本与作伪成本之间的考量。”

安全性上,的卢深视也有布局。一方面其算法已通过 BCTC 增强级认证,满足国家认证金融支付增强级安全标准,可实现高强度防作伪。

另一方面,的卢深视对于小群体应用场景产品做了针对性的设计,以其 3D-Face ID 一体化解决方案智能门锁为例,内嵌一颗 AIoT 专用芯片,人脸信息存储以及人脸比对均在门锁端完成。借助在金融支付行业内的丰富终端安全经验,打造了一个安全、受信的安全比对环境,外界是无法通过任何物理手段或者其他暴力拆解手段来获取模组内的私密个人生物特征信息。

基于成熟落地经验,的卢深视把三维机器视觉技术从高端安防领域切入金融支付、智慧社区、消费电子、商超零售、虚拟现实等垂直细分领域,要用成熟的三维全栈技术赋能百业千家。

目前市场上主流的3D 识别技术

近日,在 2020 全球人工智能产品应用博览会(AIExpo2020)的现场,的卢深视向与非网全面展示了其三维视觉全栈技术解决方案。

户磊介绍道,的卢深视深耕三维机器视觉领域近 5 年,是国内唯一打通“真三维”全栈技术、并实现国家级项目落地应用的公司。公司基于“云+端+芯”一体化战略,布局产品矩阵,下钻垂直行业应用领域,实现垂直整合及系统优化。公司可提供大规模普及的、交互距离内高精度的三维视觉感知产品及方案,产品形态涵盖 Edge AI 芯片、智能模组、通用产品和行业解决方案。

谈到三维识别技术方案,目前市场上主流的有结构光、ToF、双目视觉等三种 3D 视觉技术。

3D 结构光通过红外光投射器,将具有一定结构特征的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集。主要利用三角形相似的原理进行计算,从而得出图像上每个点的深度信息,最终得到三维数据。

ToF 是利用激光测距,照射光源一般采用方波脉冲调制,根据脉冲发射和接收的时间差来测算距离。

双目立体视觉则是基于视差原理并由多幅图像获取物体三维几何信息的方法。由双摄像机从不同角度同时获得被测物的两幅数字图像,并基于视差原理恢复出物体的三维几何信息,从而得出图像上每个点的深度信息、最终得到三维数据。

可以看到,三种 3D 视觉测量原理都有各自的优缺点。

与非网制图

就目前看来,3D 结构光是各大厂商普遍采用的技术。同样以的卢深视为例,的卢深视推出了两款基于 3D 结构光技术,针对安全需求高小型人脸库场景推出的自研国产 3D CV 相机:高精度 RGBD 相机(标准型)和 3D-Face ID 智能模组。

户磊进一步指出,公司自研的 3D CV 相机均已实现量产,在 3 米范围误差小于 1mm,指标超越国际 3D 相机巨头,且量产良率超 99%,精度全球领先,具备独家专利技术,高度自主可控。

的卢深视 3D-Face ID 智能模组

其中,高精度 RGBD 相机可用于刷脸支付终端、银行 ATM、无人货柜、地铁刷脸闸机、AR/VR、物品体积测量等场景;3D-Face ID 智能模组可用于家庭智能门锁、智能保险柜、酒店公寓智能锁、智能门禁等场景。

此外,对于可靠性和精度要求较高的制造业等领域来看,户磊表示,将几种测量原理结合一起的 3D 视觉技术也是未来发展的一个方向。

趋势之外,痛点仍在

产业链匹配不完善

相对 2D 成像而言,3D 传感技术的优势还体现在可产生大量的三维数据,这些数据未来可应用于大数据等行业,具有巨大的行业应用价值。

但是数据本身的丰富度反过来也会影响数据质量和精度,这也对传感器和相机提出了较高要求。现阶段 3D 视觉行业的核心难点集中在产业链匹配不完善。

据了解,现阶段 3D 视觉行业的核心难点集中在产业链匹配不完善。和很多新兴行业一样,在 3D 视觉行业蓬勃发展的同时,产业链条体系混乱、产业关键链路无法闭环等问题逐步凸显,这些问题成为制约行业发展的瓶颈。

三维视觉产业链涵盖核心器件、模组装配、像机成像系统设计、算法、感知技术方案与模块、终端产品与行业方案多个环节,由于三维机器视觉仍属于较前沿的技术,供应链匹配上存在技术难度高、标准不统一等诸多问题,整合产业链是 3D 视觉产业化应用的必要路径。

在产业链环节,的卢深视定位为三维视觉感知系统技术方案提供商,上游承接相机模组装配,通过团队研发的相机的系统设计和内部算法形成 3D 感知技术模组、3D 通用产品、Edge AI 芯片以及行业解决方案,对于安防行业主要提供通用的终端产品,对于其它行业提供相关智能模组,并由下游的集成商合作伙伴将最终产品供给消费者。

从行业整体来看,在现阶段,如何借着轰轰烈烈的 AI 和 5G 浪潮,为行业搭建起一个凝聚上下游资源、协同产业链创新发展的平台成为迫在眉睫的事情。

硬件价格和系统成本

传统的机器视觉稳定发展多年,目前处于硬件和软件的发展基本匹配的阶段。但是随着检测需求以及对安全性及可靠性等要求的提高,未来将用到深度学习来完成功能赋能,现在基础的硬件需要做到领先于软件一代。

因此,成本高又成为了当前产业痛点之一。有行业资深人士表示,从硬件价格和系统成本来看,要突破传统上所谓二年投入回报周期这一困局。两年回收成本已经无法撬动行业需求,一年左右的时间周期才会带动中小企业愿意买单。

技术价值最大化的关键在于逐渐形成大规模的普及应用,通过大面积提升行业的生产力水平和经济效益获得,通过给客户带来价值而盈利,这是一个较为艰难的过程,但也是一个需要慢慢推进的必要过程。

从机器视觉发展的客观现状来讲,其实并不缺市场需求,但是缺少能够真正落地的、真正发挥出经济效益的好产品。那么,应该如何打破这个“紧箍咒”?推动更多的落地应用?

解决核心零部件的性价比,做到系统成熟稳定可靠,是迫在眉睫的事情。只要将性价比做到极致,就能满足目前工业机器视觉中绝大多数的应用需求。另一方面,也体现在产品的适用性、标准化程度上。需要对视觉应用真正的刚性需求逐渐显现出来,进而实现降本增效的效果。