让我们教机器“看”

对于众生来说,“见”是本能,“看”是智慧。游隼可以在高空准确地捕捉地面上的猎物,人眼可以从繁忙的交通中辨别出闪烁的交通灯。这些都是随着时间的推移而演变的高效视觉智慧。生物视觉并不是对整个世界的平均探索。中央凹是人类视网膜最敏感的区域,可以让人眼在宽阔的视野环境中瞬间将有限的注意力集中到主要目标上,从而实现视觉资源的高效分配。科学家们将这种视觉智能浓缩到一个小硅芯片上。北京大学王兴军教授、舒浩文研究员团队与香港城市大学王成教授、上海交通大学周林杰教授团队合作,研发出具有“视距”成像能力的相干仿生激光雷达芯片并完成了四维成像演示系统,帮助机器视觉从“广域扫描”走向“精准识别”。研究结果在线发表在《自然通讯》杂志上。随着自动驾驶、嵌入式智能、低空无人机等行业的快速发展,计算机视觉面临挑战。如何让智能代理“看得清楚、完整、快速”?传统的做法是通过“堆料”来增加激光雷达的通道数,提高采样率。然而,出现了一些问题。另一方面,更高的激光雷达分辨率需要更多的光电器件,并增加后端电子处理的带宽需求,迅速达到成本和功耗的“天花板”。另一方面,与普通脉冲激光雷达相比,调频连续波激光雷达在测速时可以承受干扰,但要求近乎严格用于光源稳定性和频率扫描线性度等指标。即使性能出现轻微偏差,也会显着降低检测精度。受生物视觉机制的启发,研究团队可以按需调度LIDAR的光谱和通道资源。他们提出了一种“微并行”架构,分别实现了“全球覆盖”和“局部高分辨率”。在此过程中,可调谐外腔激光器和薄膜铌酸锂电光频率梳一起工作。第一个负责生成调制信号和大范围视场扫描范围。a,而第二个在需要对局部区域的时间“采样”进行关键观测时并行生成多载波信号。实验结果表明,该系统在预选关键区域的视场内可以实现约0.012度的角分辨率(以100米距离为例,可识别物理物体)al 的间距如硬币大小),赋予机器“敏锐的眼睛”。此外,通过波长和频域资源调度实现的分辨率提升方法也消除了传统的盲目添加硬件来提升性能的方法。这项研究的结果不仅将帮助机器“看得更清楚”,还将帮助计算机视觉“看得更丰富”。研究团队介绍,该系统可以在获取三维几何信息的同时,同时分析物体运动速度、多普勒特征、反射率信息等。此外,通过与可见光相机的协同检测,可以将激光雷达提供的三维几何结构和相机提供的纹理颜色信息叠加在同一坐标系上。这样,机器不仅能看到形状,还能看到外观,使其能够更好地识别目标,理解复杂和复杂的情况。动态环境场景。这使您可以“根据要求增强本地详细信息”。 “这种功能将来可以封装为传感器模块,以提高关键区域的检测精度,而无需增加体积或功耗。”作为集成光子学领域的重大进步,该解决方案为下一代自动驾驶和嵌入式智能提供了高分辨率、低功耗和高度灵活的“眼睛”。王
(编辑:张冲)

推荐文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注