要讨论感知算法，首先要明确一个基础知识：智能驾驶感知算法，在行业内分为静态元素感

赵哲伦 - 理想汽车

Model 3

理想自动驾驶产品负责人

关注

理想

理想 L9

理想 L8

理想 L7

2023-07-12

要讨论感知算法，首先要明确一个基础知识：智能驾驶感知算法，在行业内分为静态元素感知和动态元素感知，这两类感知的目标完全不同，分别有不同的感知性能指标，不能混为一谈。 ▫️ 静态元素感知指的是道路结构相关的感知，BEV 网络具备空间意义上脑补的能力，例如车道线、路沿、围栏... ▫️ 动态元素感知指的是交通参与者相关的感知，BEV 网络具备根据历史轨迹来预测将来轨迹的能力，例如路上的车辆、骑车人、行人... 由此，我们对 8 个质疑先分类，再进行说明： ▫️ 【一、二、三、六、八】与静态感知（道路结构）相关； ▫️ 【四、五、七】与动态感知（交通参与者）相关。 ------ 🔻 关于静态感知（道路结构）【一、二、三、六、八】：理想 AD Max 的城市 NOA 静态感知采用了车端 BEV 网络与云端 NPN 特征融合的方式，这个技术方案一直以来都是公开的（郎博的微博有详细的解读，有公开的 CVPR 论文链接，也有过专业博主的解读）。回复【一、二、三】：为什么摄像头被遮挡了，感知算法还能看得见？这个问题实际上是在回答我们静态感知的算法能力：道路结构是稳定且有空间规律的，车端静态 BEV 网络具备对道路结构的脑补能力（针对摄像头看到的部分信息还原出完整信息）。如果路段上有 NPN 特征的覆盖，等于具备了历史先验信息，BEV 的脑补能力会更强，更稳定，超视距的和被遮挡的视野范围都可能显示出来。回复【六、八】：为什么有些道路明明在视野内却没有显示出来？我们 EID（车机上的智驾感知显示）只显示了城市 NOA 在当前版本开放的可行驶路段，除此之外的部分都不会做显示，包括主路和辅路。 ------ 🔻 关于动态感知（交通参与者）【四、五、七】：理想 AD Max 的城市 NOA 动态感知采用了 7 颗高清摄像头和 LiDAR 前融合的动态 BEV 网络，可以输出目标的动态位置、速度和预测轨迹。回复：动态感知为什么不能像静态感知那样具备脑补能力？动态交通参与者是不具备空间规律的，所以没有脑补的能力（不能没看清就无中生有），但可以根据交通参与者的历史轨迹来推测它的将来轨迹，所以动态 BEV 网络具备预测的能力。回复【四】工程模式的预测轨迹显示：我们把工程模式展示出来就是希望大家可以通过算法的逻辑来理解功能边界的，如果观看完整视频，会看到我们预测的结果在骑车人被遮挡的短时间内抖动后，马上随着骑车人的运动，就恢复到了正确的预测轨迹。目前在量产车上实时演示过预测算法的只有理想，我们也欢迎大家拿出来比较预测算法的性能。我们的预测算法每秒有 20 帧的结果输出，多帧拟合出预测结果才会被算法实际应用，过程中有几帧的跳变实在太正常不过了。回复【五、七】EID 的车辆感知显示：对于控车和显示，算法结果的使用本身就是有差异的，用 EID 来评测算法的性能，是绝对的不专业，没有工程师会通过 EID 来验证算法性能。这两段截图，如果观看完整视频，会发现【五】截图时间后的不久，红色的大车就在 EID 上显示了出来，对于动态交通参与者的感知不能看不清的时候就脑补。【七】自车很快速地行驶过去的，对向的静止车在自车的视野范围存在的时间非常短。对于这类交通参与者，会通过多帧的感知结果来做确认，确认感知的置信度够高后，才会在 EID 上显示出来。EID 的显示相比控车要追求更高的画面稳定性。 ------ 以上。至少要先了解清楚企业的公开信息、行业的基本信息，技术的基本逻辑，再下结论和判断。也希望用户朋友们不要被不专业的结论所误导，片段信息的截取往往不怀好意。

理想

理想 L9

理想 L8

理想 L7

2023-07-12

评论 · 0

0/3

大胆发表你的想法～

相关推荐

更多

相关推荐

更多

请截图后在微信扫码参与互动