大家好,我是大凡光学。今天继续和大家聊聊自动驾驶和UniAD。
自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)首次将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划整合到一个基于 Transformer 的端到端网络框架下, 完美契合了 “多任务”和“高性能”的特点,可称为自动驾驶中的技术突破。

现有自动驾驶系统可大致归为三类:
1. 模块化
每个模型负责单独的子任务,优势在于易于调试迭代,但是解耦就会丢失最优性,各个模块的优化目标并不是以驾驶为最终目标,并且每个模块的误差会传递到之后的模块。
2. 多任务模块
多任务范式利用一个共享的特征提取器来完成多个子任务,好处是节省计算成本,缺点在于不同任务之间可能会存在负面影响。
3. 端到端模块
端到端范式以最终的驾驶性能为目标,具体又可以细分为两种范式:隐式的端到端和显式的端到端。其中隐式端到端是以传感器数据作为输入,直接输出规划或者控制指令。这种范式的好处是较为简洁,缺点是缺乏可解释性,难以调式及迭代。显式端到端则是将多个模块囊括在端到端模型之中,每个模块有各自的输出,并且会将提取到的特征传递到下游任务。

在现在的技术条件下,受限于对自动驾驶的认识,自动驾驶研究人员暂时没有对任务之间的关联和构建方式研究清楚,同时受限于模型的最终效果,即使能做到全部任务融合,但是效果依然不佳。在自动驾驶中,大多数工作都关注了感知、决策和规划三部分,但具体任务存在差异,且没有框架融合并有效的完成所有的任务。
UniAD 首次将所有检测,跟踪,建图,轨迹预测,占据栅格预测与规划都包含进来,从实现方面解决了这一难点。另一方面,通过严格的消融实验发现,在正确的融合方式下,所有的任务对最终的驾驶性能都是有收益的。至此,可以理解成UniAD就是为了解决自动驾驶的实际问题而诞生的。
UniAD的核心技术在于两点:一是实现了多组 query 的全 Transformer 模型;二是实现了全模块基于最终“规划”为目标的优化和学习。

这有点类似于百度的文心一言,只要有足够多的数据支撑,这种深度学习的模型的种子一定会成长为日后人工智能的参天大树。当然,这二者的应用领域是不同的,但是可预见的未来却一定是光明的。
总的来说,UniAD 作为一项极具创新性的自动驾驶技术,具有很大的潜力和应用价值。尽管该技术目前仍处于发展初期,但其已经引起了人们的广泛兴趣和关注,未来的发展前景非常值得期待。
希望UniAD能充分利用现在海量数据驱动的优势,在未来实现高阶的自动驾驶人工智能。