智駕網(wǎng) 2024-10-29 16:26
這一次視覺智駕是不是真的可以把激光雷達干掉了?
分享
從激光雷達路線轉(zhuǎn)型到視覺路線,感知能力反而大幅提升,小鵬視覺智駕進化的秘訣就在于云端大模型和LOFIC架構(gòu)的落地。而隨著造車成本的下降,性價比優(yōu)勢顯然會推動更多的主機廠跟隨加入,視覺智能有沒有可能超越雷視融合方案成為市場主流,小鵬P7+的市場表現(xiàn)十分關(guān)鍵。

 盡管路上配備激光雷達的車輛越來越多,但加入視覺感知路線的玩家陣營正在更具規(guī)?;?。


今年夏天何小鵬在美國體驗了一輪特斯拉的FSD之后,宣布將小鵬的雷視融合智駕方案全面切換到視覺感知路線。


所謂全面,即是未來小鵬新推出的車型都不再配備激光雷達。


這與部分品牌將視覺智駕做為智駕的低配方案完全不同。


01.
視覺智駕的陣營正空前強大

做為小鵬未來十年的開山之作,小鵬P7+成為小鵬AI鷹眼視覺方案落地的首款車型。


小鵬汽車成為繼特斯拉、極越之后,第三個高調(diào)宣布僅采用視覺感知智駕的智能汽車品牌。


而在此之前,蔚來樂道品牌的首款車型L60,以及智界S7、新問界M5、深藍(lán)S07都推出了基于華為乾崑ADS SE系統(tǒng)的視覺感知智駕系統(tǒng)。


而在供應(yīng)商層面,華為乾崑、百度阿波羅、大疆車載、商湯絕影、智駕科技MAXIEYE、Nullmax都是視覺感知智駕技術(shù)的供應(yīng)商。


而在10月11日特斯拉發(fā)布的無人駕駛出租車Cybercab也是一款“不需要激光雷達做感知冗余”的L4級無人駕駛車輛。


圖片


盡管多家智駕科技公司曾向智駕網(wǎng)表示,視覺感知就是無人駕駛的終極解決方案,但激光雷達做為感知冗余配置在L4、L5級無人駕駛車輛上的配置還是不可取代的,但馬斯克對于Robotaxi上能過視覺方案實現(xiàn)完全自動駕駛的路線非常有信心:“使用AI和計算視覺,不需要昂貴的設(shè)備,就可以在無監(jiān)督的情況下實現(xiàn)FSD?!?/p>


這無疑進一步提振了視覺感知派的信心。


那么視覺感知路線真的能實現(xiàn)其所宣稱的能力嗎?鑒于特斯拉的FSD尚沒有明確的入華時間表,國內(nèi)能驗證視覺智駕天花板的就是小鵬P7+。


當(dāng)下無論是樂道L60還是鴻蒙智行系的智界S7、新問界M7在城市高階智駕方面宣稱的皆是快速路NOA,小鵬P7+則是直接面向城市所有場景的NOA。


日前智駕網(wǎng)在廣州市區(qū),特別是在夜間場景體驗了小鵬P7+,這款車在掉頭、無保護左轉(zhuǎn)、緊急避讓逆行車輛、臨時變道等場景表現(xiàn)出極強的超越人類駕駛員的能力。


在夜間模式下,小鵬P7+對目標(biāo)物的識別,道路狀況的分析做到了與白天幾無差別的自動行駛。


廣州做為小鵬汽車的大本營,可以想象小鵬汽車對這座城市的道路信息十分熟悉,但即便如此,這樣的驚艷表現(xiàn)依然讓人相信,視覺感知智駕的上限對于激光雷達已沒有不得已的依賴。

那么小鵬視覺智駕是如何克服傳統(tǒng)的攝像頭對陰暗、逆光、靜態(tài)物場景等的應(yīng)對,實現(xiàn)全場景、隨時隨地開啟的?

綜合來看,小鵬的視覺智駕能力是新技術(shù)應(yīng)用的結(jié)果。

1、在硬件上保證算力和感知冗余:2顆英偉達Orin-X智駕芯片,算力為508TOPS,攝像頭達到了11顆,多于傳統(tǒng)的7顆;

2、端到端的云端大模型,依托強大的云端算力,增強了智駕系統(tǒng)對道路場景的理解能力,判斷時間更短,更能應(yīng)對突發(fā)狀況;

3、新技術(shù)架構(gòu)LOFIC架構(gòu)大大提升了攝像頭的全場景感知能力,讓智駕看得更清晰、更準(zhǔn)確。

圖片


小鵬P7+的技術(shù)工程師向智駕網(wǎng)表示,視覺感知路線不僅省掉了激光雷達的成本,在決策效率上也要更快,因為省去了激光雷達感知信息的融合過程。而從人類駕駛的形式來看,也不需要雷達來輔助,所以在技術(shù)上只要擁有了足夠強大的視覺感知能力,就可以實現(xiàn)高階智駕,級別甚至可以達到L4級。


在10月24日的小鵬的“1024科技日”,小鵬汽車的智駕團隊詳細(xì)解釋了AI鷹眼視覺方案的兩大核心技術(shù),云端大模型和LOFIC架構(gòu)方案。


02.
云端大模型加持,視覺感知能力進化

按照小鵬官方的說法,在采用了云端大模型之后,訓(xùn)練效率已提升了2.6倍,2025年小鵬云端的算力將會達到10EFlops以上。


基于這個表現(xiàn),小鵬高層判斷:自動駕駛的新一輪競爭正在云端展開。


圖片


小鵬汽車副總裁、自動駕駛負(fù)責(zé)人李力耘表示,目前行業(yè)有三種主流的端到端發(fā)展路線:


一種是通過大量規(guī)則小模型堆疊的 “大模型”,其需要大量的優(yōu)秀規(guī)則工程師;

一種是“車端大模型”,即直接將端到端模型部署于車輛上,雖然見效快,但受限于車端算力,且隨著后期訓(xùn)練數(shù)據(jù)量的增加,容易陷入瓶頸;

最后一種便是云端大模型,其參數(shù)量是車端模型的幾十倍甚至數(shù)百倍,這是單純的車端大模型所不可企及的。

圖片


李力耘表示,前兩種端到端的技術(shù)路線都能帶來一定成效,但云端大模型才是制勝關(guān)鍵,小鵬云端大模型的參數(shù)量將多達車端參數(shù)量的80倍,云端大模型能夠全面吸納智駕數(shù)據(jù),不遺漏重點信息細(xì)節(jié)。通過大參數(shù)量的訓(xùn)練,能夠盡可能地窮盡智能駕駛中的長尾問題,以覆蓋更多駕駛場景,使XNGP實現(xiàn)L3級的智駕體驗。


李力耘提到的所謂“長尾問題”,就是指在自動駕駛過程中那些發(fā)生概率較低、但種類繁多的特殊場景所帶來的潛在風(fēng)險。


當(dāng)下,目前自動駕駛的底層架構(gòu)和大部分技術(shù)問題已解決,但剩下的約5%的長尾問題成了關(guān)鍵。


圖片


這些問題涵蓋各種零碎、極端的情況和難以預(yù)測的人類行為,例如:帶有凸出貨物的卡車、打傘的行人、倒在路中央的樹木,以及異形車輛、亂穿馬路的行人和自行車、雨雪等極端天氣、極暗的行車環(huán)境等。


自動駕駛依靠攝像頭、激光雷達、毫米波雷達等傳感器感知環(huán)境并做出決策但這些傳感器在某些情況下存在局限。例如:


在惡劣天氣中可見光攝像頭可能衰減直至失效,


超聲波雷達在遠(yuǎn)距離探測精度較差,


激光雷達在雪天和風(fēng)沙天易受影響,在對向眩光、陽光及信號干擾、黑夜無燈路段等情況下也會出現(xiàn)不同程度的問題。


導(dǎo)致長尾問題的本質(zhì)其實是信息不足,解決方法就是從補充信息的角度去處理。


圖片


根據(jù)官方數(shù)據(jù),小鵬云端大模型可極致發(fā)揮攝像頭高信息量輸入,8倍提升有效視覺信息量。相較于激光雷達方案,AI鷹眼視覺方案的攝像頭信息量是前者的80倍,而攝像頭能夠感知的語義和顏色信息是其100倍,攝像頭的反應(yīng)速度也是其3倍。


這些數(shù)據(jù)表明,在擁有云端大模型加持之后,其視覺感知能力已經(jīng)遠(yuǎn)遠(yuǎn)超越了激光雷達,因此也就不再需要它的輔助。


系統(tǒng)通過視覺感知方案獲得了更多的信息量,長尾問題的解決也就更加高效和可靠。


圖片


可以說,這正是現(xiàn)階段視覺感知技術(shù)開始呈現(xiàn)超越激光雷達感知能力的基礎(chǔ)。


李力耘表示,對于輕雷達、輕地圖的智駕方案而言,高算力大模型既是基礎(chǔ)也是門檻。


他表示,小鵬的云端大模型是國內(nèi)首個泛機器人領(lǐng)域的基礎(chǔ)大模型,不僅可以應(yīng)用在自動駕駛領(lǐng)域,機器人、飛行汽車等領(lǐng)域均適用。它讓小鵬成為了全球唯二能做到不依賴高精度地圖、激光雷達,實現(xiàn)用一套軟件適配全車系的車企。


按照官方公布的規(guī)劃,小鵬P7+及后續(xù)車型也因此不再區(qū)分Max和Pro版本,全系都能標(biāo)配AI智駕。


03.
LOFIC架構(gòu)落地,AI鷹眼視覺方案實力倍增

在談及由小鵬P7+首發(fā)搭載的AI鷹眼視覺方案時,官方特別強調(diào)了其采用了行業(yè)首個單像素LOFIC架構(gòu)方案。


這一技術(shù)的優(yōu)勢,是在逆光、大光差、暗光等環(huán)境下的信息采集能力更強。并且該架構(gòu)方案的視覺感知范圍也更大,達到了1.8個標(biāo)準(zhǔn)足球場,甚至能夠清晰分辨顏色、文字等語義信息。


圖片

LOFIC技術(shù)的全稱是“Lateral overflow integrated capacitor”,即橫向溢出集成式電容技術(shù),這項技術(shù)的誕生是為了滿足CMOS圖像傳感器對高動態(tài)范圍的需求。


CMOS圖像傳感器的動態(tài)范圍越高,視覺感知系統(tǒng)就能“看得更準(zhǔn)更清晰”。


CMOS的成像原理主要是通過把光線轉(zhuǎn)換成電荷,進而形成畫面,如果我們用一個“桶”來承載單個像素所轉(zhuǎn)換出來的電荷,那這個桶能容納電荷的多少就決定了這個像素成像的明暗細(xì)節(jié)程度。如果桶里是空的,那此時的畫面就是全黑的,也就是曝光不足;如果桶里的電荷數(shù)量多到溢出了桶外,那這時的畫面就是一片白色,也就是曝光過度。


圖片


在LOFIC技術(shù)出現(xiàn)之前,要提高動態(tài)范圍有許多方式,例如多次曝光或大小像素等。


據(jù)小鵬工程師介紹,之前的視覺技術(shù)是同步記錄兩張圖像,一個曝光比較亮的,一個曝光比較暗的,之后通過算法將二者進行合成,從而構(gòu)成完整的感知圖像。這樣做的缺點,是遇到運動速度比較快的目標(biāo)物時會有延遲,并且有色彩串?dāng)_和產(chǎn)生閃爍等問題。


圖片

圖片來自:3d tof的《HDR技術(shù)詳細(xì)解析》


LOFIC技術(shù)的原理,就是對承載電荷的“桶”進行擴容,LOFIC電容用于收集橫向溢出的電荷。當(dāng)電荷數(shù)量超過像素CFD原本能承載的最大限度,多余的電荷就不會溢出損失掉,而是會流到相鄰的“桶”里。之后通過讀取“桶”里的電荷,再結(jié)合數(shù)字算法技術(shù),就能夠獲得更高的動態(tài)范圍,成像也就更加細(xì)膩、清晰。


而這也是小鵬宣稱LOFIC架構(gòu)方案信息采集能力更強、感知范圍更大,能夠清晰分辨語義信息的原因。


04.
視覺智駕的更大優(yōu)勢是降低了造成成本

在有了云端大模型和LOFIC架構(gòu)加持之后,智駕網(wǎng)在實際路測過程中,真實感受到了AI天璣5.4.0系統(tǒng)的智駕能力。


當(dāng)然試駕車輛和量產(chǎn)落地車輛的技術(shù)表現(xiàn)可能存在一定的變化。


圖片


在小鵬汽車發(fā)布的數(shù)據(jù)顯示,AI天璣5.4.0系統(tǒng)的“擬人性”提升了4倍,變道成功率提升了53%,繞行成功率提升了155%。


但我們的真實感受是,這一系統(tǒng)與當(dāng)下眾多采用雷視融合方案的城市高階智駕相比沒有短板,甚至超過不少一線陣營的體驗。


圖片


而這一系統(tǒng)的另一優(yōu)勢,在于大大降低了造車成本,讓小鵬汽車在市場上更有性價比優(yōu)勢。


這讓何小鵬敢于在這款車上全系標(biāo)配這一功能,而不再區(qū)分所謂的Pro、Max等版本。


圖片


據(jù)了解,小鵬P7+是小鵬汽車首款實現(xiàn)技術(shù)成本降低25%目標(biāo)的車型,預(yù)計其利潤率將達到兩位數(shù)。而此前何小鵬曾透露:“投資人希望這款車的毛利率到20%?!?/p>


而隨著造車成本的下降,其強大的性價比優(yōu)勢顯然會推動更多的主機廠跟隨加入,視覺智駕有沒有可能超越雷視融合方案成為市場主流,小鵬P7+的市場表現(xiàn)十分關(guān)鍵。

x

收藏 0
打賞
相關(guān)標(biāo)簽:
電話:010-65030507
郵箱:editor@autor.com.cn
地址:北京市朝陽區(qū)朝外大街乙6號朝外SOHO D座5097室
北京智駕時代傳媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版權(quán)所有 AutoR智駕 智能汽車網(wǎng)
京ICP備14027737號-1      京公網(wǎng)安備 11010502038466號
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證:京B-20211307
關(guān)注官方微信