自動駕駛的發(fā)展不僅僅是一個技術(shù)命題,同樣也是一個商業(yè)命題。從技術(shù)競爭為主導(dǎo)的上半場,到以商業(yè)化落地為主導(dǎo)的下半場,自動駕駛技術(shù)的發(fā)展和應(yīng)用需要緊密結(jié)合市場需求,企業(yè)需要探索可行的商業(yè)模式,以實現(xiàn)技術(shù)的規(guī)?;彤a(chǎn)業(yè)化落地。
“實現(xiàn)完全自動駕駛之路如同一場馬拉松長跑”,Mobileye創(chuàng)始人、總裁兼首席執(zhí)行官Amnon Shashua教授在日前公司Driving AI Day活動的演講中提到,“這不僅考驗著企業(yè)的技術(shù)創(chuàng)新和產(chǎn)品開發(fā)能力,還考驗著企業(yè)的持續(xù)經(jīng)營和盈利能力?!彼岬?,在Mobileye過去多年的支出中,每年僅用于研發(fā)自動駕駛的投入就高達(dá)6億美元左右。在這場長跑中,企業(yè)不能僅僅依賴外部資金的注入,更重要的是要找到合適的盈利模式,以保障業(yè)務(wù)的長期可持續(xù)發(fā)展。
而對于Mobileye要如何實現(xiàn)完全自動駕駛的規(guī)模化戰(zhàn)略,Amnon教授也給出了清晰的回答——復(fù)合人工智能系統(tǒng)(CAIS)。
什么是復(fù)合人工智能系統(tǒng)?
復(fù)合人工智能系統(tǒng)(Compound AI Systems)最早是2024年初加州大學(xué)伯克利分校的AI研究實驗室網(wǎng)站上的一篇題為《從模型到復(fù)合人工智能系統(tǒng)的轉(zhuǎn)變》的博客文章中提出的。文章指出,最先進(jìn)的人工智能成果越來越多地產(chǎn)出于復(fù)雜的多組件復(fù)合系統(tǒng),而非單一大模型。
與傳統(tǒng)的僅依賴單一人工智能模型的系統(tǒng)不同,復(fù)合人工智能系統(tǒng)強(qiáng)調(diào)多種工具和模塊的集成和共同協(xié)作,以高效處理人工智能任務(wù)。
這種集成方法提供了靈活性和適應(yīng)性,允許系統(tǒng)根據(jù)不同的輸入和任務(wù)進(jìn)行調(diào)整。此外,復(fù)合系統(tǒng)通過不同組件實現(xiàn)冗余,確保系統(tǒng)的穩(wěn)定性。復(fù)合人工智能系統(tǒng)也更加可解釋和透明,因為可以追蹤每個組件對最終輸出的貢獻(xiàn)。
Mobileye以攝像頭為中心的復(fù)合人工智能系統(tǒng)
所謂“以攝像頭為中心”,不同于“僅依賴攝像頭”,意味著同時對更多類型傳感器的采用也持開放態(tài)度。例如,Mobileye內(nèi)部在開發(fā)成像雷達(dá),還在“可脫眼”系統(tǒng)中集成了一個前向激光雷達(dá)。攝像頭和雷達(dá)的成本都相對較低,“可脫眼”系統(tǒng)配置的一個前向激光雷達(dá)的成本也很低,只需幾百美元。
所謂“復(fù)合”,是指一方面Mobileye積極采用前沿的AI技術(shù),例如深度學(xué)習(xí)、端到端,同時也發(fā)揮自己在視覺算法方面的傳統(tǒng)優(yōu)勢,充分利用各種技術(shù)的優(yōu)勢,達(dá)到安全性和效率的最大化。
Amnon Shashua教授從四大維度深入審視了包括Mobileye自身“以攝像頭為中心的復(fù)合人工智能系統(tǒng)”在內(nèi)的當(dāng)前主流智駕方案技術(shù)路線,這些也是Mobileye為實現(xiàn)自動駕駛下半場商業(yè)落地可行性的重要考量維度。
?維度一:成本。在智駕的競爭中,成本是關(guān)鍵要素。高昂的研發(fā)和生產(chǎn)成本會直接影響到自動駕駛技術(shù)的普及速度和范圍。成本是將Mobileye的技術(shù)路線與以激光雷達(dá)為中心的,配置大量昂貴傳感設(shè)備的技術(shù)方案在未來商業(yè)落地可行性層面拉開差距的主要因素。
?維度二:模塊化。Mobileye的復(fù)合人工智能系統(tǒng)在模塊化設(shè)計方面表現(xiàn)出色,這與Mobileye的經(jīng)營理念緊密相連 —— 公司的產(chǎn)品組合涵蓋了從輔助駕駛到無人駕駛出租車(Robotaxi)的各個類別,而模塊化意味著可以提取系統(tǒng)中的某些模塊,并基于此打造成本更低的智駕或輔助駕駛系統(tǒng),或者增加額外的冗余傳感器,以較小的投資實現(xiàn)向更高級別自動化的逐步過渡。通過模塊化,將能夠更好地適應(yīng)未來技術(shù)更新和市場需求的變化。
?維度三:地域可擴(kuò)展性。地域可擴(kuò)展性是指方案擴(kuò)展到其它地域的難易程度。這一點對于全球化或致力于拓展全球化布局的汽車制造商尤為重要。
?維度四:平均故障間隔時間(MTBF)。MTBF即平均行駛多久需要進(jìn)行一次關(guān)鍵性的干預(yù),是衡量系統(tǒng)可靠性的重要指標(biāo)。相較于基于概率做出推斷式?jīng)Q策、不具有可解釋性的端到端技術(shù)路線,Mobileye通過嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)計算,能夠得出復(fù)合人工智能系統(tǒng)的誤差水平,為實現(xiàn)可脫眼系統(tǒng)所需的MTBF(Mean time between failures,平均無故障工作時間)開辟一條更為現(xiàn)實且可靠的路徑。
端到端——熱話題也需冷思考
在Mobileye的復(fù)合人工智能系統(tǒng)中,端到端是重要的組成部分之一。
Mobileye很早就看到了端到端的潛力,在其大規(guī)模流行之前,就開始研究其在智駕領(lǐng)域的應(yīng)用,也有積極采用端到端。早在2016年,Mobileye創(chuàng)始人、總裁兼首席執(zhí)行官Amnon Shashua教授和Mobileye首席技術(shù)官Shai Shalev-Shwartz教授就發(fā)表了一篇闡釋端到端系統(tǒng)的論文。
但Mobileye認(rèn)為,端到端應(yīng)作為智駕子系統(tǒng)之一提供冗余,而僅依靠端到端則會出現(xiàn)問題。
▲端到端方案的兩個前提及對應(yīng)的現(xiàn)實情況
先來看端到端的兩個前提:
第一個前提:系統(tǒng)內(nèi)部不存在任何粘合代碼,而是由一個“黑箱”操作的神經(jīng)網(wǎng)絡(luò)構(gòu)成。該神經(jīng)網(wǎng)絡(luò)的輸入端接收來自攝像頭的傳感信息,輸出端則提供汽車的行駛方向和軌跡,最終輸出的是行動決策。系統(tǒng)本身僅作為一個數(shù)據(jù)通道。隨著越來越多的數(shù)據(jù)被添加,神經(jīng)網(wǎng)絡(luò)通過觀察人類駕駛員的行為來學(xué)習(xí)駕駛技巧。同時,有數(shù)以百萬計的汽車在不斷地發(fā)送行駛數(shù)據(jù)。由于不存在粘合代碼,隨著時間的推移和數(shù)據(jù)量的增加,系統(tǒng)可以使用更多的數(shù)據(jù)進(jìn)行訓(xùn)練,最終達(dá)到一個奇點水平,即達(dá)到或超越人類駕駛員的能力。
但現(xiàn)實是:盡管號稱無粘合代碼,實際上粘合代碼是確實存在的,只是以離線方式存在于系統(tǒng)中。在機(jī)器學(xué)習(xí)領(lǐng)域,尤其是在使用Transformer架構(gòu)時,系統(tǒng)的任務(wù)是估算概率,即基于輸入數(shù)據(jù)預(yù)測行駛軌跡的可能性。這種預(yù)測更多地關(guān)注可能性的大小,而非預(yù)測結(jié)果的正確性。因此,神經(jīng)網(wǎng)絡(luò)并不真正了解如何區(qū)分“罕見但正確”與“常見但錯誤”之間的區(qū)別。只根據(jù)統(tǒng)計,系統(tǒng)會更偏向于選擇“常見但錯誤”的行為。
因為端到端系統(tǒng)只是估算概率,所以這種情況本質(zhì)上就無法避免。而我們當(dāng)然不希望自動駕駛汽車做出違反交規(guī)的行為。
為了解決這一問題,需要在語言模型中引入基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)。對于端到端系統(tǒng),就是在離線環(huán)境中,通過篩查和過濾機(jī)制,識別并剔除不良的人類駕駛行為,例如粗暴駕駛、魯莽駕駛等。這一過程需要大量的工程技術(shù)和粘合代碼的支持,但這些工作都在離線環(huán)境中完成,而不是在線實時進(jìn)行。
因此,粘合代碼并沒有消失,而是從在線轉(zhuǎn)移到了離線環(huán)境。這就是所謂的“自動駕駛對齊”問題,即需要區(qū)分哪些行為是正確的,哪些是錯誤的。
第二個前提:訓(xùn)練數(shù)據(jù)均為無監(jiān)督數(shù)據(jù),這意味著僅包含原始圖像,沒有人對圖像中的數(shù)據(jù)進(jìn)行過標(biāo)注。因此,系統(tǒng)必須能夠僅依賴無監(jiān)督數(shù)據(jù)來實現(xiàn)足夠的平均故障間隔時間。
但現(xiàn)實是,僅靠無監(jiān)督數(shù)據(jù)進(jìn)行訓(xùn)練,端到端方案的準(zhǔn)確率能從0很快地推進(jìn)到95%,但其所需的巨大成本、數(shù)據(jù)量和工程量也不容忽視。以現(xiàn)在的大語言模型和transformer為例,在從0—95%的階段,能夠?qū)崿F(xiàn)相當(dāng)大的飛躍,但無法達(dá)到100%準(zhǔn)確,有時候會犯一些匪夷所思的錯誤。
對于事關(guān)安全的智駕,試錯空間極小,95%的安全性是遠(yuǎn)遠(yuǎn)不夠的。而僅依賴端到端,要想達(dá)到99.999999%的安全性是相當(dāng)難的。
僅靠未經(jīng)標(biāo)注的無監(jiān)督數(shù)據(jù)進(jìn)行訓(xùn)練,會帶來諸多問題,例如:
計算器問題:系統(tǒng)無法學(xué)會“長乘法”,因為系統(tǒng)所看到的只是許多數(shù)對相乘的示例,從這些示例中不足以抽象出長乘法的概念。因此在大語言模型中,不使用模型本身來輸出結(jié)果,而是通過將問題轉(zhuǎn)化為Python代碼,由Python代碼直接調(diào)用計算器,才能解決這一問題?!坝嬎闫鳌钡慕巧?,就是智駕系統(tǒng)為端到端注入的“抽象概念”的角色,即將具體的事物或行為抽象化,形成一般性的原則或規(guī)則。
捷徑學(xué)習(xí)問題:“端到端方法”就是將所有傳感器的數(shù)據(jù)輸入到一個大型神經(jīng)網(wǎng)絡(luò),然后對其進(jìn)行訓(xùn)練。而輸入的信息中,因為有些信息的樣本復(fù)雜度低,意味著你需要少量的數(shù)據(jù)便可以學(xué)習(xí)到模式,而有的則相反。例如,激光雷達(dá)就是一種低樣本復(fù)雜度的信息源,它是精確的三維傳感器,因此要進(jìn)行泛化,所需的數(shù)據(jù)量要遠(yuǎn)遠(yuǎn)少于攝像頭。而攝像頭則是高樣本復(fù)雜度的信息源。
當(dāng)輸入來自不同的模態(tài)時,樣本復(fù)雜度不同。而端到端隨機(jī)梯度下降很難充分利用所有模態(tài)的優(yōu)勢,誤差達(dá)到一定程度后就很難再下降。
嚴(yán)格意義上倒也不是說做不到,但所需要的時間之長,完全不切實際。這就是“捷徑學(xué)習(xí)問題”。
長尾問題:對于長尾問題有兩種假設(shè),在樂觀的情況下,有些事件的概率相對較大,而有些則非常小,覆蓋一些邊緣事件就可以大幅度地減少總體概率質(zhì)量(probability mass)。這意味著少數(shù)關(guān)鍵的邊緣事件可以顯著提升系統(tǒng)性能,進(jìn)而實現(xiàn)更高的平均故障間隔時間;在悲觀的情況下,所有罕見的長尾問題其實概率都一樣非常小,每個邊緣事件對概率質(zhì)量的影響非常小。這意味著即使處理了很多邊緣事件,系統(tǒng)的故障率仍然不會有顯著改善。覆蓋所有這些邊緣情況需要很長一段時間,長到不切實際。
總體而言,端到端學(xué)習(xí)模型的優(yōu)勢是顯著的。然而,如果僅依賴無監(jiān)督數(shù)據(jù),不引入抽象概念,不考慮長尾問題,而只是單純地向系統(tǒng)提供更多數(shù)據(jù),那么是否能夠?qū)崿F(xiàn)平均故障間隔時間的目標(biāo)確實是一個值得探討的問題。
Mobileye的復(fù)合人工智能系統(tǒng)如何破局并降低誤差
說到將AI應(yīng)用于汽車行業(yè),Mobileye在這方面一直都是先行者。Mobileye一直致力于將最新的AI技術(shù)整合到自身軟件堆棧中。
每項技術(shù)都各有所長。Mobileye也積極采用包括端到端在內(nèi)的前沿技術(shù),在下一代軟件中大量利用了端到端和Transformer,但不是拿來就用,而是會深入了解其優(yōu)劣勢,結(jié)合自身的經(jīng)典優(yōu)勢技術(shù),取各自之所長,重成本與效率,將最新的AI技術(shù)以安全和負(fù)責(zé)任的方式整合到產(chǎn)品中。
Mobileye的復(fù)合人工智能系統(tǒng)通過為端到端系統(tǒng)注入恰到好處的適量抽象概念,如RSS(責(zé)任敏感安全)模型,通過傳感器冗余、算法冗余,以及高階融合,能夠?qū)⒖傮w誤差降至最低。
“偏差-方差權(quán)衡”以及抽象概念
前文中提到了端到端系統(tǒng)依靠無監(jiān)督數(shù)據(jù)進(jìn)行訓(xùn)練,按照概率分布做出決策判斷,就好像我們只從身邊的人的言行中學(xué)習(xí),基于經(jīng)驗做出判斷,但是未必清楚核心的規(guī)則和原理。
而所謂“抽象概念”,就是規(guī)范了某些具體的概念、需要遵守的一般性原則或行為準(zhǔn)則,而不僅僅是表面的、具體的模式,讓決策有據(jù)可依,提高規(guī)范性和安全性。
對于自動駕駛,RSS模型,即Mobileye用于為駕駛決策提供安全保障的引擎,就是一種抽象概念。還有感知狀態(tài),即基于輸入圖像輸出車輛位置、行人、所有道路使用者、車道標(biāo)記、交通信號燈、交通標(biāo)志等等,這都是根據(jù)人類的經(jīng)驗來判斷哪些是重要信息,然后獲得相應(yīng)的輸出,這就是我們所說的抽象概念。
但抽象概念的注入要適量。為便于理解,這里講一下“偏差-方差”的概念。
▲機(jī)器學(xué)習(xí)中的“偏差-方差”權(quán)衡
偏差,又稱“近似誤差”,是指學(xué)習(xí)系統(tǒng)無法反映現(xiàn)實的全部內(nèi)容。注入抽象概念的程度稱為偏差(Bias)。如果注入的抽象概念過多,就會產(chǎn)生近似誤差,也就是說,模型的豐富程度以及容量并不能反映現(xiàn)實的豐富程度,在這種情況下,模型被過于局限了。過多的抽象概念、過多的偏差可能會因為近似誤差而導(dǎo)致系統(tǒng)出錯,因為這些都限制了系統(tǒng)的容量,神經(jīng)網(wǎng)絡(luò)的容量無法反映現(xiàn)實的豐富程度。
方差,也稱“泛化誤差”,是指學(xué)習(xí)系統(tǒng)對觀察到的數(shù)據(jù)過度擬合,而無法泛化到從未見過的例子。如果不注入任何抽象概念,會產(chǎn)生很高的泛化誤差。隨著注入偏差的增加,也就是注入抽象概念增多時,泛化誤差會下降。但凡事過猶不及,如果注入過多的抽象概念,系統(tǒng)容量就不足以反映現(xiàn)實的豐富程度。
學(xué)習(xí)模型的總誤差是近似誤差和泛化誤差的總和。因此,為最大程度減少誤差,需要對這兩個誤差進(jìn)行精細(xì)控制??梢酝ㄟ^限定學(xué)習(xí)模型必須來自特定的模型族來減小泛化誤差,但如果所選擇的模型族無法反映現(xiàn)實的全部豐富性,就可能會引入偏差,因此兩者之間存在權(quán)衡。
因此,就需要注入恰到好處的適量抽象概念,達(dá)到最佳平衡點,使總體誤差最低。
落到Mobileye的具體工作中,其抽象概念是一套“感知-規(guī)控-執(zhí)行”方法論。RSS模型就是一種大型抽象概念,還有運(yùn)行的計算,分析計算等等,還有自動緊急制動(AEB)相關(guān)的“碰撞時間(TTC)”概念,也是抽象概念,應(yīng)對長乘法的計算器也是,諸如此類,不一而足。
冗余設(shè)計和高階融合:以嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)方式論證誤差
在談到“捷徑學(xué)習(xí)”問題時,提到了端到端無法真正利用每種傳感器模態(tài)的優(yōu)勢,這種低階融合無法達(dá)到理想結(jié)果。
而且端到端本質(zhì)上是一個黑箱,不具有可解釋性。但自動駕駛汽車的權(quán)衡規(guī)則必須公開透明,使社會能夠通過監(jiān)管解釋影響所有道路使用者的自動駕駛決策。
最好的方式是建立一個可分解的系統(tǒng),這樣一來,當(dāng)出現(xiàn)錯誤時,就可以找出錯誤原因并只關(guān)注網(wǎng)絡(luò)出錯的那個區(qū)域,不會影響到其他地方。
Mobileye的復(fù)合人工智能系統(tǒng)旨在利用所有傳感器模式(包括攝像頭、雷達(dá)和激光雷達(dá)),按每種傳感器對系統(tǒng)進(jìn)行可分解訓(xùn)練,然后進(jìn)行高級融合,從而對駕駛環(huán)境形成更深入、更精確的理解,并更有效地處理各種極端情況,輕松達(dá)到更低的誤差水平,這與完全的端到端系統(tǒng)或基于低階融合的系統(tǒng)相比更具優(yōu)勢。
高階融合中,有簡單的部分,也有復(fù)雜的部分。
適用于二元決策的簡單傳統(tǒng)融合:比如前方有一輛車,是踩剎車還是不踩剎車,這是一個二元決策。經(jīng)典的處理方式是采用“多數(shù)規(guī)則”,三個子系統(tǒng)里只要有兩個得到同樣結(jié)論,就滿足少數(shù)服從多數(shù)。每個子系統(tǒng)都會給出1或-1的輸出,即踩剎車或不踩剎車的決策。如果每個子系統(tǒng)犯錯的概率為ε,那么采用多數(shù)規(guī)則,會讓犯錯的概率降到ε2,包括漏檢或誤檢的概率都會降低。這就是傳統(tǒng)融合,屬于簡單的部分。
適用于非二元決策的PGF(Primary-Guardian-Fallback)高階融合:有很多決策并非是二元的,也就是無法根據(jù)多數(shù)規(guī)則來做決策。舉個例子,在橫向控制情況下,比如說車兩側(cè)各有一輛公交車,一個子系統(tǒng)告訴我們前方道路左轉(zhuǎn),另一個子系統(tǒng)告訴我們前方道路直行,還有一個子系統(tǒng)告訴我們前方道路右轉(zhuǎn)。這里沒有“多數(shù)”的概念,該怎么辦呢?如果做了錯誤的決策,就會和旁側(cè)公交車發(fā)生碰撞事故。那么,問題就來了:我們該如何進(jìn)行高階融合以做出非二元決策?
▲無法根據(jù)多數(shù)規(guī)則來做決策的非二元情況
概括地講,Mobileye構(gòu)建了三個子系統(tǒng),這三個子系統(tǒng)針對想要進(jìn)行高階融合的所有組件,不僅僅是攝像頭、雷達(dá)、激光雷達(dá),而是包含了高階融合的所有方面。
▲構(gòu)建PGF三個子系統(tǒng)以進(jìn)行高階融合
?“Primary”主系統(tǒng):用于預(yù)測,例如預(yù)測車道位置
?“Fallback”備用系統(tǒng):基于不同方法同樣做預(yù)測
?“Guardian”監(jiān)護(hù)系統(tǒng):負(fù)責(zé)檢查Primary主系統(tǒng)的預(yù)測是否正確
例如,前方道路是向右、向左還是直行,端到端網(wǎng)絡(luò)做出了判斷,Guardian監(jiān)護(hù)系統(tǒng)同時也在執(zhí)行它的檢查工作,每個系統(tǒng)出錯的概率均為ε。
如果Guardian監(jiān)護(hù)系統(tǒng)認(rèn)為Primary主系統(tǒng)的預(yù)測有效,就按此執(zhí)行;否則會選擇Fallback備用系統(tǒng)。
經(jīng)證明,系統(tǒng)的總體誤差可以低至與多數(shù)規(guī)則相同的水平。
總的來說,復(fù)合人工智能系統(tǒng)代表了人工智能發(fā)展的一個重要趨勢,即從單一模型的優(yōu)化轉(zhuǎn)向構(gòu)建集成多種AI技術(shù)的復(fù)合系統(tǒng),以實現(xiàn)更高效和強(qiáng)大的AI應(yīng)用,滿足自動駕駛應(yīng)用對安全性、精確性的高要求。
更多Mobileye的最新技術(shù)創(chuàng)新,請觀看Mobileye Driving AI Day演講視頻回放。
100倍Transformer效率提升
Mobileye的復(fù)合人工智能框架由多個相互支持的組件構(gòu)成,這些組件專為自動駕駛而設(shè)計,旨在將端到端學(xué)習(xí)模型與專門算法相結(jié)合,以實現(xiàn)對Transformer和生成式AI的高效利用。
為了達(dá)成這一目標(biāo),Mobileye開發(fā)專為自動駕駛感知和規(guī)劃而優(yōu)化的Transformer模型。該模型在效率上相較于通用人工智能領(lǐng)域的最先進(jìn)模型提升了100倍,同時并未降低準(zhǔn)確性。
具體實現(xiàn)方法為STAT(稀疏注意力),該技術(shù)通過將token分為不同類型,并按類型劃分相應(yīng)的矩陣。這一過程類似于將人群分成多個小組,每個小組由一位經(jīng)理負(fù)責(zé),小組成員直接與經(jīng)理溝通,而經(jīng)理之間也進(jìn)行相互交流。通過這種有序的溝通機(jī)制,STAT技術(shù)顯著提高了整體的工作效率。
EyeQ6H——效率的代名詞
Mobileye提出了能夠科學(xué)地反應(yīng)芯片能力的指標(biāo)——FPS(Frames per second),即每秒能夠處理的畫面幀數(shù)。相較于TOPS數(shù)值,F(xiàn)PS能夠科學(xué)地體現(xiàn)系統(tǒng)在現(xiàn)實中解決實際問題的能力,因此可以作為更科學(xué)地衡量效率的指標(biāo)。
Mobileye認(rèn)為重視效率才是技術(shù)能力的體現(xiàn)?;谠谟嬎銠C(jī)視覺算法方面的深厚積累和經(jīng)典傳承,并結(jié)合在AI深度學(xué)習(xí)方面的前沿突破,Mobileye在芯片設(shè)計上采用完全異構(gòu)的計算架構(gòu),針對卷積和transformer等神經(jīng)網(wǎng)絡(luò)以及視覺運(yùn)算的不同計算場景,將適合的運(yùn)算任務(wù)分配到適合的核,提高芯片利用率,實現(xiàn)整體最有效的加速。相較于上一代EyeQ5H,EyeQ6H 有其2倍的Tops,卻達(dá)到了10倍的FPS。
自動化數(shù)據(jù)標(biāo)注,解決現(xiàn)實世界的數(shù)據(jù)難題
CAIS因為注入了抽象概念,因此僅需要少量的數(shù)據(jù)進(jìn)行訓(xùn)練,但所需的必須是高質(zhì)量的數(shù)據(jù)。
Mobileye采取的方法是在離線環(huán)境中生成數(shù)據(jù),無需占用車載計算資源。首先,基于大量的無監(jiān)督數(shù)據(jù)訓(xùn)練一個基礎(chǔ)模型,然后通過監(jiān)督式微調(diào)來針對特定問題進(jìn)行建模。
Mobileye開發(fā)了一種針對圖像的基礎(chǔ)模型,該模型能夠理解每個像素的含義,并根據(jù)像素的語義屬性進(jìn)行聚類。因此,該模型能夠識別圖像中每輛車、每個車道標(biāo)記、每根桿子的位置等,最終創(chuàng)建自動基準(zhǔn)真值,以完全自動化的方式建立對周圍環(huán)境的全面理解,從而能夠獲得非常豐富的現(xiàn)實表征,基本上能夠了解周圍每個像素的深度信息,然后利用這些高質(zhì)量的數(shù)據(jù)來訓(xùn)練AI模型,而且生成這些標(biāo)簽的成本為零,因為這一過程無需人工干預(yù)。
【題圖:Mobileye創(chuàng)始人、總裁兼首席執(zhí)行官Amnon Shashua教授和首席技術(shù)官Shai Shalev-Shwartz教授】
x
-
7月新能源銷量榜:謗滿天下的理想、比亞迪,占了中國新能源汽車半壁江山 2024-08-05 17:25
-
中國新能源五月銷量榜:一個看向全球前十的排名預(yù)演 2024-06-05 13:30
-
Apollo開放平臺10.0發(fā)布丨單Orin芯片即可支撐L4落地 2024-12-04 14:53
-
陽泉高新區(qū)發(fā)布針對純視覺高階智駕車型促銷活動方案 2024-12-01 12:52
-
如何定義“新汽車工業(yè)”?來聽一下這場年末重磅行業(yè)會議 2024-12-02 19:27
-
黑芝麻智能端到端算法參考模型公布,一文了解技術(shù)亮點 2024-12-02 20:51