盡管路上配備激光雷達(dá)的車輛越來越多,但加入視覺感知路線的玩家陣營正在更具規(guī)?;?/p>
今年夏天何小鵬在美國體驗(yàn)了一輪特斯拉的FSD之后,宣布將小鵬的雷視融合智駕方案全面切換到視覺感知路線。
所謂全面,即是未來小鵬新推出的車型都不再配備激光雷達(dá)。
這與部分品牌將視覺智駕做為智駕的低配方案完全不同。
視覺智駕的陣營正空前強(qiáng)大
做為小鵬未來十年的開山之作,小鵬P7+成為小鵬AI鷹眼視覺方案落地的首款車型。
小鵬汽車成為繼特斯拉、極越之后,第三個(gè)高調(diào)宣布僅采用視覺感知智駕的智能汽車品牌。
而在此之前,蔚來樂道品牌的首款車型L60,以及智界S7、新問界M5、深藍(lán)S07都推出了基于華為乾崑ADS SE系統(tǒng)的視覺感知智駕系統(tǒng)。
而在供應(yīng)商層面,華為乾崑、百度阿波羅、大疆車載、商湯絕影、智駕科技MAXIEYE、Nullmax都是視覺感知智駕技術(shù)的供應(yīng)商。
而在10月11日特斯拉發(fā)布的無人駕駛出租車Cybercab也是一款“不需要激光雷達(dá)做感知冗余”的L4級無人駕駛車輛。
盡管多家智駕科技公司曾向智駕網(wǎng)表示,視覺感知就是無人駕駛的終極解決方案,但激光雷達(dá)做為感知冗余配置在L4、L5級無人駕駛車輛上的配置還是不可取代的,但馬斯克對于Robotaxi上能過視覺方案實(shí)現(xiàn)完全自動(dòng)駕駛的路線非常有信心:“使用AI和計(jì)算視覺,不需要昂貴的設(shè)備,就可以在無監(jiān)督的情況下實(shí)現(xiàn)FSD?!?/p>
這無疑進(jìn)一步提振了視覺感知派的信心。
那么視覺感知路線真的能實(shí)現(xiàn)其所宣稱的能力嗎?鑒于特斯拉的FSD尚沒有明確的入華時(shí)間表,國內(nèi)能驗(yàn)證視覺智駕天花板的就是小鵬P7+。
當(dāng)下無論是樂道L60還是鴻蒙智行系的智界S7、新問界M7在城市高階智駕方面宣稱的皆是快速路NOA,小鵬P7+則是直接面向城市所有場景的NOA。
日前智駕網(wǎng)在廣州市區(qū),特別是在夜間場景體驗(yàn)了小鵬P7+,這款車在掉頭、無保護(hù)左轉(zhuǎn)、緊急避讓逆行車輛、臨時(shí)變道等場景表現(xiàn)出極強(qiáng)的超越人類駕駛員的能力。
在夜間模式下,小鵬P7+對目標(biāo)物的識別,道路狀況的分析做到了與白天幾無差別的自動(dòng)行駛。
廣州做為小鵬汽車的大本營,可以想象小鵬汽車對這座城市的道路信息十分熟悉,但即便如此,這樣的驚艷表現(xiàn)依然讓人相信,視覺感知智駕的上限對于激光雷達(dá)已沒有不得已的依賴。
那么小鵬視覺智駕是如何克服傳統(tǒng)的攝像頭對陰暗、逆光、靜態(tài)物場景等的應(yīng)對,實(shí)現(xiàn)全場景、隨時(shí)隨地開啟的?
綜合來看,小鵬的視覺智駕能力是新技術(shù)應(yīng)用的結(jié)果。
1、在硬件上保證算力和感知冗余:2顆英偉達(dá)Orin-X智駕芯片,算力為508TOPS,攝像頭達(dá)到了11顆,多于傳統(tǒng)的7顆;
2、端到端的云端大模型,依托強(qiáng)大的云端算力,增強(qiáng)了智駕系統(tǒng)對道路場景的理解能力,判斷時(shí)間更短,更能應(yīng)對突發(fā)狀況;
3、新技術(shù)架構(gòu)LOFIC架構(gòu)大大提升了攝像頭的全場景感知能力,讓智駕看得更清晰、更準(zhǔn)確。
小鵬P7+的技術(shù)工程師向智駕網(wǎng)表示,視覺感知路線不僅省掉了激光雷達(dá)的成本,在決策效率上也要更快,因?yàn)槭∪チ思す饫走_(dá)感知信息的融合過程。而從人類駕駛的形式來看,也不需要雷達(dá)來輔助,所以在技術(shù)上只要擁有了足夠強(qiáng)大的視覺感知能力,就可以實(shí)現(xiàn)高階智駕,級別甚至可以達(dá)到L4級。
在10月24日的小鵬的“1024科技日”,小鵬汽車的智駕團(tuán)隊(duì)詳細(xì)解釋了AI鷹眼視覺方案的兩大核心技術(shù),云端大模型和LOFIC架構(gòu)方案。
云端大模型加持,視覺感知能力進(jìn)化
按照小鵬官方的說法,在采用了云端大模型之后,訓(xùn)練效率已提升了2.6倍,2025年小鵬云端的算力將會達(dá)到10EFlops以上。
基于這個(gè)表現(xiàn),小鵬高層判斷:自動(dòng)駕駛的新一輪競爭正在云端展開。
小鵬汽車副總裁、自動(dòng)駕駛負(fù)責(zé)人李力耘表示,目前行業(yè)有三種主流的端到端發(fā)展路線:
一種是通過大量規(guī)則小模型堆疊的 “大模型”,其需要大量的優(yōu)秀規(guī)則工程師;
一種是“車端大模型”,即直接將端到端模型部署于車輛上,雖然見效快,但受限于車端算力,且隨著后期訓(xùn)練數(shù)據(jù)量的增加,容易陷入瓶頸;
最后一種便是云端大模型,其參數(shù)量是車端模型的幾十倍甚至數(shù)百倍,這是單純的車端大模型所不可企及的。
李力耘表示,前兩種端到端的技術(shù)路線都能帶來一定成效,但云端大模型才是制勝關(guān)鍵,小鵬云端大模型的參數(shù)量將多達(dá)車端參數(shù)量的80倍,云端大模型能夠全面吸納智駕數(shù)據(jù),不遺漏重點(diǎn)信息細(xì)節(jié)。通過大參數(shù)量的訓(xùn)練,能夠盡可能地窮盡智能駕駛中的長尾問題,以覆蓋更多駕駛場景,使XNGP實(shí)現(xiàn)L3級的智駕體驗(yàn)。
李力耘提到的所謂“長尾問題”,就是指在自動(dòng)駕駛過程中那些發(fā)生概率較低、但種類繁多的特殊場景所帶來的潛在風(fēng)險(xiǎn)。
當(dāng)下,目前自動(dòng)駕駛的底層架構(gòu)和大部分技術(shù)問題已解決,但剩下的約5%的長尾問題成了關(guān)鍵。
這些問題涵蓋各種零碎、極端的情況和難以預(yù)測的人類行為,例如:帶有凸出貨物的卡車、打傘的行人、倒在路中央的樹木,以及異形車輛、亂穿馬路的行人和自行車、雨雪等極端天氣、極暗的行車環(huán)境等。
自動(dòng)駕駛依靠攝像頭、激光雷達(dá)、毫米波雷達(dá)等傳感器感知環(huán)境并做出決策但這些傳感器在某些情況下存在局限。例如:
在惡劣天氣中可見光攝像頭可能衰減直至失效,
超聲波雷達(dá)在遠(yuǎn)距離探測精度較差,
激光雷達(dá)在雪天和風(fēng)沙天易受影響,在對向眩光、陽光及信號干擾、黑夜無燈路段等情況下也會出現(xiàn)不同程度的問題。
導(dǎo)致長尾問題的本質(zhì)其實(shí)是信息不足,解決方法就是從補(bǔ)充信息的角度去處理。
根據(jù)官方數(shù)據(jù),小鵬云端大模型可極致發(fā)揮攝像頭高信息量輸入,8倍提升有效視覺信息量。相較于激光雷達(dá)方案,AI鷹眼視覺方案的攝像頭信息量是前者的80倍,而攝像頭能夠感知的語義和顏色信息是其100倍,攝像頭的反應(yīng)速度也是其3倍。
這些數(shù)據(jù)表明,在擁有云端大模型加持之后,其視覺感知能力已經(jīng)遠(yuǎn)遠(yuǎn)超越了激光雷達(dá),因此也就不再需要它的輔助。
系統(tǒng)通過視覺感知方案獲得了更多的信息量,長尾問題的解決也就更加高效和可靠。
可以說,這正是現(xiàn)階段視覺感知技術(shù)開始呈現(xiàn)超越激光雷達(dá)感知能力的基礎(chǔ)。
李力耘表示,對于輕雷達(dá)、輕地圖的智駕方案而言,高算力大模型既是基礎(chǔ)也是門檻。
他表示,小鵬的云端大模型是國內(nèi)首個(gè)泛機(jī)器人領(lǐng)域的基礎(chǔ)大模型,不僅可以應(yīng)用在自動(dòng)駕駛領(lǐng)域,機(jī)器人、飛行汽車等領(lǐng)域均適用。它讓小鵬成為了全球唯二能做到不依賴高精度地圖、激光雷達(dá),實(shí)現(xiàn)用一套軟件適配全車系的車企。
按照官方公布的規(guī)劃,小鵬P7+及后續(xù)車型也因此不再區(qū)分Max和Pro版本,全系都能標(biāo)配AI智駕。
LOFIC架構(gòu)落地,AI鷹眼視覺方案實(shí)力倍增
在談及由小鵬P7+首發(fā)搭載的AI鷹眼視覺方案時(shí),官方特別強(qiáng)調(diào)了其采用了行業(yè)首個(gè)單像素LOFIC架構(gòu)方案。
這一技術(shù)的優(yōu)勢,是在逆光、大光差、暗光等環(huán)境下的信息采集能力更強(qiáng)。并且該架構(gòu)方案的視覺感知范圍也更大,達(dá)到了1.8個(gè)標(biāo)準(zhǔn)足球場,甚至能夠清晰分辨顏色、文字等語義信息。
LOFIC技術(shù)的全稱是“Lateral overflow integrated capacitor”,即橫向溢出集成式電容技術(shù),這項(xiàng)技術(shù)的誕生是為了滿足CMOS圖像傳感器對高動(dòng)態(tài)范圍的需求。
CMOS圖像傳感器的動(dòng)態(tài)范圍越高,視覺感知系統(tǒng)就能“看得更準(zhǔn)更清晰”。
CMOS的成像原理主要是通過把光線轉(zhuǎn)換成電荷,進(jìn)而形成畫面,如果我們用一個(gè)“桶”來承載單個(gè)像素所轉(zhuǎn)換出來的電荷,那這個(gè)桶能容納電荷的多少就決定了這個(gè)像素成像的明暗細(xì)節(jié)程度。如果桶里是空的,那此時(shí)的畫面就是全黑的,也就是曝光不足;如果桶里的電荷數(shù)量多到溢出了桶外,那這時(shí)的畫面就是一片白色,也就是曝光過度。
在LOFIC技術(shù)出現(xiàn)之前,要提高動(dòng)態(tài)范圍有許多方式,例如多次曝光或大小像素等。
據(jù)小鵬工程師介紹,之前的視覺技術(shù)是同步記錄兩張圖像,一個(gè)曝光比較亮的,一個(gè)曝光比較暗的,之后通過算法將二者進(jìn)行合成,從而構(gòu)成完整的感知圖像。這樣做的缺點(diǎn),是遇到運(yùn)動(dòng)速度比較快的目標(biāo)物時(shí)會有延遲,并且有色彩串?dāng)_和產(chǎn)生閃爍等問題。
▲圖片來自:3d tof的《HDR技術(shù)詳細(xì)解析》
LOFIC技術(shù)的原理,就是對承載電荷的“桶”進(jìn)行擴(kuò)容,LOFIC電容用于收集橫向溢出的電荷。當(dāng)電荷數(shù)量超過像素CFD原本能承載的最大限度,多余的電荷就不會溢出損失掉,而是會流到相鄰的“桶”里。之后通過讀取“桶”里的電荷,再結(jié)合數(shù)字算法技術(shù),就能夠獲得更高的動(dòng)態(tài)范圍,成像也就更加細(xì)膩、清晰。
而這也是小鵬宣稱LOFIC架構(gòu)方案信息采集能力更強(qiáng)、感知范圍更大,能夠清晰分辨語義信息的原因。
視覺智駕的更大優(yōu)勢是降低了造成成本
在有了云端大模型和LOFIC架構(gòu)加持之后,智駕網(wǎng)在實(shí)際路測過程中,真實(shí)感受到了AI天璣5.4.0系統(tǒng)的智駕能力。
當(dāng)然試駕車輛和量產(chǎn)落地車輛的技術(shù)表現(xiàn)可能存在一定的變化。
在小鵬汽車發(fā)布的數(shù)據(jù)顯示,AI天璣5.4.0系統(tǒng)的“擬人性”提升了4倍,變道成功率提升了53%,繞行成功率提升了155%。
但我們的真實(shí)感受是,這一系統(tǒng)與當(dāng)下眾多采用雷視融合方案的城市高階智駕相比沒有短板,甚至超過不少一線陣營的體驗(yàn)。
而這一系統(tǒng)的另一優(yōu)勢,在于大大降低了造車成本,讓小鵬汽車在市場上更有性價(jià)比優(yōu)勢。
這讓何小鵬敢于在這款車上全系標(biāo)配這一功能,而不再區(qū)分所謂的Pro、Max等版本。
據(jù)了解,小鵬P7+是小鵬汽車首款實(shí)現(xiàn)技術(shù)成本降低25%目標(biāo)的車型,預(yù)計(jì)其利潤率將達(dá)到兩位數(shù)。而此前何小鵬曾透露:“投資人希望這款車的毛利率到20%。”
而隨著造車成本的下降,其強(qiáng)大的性價(jià)比優(yōu)勢顯然會推動(dòng)更多的主機(jī)廠跟隨加入,視覺智駕有沒有可能超越雷視融合方案成為市場主流,小鵬P7+的市場表現(xiàn)十分關(guān)鍵。
x
-
比亞迪、零跑提前完成年度銷量,智駕頭部企業(yè)加碼「車位到車位」丨11月銷量橫評 2024-12-03 15:00
-
奧迪的一小步,合資品牌的一大步 2024-12-03 14:31
-
無圖,擁抱端到端,奔馳在華搶先落地高階智駕 2024-12-03 14:23
-
另起爐灶,廣汽與華為聯(lián)合打造全新高端智能汽車品牌 2024-11-30 16:47
-
全球最短縱置3擋變速器、99%高強(qiáng)度鋼丨長城汽車Hi4-Z全球首拆,為泛越野場景打造 2024-11-30 22:23
-
陽泉高新區(qū)發(fā)布針對純視覺高階智駕車型促銷活動(dòng)方案 2024-12-01 12:52