[汽車之家 技術(shù)說] 小鵬G7(參數(shù)|詢價)近日正式上市,頂配售價22.58萬元,它身上最為吸睛的配置,就是采用3顆小鵬自研的圖靈AI芯片構(gòu)建起來的智駕平臺,總算力達到2250TOPS,達到了單顆英偉達Orin-X芯片紙面算力的8倍多。目前市場上的量產(chǎn)新車中,智駕域控算力能夠與小鵬G7匹敵的應(yīng)該就只有搭載兩顆NX9031芯片的,售價達到80萬級別的蔚來ET9了。小鵬G7這波算力下放究竟為了什么?下面我們來盤一盤。
● 3芯2250TOPS算力,目標明確!
小鵬G7上面的3顆圖靈芯片總算力達到2250TOPS,也就是說,單芯算力達到750TOPS,總內(nèi)存達到216GB。20萬級別的車搭載超2000TOPS算力、200GB內(nèi)存的智駕域控,接地氣的說法就是“買車送服務(wù)器,媽媽再也不用擔心它的算力不足了”。
在發(fā)布會上,小鵬也介紹過,其認為L3級(即有條件自動駕駛)算力AI汽車有兩大標準,其一是本地有效算力大于2000TOPS,其二是能夠本地部署VLA+VLM模型。
從智駕供應(yīng)鏈企業(yè)提供的一些信息來看,采用英偉達Drive AGX計算平臺來推動VLA模型只能達到5FPS(Frame per Second,每秒幀數(shù))的速度,實時性強差人意;而采用新一代英偉達Drive AGX計算平臺來推動VLA模型的話,則能夠?qū)崿F(xiàn)約20FPS的速度,達到可用水平。
上面提到的英偉達Drive AGX計算平臺,其核心計算機為英偉達Drive Orin,其上Orin芯片集成的DLA深度學習加速器算力為87TOPS(INT8),集成的安培(Ampere)架構(gòu)GPU算力為167TOPS,87+167=254,這就是為什么網(wǎng)上對外宣傳Orin-X芯片算力254TOPS的原因。而Orin芯片集成的GPU,其采用的安培(Ampere)架構(gòu),已應(yīng)用在英偉達30系消費級顯卡上面了,如:RTX3080等。
新一代英偉達Drive AGX計算平臺,其核心計算機更新為英偉達Drive Thor。該核心計算機的算力具備可擴展性,其開發(fā)套件信息表明,它有500/1000/2000TOPS算力的多個版本。對于國內(nèi)已經(jīng)裝車的采用Thor系列芯片的智駕域控來看,普遍采用的是700TOPS算力的版本,也就是市場上常見的Thor-U芯片。
英偉達Drive Thor內(nèi)部同樣集成DLA和GPU,其GPU采用的是Blackwell架構(gòu),也就是現(xiàn)在處于當打之年的英偉達50系消費級顯卡所采用的架構(gòu)。
從筆者對一些新車智駕系統(tǒng)的實際體驗來看,500TOPS算力搭配第一梯隊的智駕軟件,可以在主流的城區(qū)智駕、高速智駕、智能泊車等熱門智駕場景中獲得較好體驗(搭載兩顆Orin-X芯片,算力達到508TOPS的小鵬MONA M03就是一個很好的例子,感興趣的可以看看AH-IT“千里智測”相關(guān)報道)。簡單來說,算力高低決定的是智駕體驗的天花板,智駕軟件優(yōu)劣則決定了智駕體驗的地板。
2000-500-1000=500TOPS,剩下的500TOPS則可以用來部署VLM模型;或作為算力冗余,通過動態(tài)計算分配(Dynamic Compute Allocation)和多域計算隔離(Multi-Domain Compute Isolation)等技術(shù)對智能座艙所需算力實施賦能。
對VLA和VLM模型不了解的可以看看我同事寫的這篇文章。我用最通俗的話來簡單介紹下,VLM模型可以把攝像頭拍到的路牌、限速、路面標識圖像信息轉(zhuǎn)化成文字并進行理解,最后的輸出一段對場景理解后的文字描述,用四個字來描述就是“看圖說話”。
例如看到路邊臨停車輛打轉(zhuǎn)向燈就知道做防御性減速,看到潮汐車道文字信息就知道看看現(xiàn)在的時間、實際車流走向以及實時交通信息來指導(dǎo)車輛選擇合適的車道行駛,來提升通行效率,再用四個字來概括就是“知行合一”。
“知行合一”是明代哲學家——王守仁 ( 王陽明 )提出的哲學思想,強調(diào)知識與實踐的統(tǒng)一性。該理論認為:認知與行動不可分割,知是行的先導(dǎo),行是知的體現(xiàn),二者互為表里。筆者認為用“知行合一”來形容VLA模型再貼切不過了。
● 216GB內(nèi)存?要把服務(wù)器搬上車嗎?
我剛剛?cè)柫艘幌翫eepseek滿血版,“目前蘋果公司最新性能最強的筆記本,配備了多少GB內(nèi)存?”它告訴我,目前蘋果公司最新性能最強的筆記本電腦是2025款MacBook Pro,搭載M4 Max芯片,內(nèi)存可選最大容量為96GB。
為什么要這么大的內(nèi)存呢?其實上面一個章節(jié)已經(jīng)透露了答案。小鵬希望在車端本地化部署端到端智駕模型、VLM模型以及VLA模型,那么超大內(nèi)存絕對是必不可少的配置。
從筆者實際使用體驗來看,70b Deepseek-R1 INT4量化模型,從資料記憶庫容量到邏輯推理能力都能夠達到一個非??捎玫乃?,起碼讓它匯總/簡化一些文字資料、做做表格啥的它都能勝任,甚至《水滸傳》的108位英雄的名字和背景,它也能娓娓道來。
到了AI時代,內(nèi)存帶寬是絕對的瓶頸。由于顯卡顯存帶寬是內(nèi)存帶寬的數(shù)至數(shù)十倍,所以在顯卡上訓(xùn)練/推理AI模型會比在CPU上要快得多。
電路板分為三塊,每一塊上都集成了一顆圖靈芯片。最大的一塊主要用于運行智駕系統(tǒng)的“小腦”——VLA - OL模型,其余兩塊電路板分別負責智駕系統(tǒng)(官方稱其為智駕系統(tǒng)的“大腦”)和VLM大模型的運算。
何小鵬稱,每顆圖靈芯片會配備4顆,單顆容量為16GB的內(nèi)存芯片,總?cè)萘繛?4GB,所以與3顆圖靈芯片連接的內(nèi)存總量為192GB。剩下的24G指的應(yīng)該是與8295P芯片連接的內(nèi)存。從展示影像中我們可以看到,8295P的核心板是與其中一顆圖靈芯片集成在同一塊電路板上的。
從應(yīng)用方向上來看,筆者猜測這些內(nèi)存實現(xiàn)的帶寬應(yīng)該不低,數(shù)百GB/s應(yīng)該是底線,否則無法滿足大模型推理的實時性需求。同時,鑒于DDR4/5類型的內(nèi)存位寬只有64bit,為進一步提升內(nèi)存帶寬,多通道內(nèi)存技術(shù)大概率會應(yīng)用在圖靈芯片上,筆者猜測圖靈芯片支持四通道內(nèi)存技術(shù),可實現(xiàn)256bit的等效內(nèi)存位寬。
● 激動之余,也有隱憂
雖然小鵬沒有公布圖靈芯片的功耗信息,但參考英偉達同類產(chǎn)品的數(shù)據(jù),英偉達Drive Thor雖然算力大幅提升,但其峰值功耗達到了120W,是前代英偉達Drive Orin的2倍左右。
對于電子電器架構(gòu)來說,元器件越多,出現(xiàn)故障的概率就會越大,尤其是對汽車上的電子電器部件來說,較大的振動和寬溫域工作溫度,更是放大了這一點。小鵬G7這套擁有2250TOPS算力+216GB內(nèi)存的智駕域控,其穩(wěn)定性和耐久性表現(xiàn)目前還尚待觀察。
我倒是很好奇,小鵬G7上面這個性能如此強大的域控,其冷卻系統(tǒng)布局有何巧妙之處?如何做到小型化?希望官方能搞個拆解展具,給大家一個學習的機會。
● 編輯總結(jié):
2025年,各大品牌都開始為VLA模型上車落地做鋪墊。VLA模型在2025年內(nèi)落地幾乎已成板上釘釘?shù)氖虑?。從目前各廠家VLA模型工程樣車的實際表現(xiàn)來看,VLA模型的技術(shù)基礎(chǔ)和算力配套都已就位,但在功能優(yōu)化和應(yīng)用創(chuàng)新上還有巨大發(fā)展空間和挖掘潛力,未來VLA模型能做的當然不止語音控車那么簡單,它會逐步覆蓋智能駕駛的各個方面,或許這就是各廠家紛紛為新車做算力預(yù)埋的原因。
筆者認為,小鵬G7智駕域控2250TOPS的算力預(yù)埋,預(yù)計能夠滿足未來至少2-3年智能駕駛技術(shù)發(fā)展對算力的需求。值得強調(diào)的一點是,硬件算力和軟件配套是智駕域控性能的一體兩面,它們相伴而生,決定著智駕系統(tǒng)的實際使用體驗。超強域控能否大展拳腳,還得看軟件研發(fā)團隊的功力。小鵬作為國內(nèi)智駕領(lǐng)域的頭部車企,它的軟件研發(fā)能力多少能給人一些信心。(圖/文/攝/汽車之家 常慶林)