亚洲精品午夜久久久久久久久久久,国产91精品久久久久久久,国产精品成人av,热99re久久免费视精品频软件,欧美一区欧美二区,在线不卡av网站,亚洲欧洲日本精品一区二区三区

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

理想汽車推送OTA 8.0版本,李想稱公司輔助駕駛開始“全面領(lǐng)先”,VLA優(yōu)于世界模型?

每日經(jīng)濟新聞 2025-09-12 18:04:40

近日,理想汽車推送OTA8.0版本車機系統(tǒng),輔助駕駛等迎來升級。其中,自研的VLA司機大模型向理想MEGA和理想L系列AD Max車型全量推送,但李想坦言推送的是“殘血版”。該模型能看得懂道路、聽得懂指揮、記得住習(xí)慣。清華大學(xué)顏宏偉等專家認為,VLA模型優(yōu)勢在于一體化及更強泛化性。專家表示,VLA與世界模型不矛盾,輔助駕駛技術(shù)架構(gòu)未來2-3年還將迭代。

每經(jīng)記者|孫磊    每經(jīng)編輯|裴健如

“理想汽車的輔助駕駛和智能座艙,從‘局部領(lǐng)先’進入‘全面領(lǐng)先’。”在理想汽車于近日推送OTA8.0版本車機系統(tǒng)后,理想汽車董事長李想在社交媒體上如此表示。

圖片來源:新浪微博(@李想)

近日,理想汽車OTA8.0版本車機系統(tǒng)正式開啟推送,輔助駕駛、智能座艙和智能電動迎來升級。其中,理想汽車自研的新一代輔助駕駛技術(shù)架構(gòu)——VLA(Vision-Language-Action Model,視覺語言行動模型)司機大模型向理想MEGA和理想L系列AD Max車型全量推送。

李想表示,VLA司機大模型是理想汽車的第三代輔助駕駛技術(shù)(第一代是規(guī)則,第二代是端到端,第三代是VLA),而VLA之所以被命名為司機大模型,是因為它“看得懂道路狀況,聽得懂人類指揮,記得住車主習(xí)慣”,更像一個真人版的私人司機。

“推送的VLA為‘殘血版’”

在推送VLA司機大模型的同時,李想也坦言,“因為種種原因,今天全量推送的VLA還是‘殘血版’(一個廣受好評的功能暫時沒推)”。值得一提的是,此前有消息稱,理想汽車的VLA遠程召喚功能被舉報,理想汽車被迫暫停這項功能的推送。

對此,理想汽車方面告訴《每日經(jīng)濟新聞》記者:“自發(fā)布VLA輔助駕駛技術(shù)架構(gòu)以來,我們受到了行業(yè)及各界的廣泛關(guān)注和討論,公司深感責任重大,始終以審慎負責的態(tài)度推進各項新功能的上線進程。”

“9月10日開始,VLA司機大模型及相關(guān)功能將陸續(xù)推送到所有配備AD Max高級輔助駕駛系統(tǒng)的理想L系列和MEGA車型上,各項輔助駕駛功能包括輔助泊車都將得到提升。具體功能我們將依據(jù)相關(guān)法律法規(guī)推送。”理想汽車方面補充道。

圖片來源:理想汽車官微

在9月11日,李想在社交媒體發(fā)文稱,現(xiàn)在網(wǎng)絡(luò)上對9月10日開始推送的OTA8.0版本的理想VLA司機大模型出現(xiàn)“殘血版”原因的分析,大多是不實信息。

據(jù)理想汽車方面介紹,憑借VLA司機大模型對環(huán)境、導(dǎo)航的理解和推理能力,輔助駕駛功能在通過主輔路切換、高架匝道等復(fù)雜路口時,選路更加精準。此外,VLA司機大模型具備車速記憶能力,能夠記住用戶在特定道路的車速偏好,用戶只需要通過對話就可以設(shè)定車速,未來再次通過該路段時,模型將自動調(diào)用記憶并調(diào)整為記憶過的車速。

理想汽車方面還表示,VLA泊車則擁有自主尋路、漫游找車位、導(dǎo)航終點靠邊停車等功能,實現(xiàn)任意車位到任意車位的輔助駕駛體驗。

VLA可被視為端到端的“智能增強版”

除理想汽車外,元戎啟行、小鵬汽車等也在VLA領(lǐng)域進行布局。元戎啟行于8月26日正式發(fā)布自研VLA大模型,推出名為DeepRoute IO 2.0的新平臺,確定將在5款車型上使用;9月4日,小鵬汽車宣布,小鵬G7 Ultra開啟首次OTA推送,其中就包含融合全場景VLA大模型的導(dǎo)航輔助駕駛功能。多家車企競相布局,正是希望借這一模型之力,打通端到端方案的瓶頸。

值得一提的是,傳統(tǒng)規(guī)則與端到端模型都卡在同一道“坎”:一旦遇到訓(xùn)練集里沒見過的場景,系統(tǒng)就“發(fā)懵”,只能事后打補丁。但現(xiàn)實路況千變?nèi)f化,沒有辦法在數(shù)據(jù)中窮舉所有的可能,因此長尾場景一直是自動駕駛最大的挑戰(zhàn)。“VLA能夠更好地解決上述問題。”清華大學(xué)車輛與運載學(xué)院助理研究員顏宏偉認為,VLA模型的主要優(yōu)勢在于模型一體化及更強的泛化性,即應(yīng)對復(fù)雜場景的能力。

據(jù)悉,VLA相較端到端具有諸多優(yōu)勢,可被視為端到端的“智能增強版”。VLA中的V指的是感知,A是執(zhí)行,中間的L則是語言模型(Language Model)。V負責感知環(huán)境,A負責動作執(zhí)行,中間的L的作用類似于“中臺”,將V的內(nèi)容,也就是感知的內(nèi)容轉(zhuǎn)譯成A執(zhí)行的規(guī)劃和決策。“VLA是多模態(tài)大模型驅(qū)動的智能體架構(gòu),其核心突破在于引入思維鏈,通過語言模型實現(xiàn)對環(huán)境理解與決策推理的可解釋性。”顏宏偉說。

元戎啟行CEO周光認為:“VLA模型融合了語言模型,具備強大的思維鏈能力,能擺脫傳統(tǒng)端到端模型的黑盒難題,并將信息串聯(lián)、分析,從而推理出因果關(guān)系。此外,它天然集成海量知識庫,泛化能力更強,能夠更好地適應(yīng)復(fù)雜多變的真實道路環(huán)境。”

圖片來源:元戎啟行官微

理想汽車自動駕駛研發(fā)負責人郎咸朋也表示:“(VLA)真正發(fā)揮作用的是背后推理的長思維鏈。如果沒有強大的L,再好的V和A都無法發(fā)揮出來。這跟人與動物的區(qū)別很相似。論視覺能力人比不過鷹,論行動速度比不過獵豹,但人之所以能夠稱霸地球,靠的是強大的認知和理解能力。而這個認知和理解能力就來自于人類特有的語言能力。”

此外,郎咸朋還強調(diào),“L”指代語言學(xué)習(xí)能力,它并不是簡單地用語言做顯示的文字推理,而是用語言提供的數(shù)據(jù)學(xué)習(xí)隱式的邏輯推理。

“當語言模型與輔助駕駛相遇,一切都變得簡單了。盡管VLA模型的表現(xiàn)目前處于持續(xù)提升階段,但VLA模型的下限已超過端到端上限,未來會越來越好。”周光還表示。

VLA與世界模型不沖突

有企業(yè)重點布局VLA領(lǐng)域,有企業(yè)則不認同該技術(shù)路徑。比如,華為智能汽車解決方案BU CEO靳玉志就表示:“我們不會走向VLA的路徑。這樣的路徑看似取巧,其實并不是走向真正自動駕駛的路徑。”

“華為更看重WA(世界行為模型),也就是World Action,中間省掉Language這個環(huán)節(jié)……直接通過Vision這樣的信息輸入控車,而不是把各種各樣的信息轉(zhuǎn)成語言,再通過語言大模型來控制車。”靳玉志進一步解釋稱,華為乾崑自研的WEWA架構(gòu)包含云端的世界引擎(WE)與車端的世界行為模型(WA)。其中,WE負責海量數(shù)據(jù)訓(xùn)練與場景生成,WA則實現(xiàn)車端的實時環(huán)境推理與擬人化決策。

靳玉志提到的這種“世界模型”源自人類對環(huán)境的認知機制,指的是AI系統(tǒng)通過感知數(shù)據(jù)構(gòu)建一個對物理世界的內(nèi)部模擬,從而具備預(yù)測、推理和生成合理行為鏈的能力。在輔助駕駛中,它不再只是“看見”世界,而是理解世界,預(yù)測未來可能發(fā)生的情況,并提前做出決策。例如,它不僅能識別前方有一輛自行車,還能預(yù)測它是否會突然變道,從而提前減速或避讓。除華為外,蔚來、商湯等企業(yè)也都在此技術(shù)路線上進行布局。

需要注意的是,盡管不同企業(yè)對于VLA和世界模型兩種技術(shù)“各執(zhí)一詞”,但兩者并不矛盾,VLA路線也結(jié)合了部分與駕駛數(shù)據(jù)相關(guān)的世界模型。例如,李想提出VLA可以拆解為預(yù)訓(xùn)練、后訓(xùn)練和強化學(xué)習(xí)三個層面。強化學(xué)習(xí)中最重要的一步就是在世界模型里閉環(huán)學(xué)習(xí),引入舒適度、碰撞、交通規(guī)則等規(guī)則來打磨、反饋,讓VLA比人類開得更好。

此外,世界模型雖然更強調(diào)“海量使用云端模擬的數(shù)據(jù)、來讓大模型‘理解’世界而學(xué)會駕駛”,但其最底層的世界模型仍需要Transformer技術(shù)驅(qū)動,而Transformer是VLA的底層骨干網(wǎng)絡(luò)。華為此前在和浙大、港科大的相關(guān)科研成果中,多次提到這一點。

“我了解大部分公司兩種技術(shù)都用。世界模型和VLA模型不是一個維度的東西,而是交錯的。我可以有訓(xùn)練,比如說基于各種復(fù)雜輸入的事件模型的理念,所以這兩個東西不矛盾、不沖突。”小馬智行CTO樓天城表示,“我認為想要做百輛無人車以上,世界模型最關(guān)鍵。對其他公司(而言),可能做VLA模型賣車最關(guān)鍵。大家選擇不同的路線是因為目標不同。”

對于輔助駕駛底層技術(shù)的演進,千里科技董事長印奇認為,智駕行業(yè)在3年內(nèi)將迎來技術(shù)收斂。長安汽車智能駕駛高級總工程師則表示,在未來2~3年內(nèi),輔助駕駛的技術(shù)架構(gòu)還將迎來1至2輪迭代,到2028年有望收斂至相對穩(wěn)定的狀態(tài)。

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0