當前位置: 滿電-新能源汽車>智己郭輝:打造“更像人”的智能駕駛
立足于各種交通場景,智己打造“更像人”的智能駕駛。
導語網通社快訊 9月28日,由中國電動汽車百人會舉辦的2023年全球智能汽車產業(yè)大會(GIV2023)在合肥召開。在以“智能汽車產業(yè)化發(fā)展新階段”為主題的高層論壇上,智己汽車副CTO、智能駕駛首席科學家郭輝以“‘更像人’的智能駕駛,智己對智駕技術的探索與思考”為題發(fā)表演講。
郭輝表示,打造“更像人”的智能駕駛,是智己在智能駕駛領域一直追求的目標。智己實現(xiàn)的路徑是基于數(shù)據驅動,立足于各種交通場景,打造有溫度、“更像人”的智能產品,實現(xiàn)差異化的用戶體驗。
以下為演講實錄
首先我簡短介紹一下智己汽車,我們是一家年輕的公司,也是一家快速成長的公司,成立于2020年12月25日,是上汽集團牽頭成立的一家合資公司,致力于成為智能時代出行變革的實現(xiàn)者。我們在2021年發(fā)布了第一款車L7,并在去年6月開始交付給用戶,也在用戶的心目中打造了電動車駕控的品質標簽。今年一季度我們開始交付第二輛SUV S7,在用戶端也獲得了好評。今年10月我們將發(fā)布第三款車LS6,將搭載最新的智駕技術。
今天我的報告分三部分:
第一,打造“更像人”的智能駕駛體驗,這是在開發(fā)領域一直追求的目標。
第二,我們如何打造“更像人”的智能駕駛體驗。
第三,報告一下我們在智能化技術演進方面的思考。
打造“更像人”的智能駕駛,是智己在智能駕駛領域一直追求的目標,我們實現(xiàn)的路徑是基于數(shù)據驅動,立足于各種交通場景,打造有溫度、“更像人”的智能產品,實現(xiàn)差異化的用戶體驗。
智己在智能化、智能駕駛領域所積累的優(yōu)勢來自于在上汽集團,2014年就已經依托于上汽的前瞻工程團隊在智能駕駛領域進行相關的研究,在規(guī)控、智駕系統(tǒng)方面建立了豐富的技術積累。2017年,上汽集團成立了人工智能實驗室,開啟了在深度學習方面的全面布局。2020年,我們成立了智己汽車以后,和Momenta進行了強強合作,率先在智能駕駛這個垂直領域使用傳感器、多任務的Transformer模型,基于時序BEV的機制實現(xiàn)了OneModel感知模型的邏輯量產,2023年一季度,我們聯(lián)合Momenta發(fā)布了基于深度學習的規(guī)劃這樣一個人工智能模型。
什么是“更像人”的智能駕駛呢?我想借助幾個場景的案例可能更容易幫助大家理解。
第一個案例,關于擁堵插空變道,這是我們在日常生活中最常見的交通場景,這個場景對于現(xiàn)在的智能駕駛挑戰(zhàn)還是比較大的,因為這個過程中車輛在不斷加減速,周圍的環(huán)境在動態(tài)變化,車與車在擁堵的情況間隙也非常小,一方面要求感知精度要非常高,對于周圍車輛的軌跡預測要非常準。二是對于我們在關聯(lián)系統(tǒng),包括像橫向的控制、縱向的控制,要求非常精準。這個視頻展示的是智己汽車的智駕系統(tǒng)在擁堵的交通場景下實現(xiàn)了絲滑的編導,體現(xiàn)了“更像人”的感知和規(guī)劃決策。
第二個案例,一個擁堵跟車的場景案例。從左邊這個視頻可以看到,這個橙色的框代表了智己的智駕系統(tǒng)基于算法做出來的結果,白色的框是專家司機開車時候的狀態(tài)。從這個圖可以看到,他們之間的差距相對是較小的。在整個智駕的開發(fā)過程中,我們通過大數(shù)據的驅動,也會根據用戶的駕駛風格去學習用戶所習慣的跟車安全距離、以及相應的車速,帶給用戶最舒適的智駕感受。
第三個案例,這是一個復雜的場景用戶交互的例子,因為在自動駕駛的時候,往往用戶的痛點是不知道什么時候要接管,在智己的智能駕駛當中,我們通過風險等級預警和多模態(tài)的交互方式,通過直觀的表達,比如類似于WiFi信號這樣的標記,能夠讓用戶清晰的感知到系統(tǒng)對于當前場景處理的信心,提升用戶在使用智駕系統(tǒng)時候的安心感和信任感。
當然正如前面張院士所提到的,我們現(xiàn)在智駕技術一方面在快速的發(fā)展,朝著L4+這樣的方向前進,同時我們也還將長時間處于人機共駕的階段,所以一方面智駕技術本身的發(fā)展非常重要,另一方面在人駕的環(huán)境下、場景下智駕如何服務于人駕,這也是具有很高價值的用戶場景。
我們舉了三個例子,這是智己的智駕系統(tǒng)當中我們認為對于人駕當中能夠提供比較高的用戶價值的場景。
1、一鍵脫困。這是我們用視覺融合泊車能夠輕松的泊入一些困難的車位,當然當我們要泊出來的時候不那么容易,可以使用一鍵脫困的功能,輕輕一鍵可以用智駕系統(tǒng)幫你能夠從復雜的環(huán)境當中輕松脫困。
2、一鍵貼邊。我們在水平車位泊車的時候,即便有經驗的司機都會感覺到還是有一些困難、有一些障礙的,使用一鍵貼邊的功能可以幫助我們的司機尤其是新收司機可以輕松的對齊一鍵貼邊。
3、一鍵循跡。針對小區(qū)的場景,大家開到小區(qū)找車位,開到那個地方發(fā)現(xiàn)已經停滿了,但是要從里面倒出來,只有一條道怎么辦,一鍵循跡的功能可以幫助駕駛員輕松的返回原來的位置。
當然在L2+方面智己已經量產了非常多的功能,包括像高速領航功能,我們今年4月份發(fā)布之后今年年底也會覆蓋全國,包括去高精地圖的NOA,昨天也已經開始了正式的公測,城市NOA在10月份我們會開啟正式公測。
這里舉的兩個場景案例,關于城市領航輔助的場景。
第一個案例,在路口的時候,這是一個右轉,會經歷一個突然穿插出來的兩輪車、還有過路的行人,這個過程中可以看到,我們的智駕系統(tǒng)做的精準的判斷,并沒有剎停,而是通過平穩(wěn)避讓的方式、通過無接管的方式通過了轉彎的路口。
第二個案例,在夜間的人車混流的場景,大家可以看到,在畫面的上方還有一部分是逆光的環(huán)境,即便在這樣的復雜環(huán)境中遇到前方有障礙車輛,智駕系統(tǒng)頁能夠輕松應對繞行通過。
整體來講,智能駕駛特別是在L2++這個階段如何為用戶提供更大的可感知的價值是我們追求的方向,這也是我們?yōu)槭裁创蛟臁案袢恕钡闹悄荞{駛。從智己的智駕功能迭代路線來看,泊車方面,從更多的停車場場景的擴展,從功能上現(xiàn)在的視覺融合泊車、到記憶泊車、到代客泊車,不斷進行拓展。行車方面,從原來依賴于高精地圖的領航輔助,到逐漸實現(xiàn)重感知、輕地圖的領航輔助,同時從原來少量場景的領航輔助行駛到端到端的智慧出行,這是我們在行車方面的一個技術路線。
如何實現(xiàn)“更像人”的智能駕駛?智己也打造了智能駕駛的技術平臺,下面我從三個方面來進行解釋。
第一個,硬件方面,要有一個高效的計算平臺。從智己在硬件方面的規(guī)劃,我們堅定的走視覺融合的一條技術路線,從傳感器規(guī)劃方面,我們使用了11個攝像頭、5個毫米波雷達、2顆激光雷達,隨著算法能力的提升,我們會減少毫米波雷達和激光雷達的數(shù)量,攝像頭是我們主要的傳感器。算力平臺方面,我們使用英偉達的大算力芯片,硬件形態(tài)上,從原來的行泊一體的功能域控制器會向艙駕融合的計算平臺發(fā)展。
計算效率,對于模型的工程化我們實現(xiàn)了500%的效率提升,帶來的結果是90%的算力下降。因此,基于有限的算力平臺可以實現(xiàn)全域的視覺融合,同時單激光雷達就可以覆蓋全量的城市場景以及區(qū)域高精地圖這樣的算法。
第二個,很重要的是算法的持續(xù)迭代和性能的快速升級。包含兩方面,一方面是感知智能方面,我們叫DDLD和DDOD,就是基于數(shù)據驅動的道路環(huán)境檢測和基于數(shù)據驅動的目標檢測?;跀?shù)據驅動的道路環(huán)境檢測,是指我們在車輛的行進過程當中可以進行實時的建圖,并且能夠通過多次的行駛將感知的結果進行融合,能夠更好的去識別道路的特征。在DDOD來講,我們會結合使用空間占用網絡,能夠對通用障礙物進行識別,接下來在即將發(fā)布的智駕系統(tǒng)當中會應用DDOD的算法。今年4月份,前面提到我們發(fā)布的基于深度學習的規(guī)劃算法,從DDOD到DLP都代表了我們在數(shù)據驅動這個方法論上不斷的去演進我們的感知算法包括規(guī)劃算法。
當然數(shù)據驅動離不開高利用率的數(shù)據驅動平臺,智己也搭建了完整的數(shù)據鏈路工廠CLA4.0,可以實現(xiàn)對長尾場景的數(shù)據篩選,包括采集、處理、標注、評測、部署的整個自動化,可以實現(xiàn)從數(shù)據到算法的快速迭代。數(shù)據當然不光是用于算法的迭代,也用于研究用戶的痛點在哪里,對實踐的場景為未來的開發(fā)指明方向。當然我們所有的這些數(shù)據都會在車端進行脫敏,符合國家對于數(shù)據安全的要求。
最后簡單談一下我們對于未來智能化技術演進的兩點思考。
第一個,在算法方面,前面張院士也提到,從算法的演進路線來看,從原來的單個模塊的比如感知或者規(guī)劃的數(shù)據驅動的鏈路,逐漸會演進為端到端的人工智能模型。
第二個,還有一個很重要的,在人工智能模型基礎上要加一個安全的框架,因此我們也在開發(fā)基于規(guī)則的安全框架,作為未來智駕系統(tǒng)能夠達到更高安全等級的技術儲備。
除了智駕本身以外,目前隨著電子電氣架構的發(fā)展,艙和駕逐漸在融合,特別是結合人機共駕的場景,艙和駕是密不可分的。就像我們前面所講到的,新的技術包括GPT的技術等等,都會帶來智能駕駛和智能座艙進一步提升的可能,也使得他們加速融合。在生成式預訓練技術的應用方面,智能駕駛我們目前正在探索的包含了在云端的仿真、包含用大模型訓練小模型的探索,在智能座艙方面,基于在語義識別方面的優(yōu)勢,GPT技術可以一方面在云端提升人類對指令理解的準確度,同時這個模型小型化之后也可以部署到車端。
在智駕領域,一方面是智駕的算法在快速迭代,我們還是相信系統(tǒng)對于環(huán)境的理解,甚至在某些方面是可以超過人類的,所以會持續(xù)提升智能化的程度。當然隨著V2X技術的發(fā)展,智慧的路也會對智能化起到非常大的幫助作用。
正如前面提到的,我們也相信智能駕駛不光是單獨的發(fā)展,在今天人機共駕的場景下,我們使用智駕的技術去服務于人駕,更好的賦能人駕,能夠實現(xiàn)用戶體驗更大的增值。