智能汽車是機(jī)器人的第一形態(tài),對(duì)應(yīng)的智能座艙也引領(lǐng)了機(jī)器人時(shí)代人機(jī)交互發(fā)展的新方向。歷史上,每一次交互方式的改變,都重塑了智能設(shè)備的產(chǎn)業(yè)格局。正如DOS轉(zhuǎn)向Windows時(shí)代帶來(lái)的產(chǎn)業(yè)巨變一樣,人機(jī)自然交互打開了一道通向新產(chǎn)業(yè)的大門。

其中智能座艙是智能汽車與人類交互的第一“場(chǎng)所”,其最理想的交互模式應(yīng)該是什么樣呢?

自然交互實(shí)現(xiàn)方式是什么?

智能汽車本質(zhì)上是載人機(jī)器人,機(jī)器人最重要的兩項(xiàng)能力是自主決策能力和人機(jī)交互能力,缺乏其中任何一項(xiàng),就無(wú)法有效地為人類服務(wù)。因此打造智能的人機(jī)交互能力是其必選項(xiàng)。

如何衡量人機(jī)交互的智能化程度呢?我認(rèn)為是使用圖靈測(cè)試,即機(jī)器能否在交互行為的表現(xiàn)上和人無(wú)法區(qū)分。

如何實(shí)現(xiàn)自然交互呢?傳感器、算力和算法缺一不可。

座艙內(nèi)會(huì)融合越來(lái)越多的傳感器,一方面會(huì)使座艙內(nèi)算力需求不斷飆升,座艙里的AI算力需求將上升到30TOPS以上,甚至百TOPS級(jí)別的水平;另一方面也提供了更好的感知能力支撐。

座艙傳感器

在數(shù)量和種類上都在迅速提升

AI計(jì)算能實(shí)現(xiàn)人臉、表情、手勢(shì)、語(yǔ)音等多信息的感知,從而實(shí)現(xiàn)更加智能的人機(jī)交互。座艙人機(jī)交互的計(jì)算必須依賴邊緣計(jì)算,而不是云計(jì)算來(lái)實(shí)現(xiàn)。原因有三點(diǎn):即可靠性、實(shí)時(shí)性和隱私保護(hù)。

個(gè)人隱私保護(hù)可能是我們這一代人在AI時(shí)代面臨的最大挑戰(zhàn)之一,座艙內(nèi)的私密空間,隱私保護(hù)問(wèn)題更加突出。今天的語(yǔ)音識(shí)別,絕大部分仍然是在云端進(jìn)行,其中的聲紋等生物信息可以輕易暴露個(gè)人身份。通過(guò)在車端進(jìn)行邊緣AI計(jì)算,可以將視頻、語(yǔ)音等個(gè)人生物信息去除,轉(zhuǎn)化為語(yǔ)義信息,再上傳到云端,可以有效保護(hù)車內(nèi)個(gè)人數(shù)據(jù)隱私。

交互智能必須跟駕駛智能相匹配

在可以預(yù)見的未來(lái),人機(jī)共駕都會(huì)是長(zhǎng)期存在的狀態(tài),座艙內(nèi)的人機(jī)交互是人了解自動(dòng)駕駛能力的第一界面。

當(dāng)前智能汽車技術(shù)存在進(jìn)化不均衡的挑戰(zhàn),人機(jī)交互能力落后于自動(dòng)駕駛能力的發(fā)展,導(dǎo)致自動(dòng)駕駛事故頻發(fā),影響了自動(dòng)駕駛的普及。

人機(jī)共駕的特點(diǎn)是人在駕駛回路中(Human In the Loop),因此,人機(jī)交互能力必須跟自動(dòng)駕駛能力相匹配,否則將帶來(lái)嚴(yán)重的預(yù)期功能安全問(wèn)題,幾乎所有的自動(dòng)駕駛致命事故都與此有關(guān)。即使不發(fā)生事故,對(duì)自動(dòng)駕駛狀態(tài)的不了解也會(huì)讓人產(chǎn)生嚴(yán)重的恐慌和焦慮。

例如,自動(dòng)駕駛系統(tǒng)在實(shí)際駕駛工況中,經(jīng)常出現(xiàn)“鬼剎車”的情況。如果人機(jī)交互界面能夠顯示自動(dòng)駕駛的感知結(jié)果,司機(jī)就可能會(huì)明白系統(tǒng)誤判是由于把路上的一個(gè)易拉罐識(shí)別成了一輛車導(dǎo)致的。

為什么特斯拉把越來(lái)越多的自動(dòng)駕駛感知結(jié)果展示出來(lái),背后的出發(fā)點(diǎn)就是這一原因。隨著自動(dòng)駕駛的能力越來(lái)越強(qiáng),用戶將越來(lái)越關(guān)注自動(dòng)駕駛系統(tǒng)在虛擬3D環(huán)境中呈現(xiàn)的過(guò)程和狀態(tài)。

人機(jī)交互與自動(dòng)駕駛相輔相成

例如,未來(lái)更為人性化的泊車應(yīng)該是人車共泊的,包括人對(duì)車的接管和車對(duì)人的接管,比如車遇到困難路況,可能會(huì)說(shuō)我不太有把握,請(qǐng)求接管。再比如人遲遲停不進(jìn)去,AI算法推薦是否開啟自動(dòng)泊車。

這種艙泊一體的方案能提升智能座艙交互和泊車的整體體驗(yàn),還能大幅節(jié)省硬件成本:通過(guò)分時(shí)復(fù)用AI芯片的資源,可以同時(shí)滿足座艙感知與APA泊車感知的需求,從而為行業(yè)提供高性價(jià)比方案,也可讓智能化下探到更多中低端車型。在國(guó)內(nèi),地平線和映馳科技合作,正在推進(jìn)這一方案開發(fā)。

當(dāng)前,智能座艙的交互方式主要還是手機(jī)安卓生態(tài)的延伸,主要由實(shí)體屏幕來(lái)支撐。今天屏幕越變?cè)酱螅踔吝_(dá)到60寸,這實(shí)際上是用低優(yōu)先級(jí)的功能占據(jù)了高優(yōu)先級(jí)功能的空間,還帶來(lái)額外的信息干擾,容易讓人分心,影響駕駛安全。

實(shí)體屏幕在未來(lái)依然會(huì)存在,但我的判斷是,未來(lái),實(shí)體屏幕和觸控將不再是座艙交互的中心,取而代之的是自然交互+ARHUD。

第一個(gè)原因:面向自動(dòng)駕駛的人機(jī)交互屬于“溫飽”問(wèn)題,是剛需,屬于安全域,有最高優(yōu)先級(jí);面向音樂(lè)、游戲和舒適性的人機(jī)交互是“小康”需求,屬于娛樂(lè)域,在實(shí)現(xiàn)了前一階段任務(wù)后才能有足夠的施展空間。

因此,未來(lái)座艙內(nèi)娛樂(lè)域和安全域人機(jī)交互和自動(dòng)駕駛的定位會(huì)調(diào)過(guò)來(lái),安全域會(huì)成為主控制域。

第二個(gè)原因:自然交互方式+AR-HUD的交互界面更加安全,例如通過(guò)語(yǔ)音和手勢(shì)交流,可以避免駕駛員視線偏移,從而提升駕駛安全。而座艙的大屏是無(wú)法做到這一點(diǎn)的,相比之下,AR-HUD可以做到在顯示自動(dòng)駕駛感知信息的同時(shí)避免了這個(gè)問(wèn)題。

第三個(gè)原因:自然交互方式是隱形的、簡(jiǎn)約的、更加情感化的交互方式,不會(huì)過(guò)多地占用車內(nèi)寶貴的物理空間,但卻可以做到隨時(shí)陪伴在身邊,給予駕駛員及乘客更多的信任感、安全感。

綜合以上分析,未來(lái)智能駕駛和智能座艙的跨域融合是較為確定的發(fā)展方向,最終誕生的就是車載中央計(jì)算平臺(tái)。

當(dāng)前發(fā)展階段、前沿實(shí)踐以及挑戰(zhàn)

目前,座艙的語(yǔ)音識(shí)別基本已經(jīng)普及,語(yǔ)音識(shí)別主流廠商主要使用端到端算法,在理想實(shí)驗(yàn)環(huán)境下語(yǔ)音識(shí)別準(zhǔn)確率可高達(dá)98%以上。

DMS正在急速普及,預(yù)測(cè)至2030年裝備車內(nèi)攝像頭的車型占比將超過(guò)50%。

DMS普及勢(shì)頭迅猛,下一步將是語(yǔ)音+手勢(shì)+眼球跟蹤+AR-HUD交互界面的組合,這是對(duì)應(yīng)于L3+級(jí)別自動(dòng)駕駛的智能交互方式。業(yè)內(nèi)領(lǐng)先的車企已經(jīng)開始布局。

中國(guó)自主品牌在這一塊的實(shí)踐基本上跟國(guó)外領(lǐng)先品牌是并駕齊驅(qū)的,從迭代速度上看還要更快。2020年,長(zhǎng)安推出的UNI-T車型就包含多項(xiàng)主動(dòng)服務(wù)。比如:如果駕駛員正在接聽電話,系統(tǒng)會(huì)自動(dòng)降低多媒體音量;再比如,當(dāng)車機(jī)中控屏處于熄屏狀態(tài)時(shí),注視屏幕一秒即可喚醒屏幕。該方案搭載了地平線的征程2芯片,支持通過(guò)語(yǔ)音、動(dòng)作姿態(tài)、面部表情等指令的交互。

理想中的自然交互目標(biāo)是從用戶體驗(yàn)出發(fā),需要提供穩(wěn)定、流暢、可預(yù)期的交互體驗(yàn)。但理想再“豐滿”,也得從“骨感”的現(xiàn)實(shí)起步,當(dāng)前挑戰(zhàn)依舊眾多。

例如,當(dāng)前自然交互的誤識(shí)別情況依然嚴(yán)峻,全工況、全天候的可靠性和準(zhǔn)確率還不夠。比如手勢(shì)識(shí)別,也許駕駛員不經(jīng)意間動(dòng)一下手勢(shì),就會(huì)被誤識(shí)別為一個(gè)命令動(dòng)作,這只是無(wú)數(shù)種誤識(shí)別情況之一,在移動(dòng)狀態(tài)下,光照、震動(dòng)、遮擋等都是巨大的工程挑戰(zhàn)。自然交互的流暢度也是亟待解決的問(wèn)題,這需要更高性能的傳感器、更強(qiáng)大的算力和高效算法來(lái)逐漸改善。而同時(shí)自然語(yǔ)言理解(NLP)和意圖理解依然處于早期階段,還需要算法理論創(chuàng)新。

人機(jī)自然交互

是機(jī)器人時(shí)代的基石性發(fā)明

在當(dāng)下激烈的行業(yè)競(jìng)爭(zhēng)中,智能座艙已經(jīng)成為整車廠實(shí)現(xiàn)功能差異化的關(guān)鍵一招,座艙人機(jī)交互與人的溝通習(xí)慣、語(yǔ)言文化等密切相關(guān),因此必須是高度本地化的。智能座艙人機(jī)交互是中國(guó)智能汽車公司品牌向上的重要突破口,更是中國(guó)智能汽車技術(shù)引領(lǐng)全球技術(shù)潮流的突破口。

智能座艙產(chǎn)業(yè)鏈將持續(xù)延伸,會(huì)有更多“玩家”進(jìn)入到智能汽車這個(gè)大生態(tài)中,智能汽車“玩家”也會(huì)跨界進(jìn)入更多的機(jī)器人領(lǐng)域,未來(lái)智能座艙生態(tài)圈發(fā)展主題將圍繞“生態(tài)協(xié)同”與“跨界延伸”展開。這場(chǎng)科技革命將產(chǎn)生顛覆性影響,不僅將開啟一個(gè)全新的產(chǎn)業(yè)生態(tài),更對(duì)我們的社會(huì)工作方式及生活方式等方面產(chǎn)生深遠(yuǎn)的影響。

標(biāo)簽: 智能汽車 智能座艙 自然交互 座艙傳感器