
“我們?cè)谥貞c的團(tuán)隊(duì)平均年齡27歲左右,是一群有技術(shù)、有理想、有沖勁的科技青年,致力于通過(guò)‘AI+汽車(chē)’,解鎖智能汽車(chē)人機(jī)交互新模式,賦能重慶汽車(chē)產(chǎn)業(yè)開(kāi)創(chuàng)新格局。”5月4日是五四青年節(jié),馬鴻鵬在接受重慶日?qǐng)?bào)記者采訪時(shí)如是說(shuō)。
反復(fù)測(cè)試建立龐大的場(chǎng)景知識(shí)庫(kù)
讓車(chē)機(jī)系統(tǒng)精準(zhǔn)理解說(shuō)話人的前言后語(yǔ)
“小安你好,幫我查一下北京的天氣。”
“好的,北京天氣晴,白天氣溫20℃?!?/div>
“再幫我訂一張去那兒的機(jī)票。”
……
這樣的對(duì)話,在人與人交流中再簡(jiǎn)單平常不過(guò)。但是,對(duì)于人機(jī)互動(dòng)而言,想要和機(jī)器持續(xù)對(duì)話,并讓機(jī)器理解“那兒”就是上文所指的北京,并非易事。
“人坐在車(chē)內(nèi),一次喚醒車(chē)機(jī)系統(tǒng)就實(shí)現(xiàn)多個(gè)指令,還要讓系統(tǒng)能前言后語(yǔ)結(jié)合理解,這種交互方式是之前沒(méi)有的?!瘪R鴻鵬說(shuō)道,要達(dá)到這樣的效果,機(jī)器需要記憶和理解當(dāng)前說(shuō)話人的意圖和場(chǎng)景,因此就需要覆蓋盡可能多的場(chǎng)景和可能的問(wèn)法。這樣一來(lái),算法復(fù)雜度會(huì)呈幾何級(jí)數(shù)增長(zhǎng),使軟件的開(kāi)發(fā)和維護(hù)都有較大難度。
為了實(shí)現(xiàn)這一看似簡(jiǎn)單的“高難度”操作,馬鴻鵬帶領(lǐng)著20多人組成的團(tuán)隊(duì)入駐長(zhǎng)安汽車(chē),反復(fù)測(cè)試并建立了一個(gè)龐大的場(chǎng)景知識(shí)庫(kù)。
“通常車(chē)內(nèi)常用指令不超過(guò)2000種,但我們?cè)谲?chē)機(jī)上內(nèi)置了常用指令近6000條,以及不常用指令近2萬(wàn)條,才實(shí)現(xiàn)了精準(zhǔn)獲取用戶指令?!瘪R鴻鵬說(shuō)。
如今,搭載了相關(guān)技術(shù)的飛魚(yú)OS已經(jīng)在長(zhǎng)安CS95、CS75等車(chē)型上使用,助力重慶汽車(chē)在智能汽車(chē)賽道拔得頭籌。
訓(xùn)練外語(yǔ)語(yǔ)音識(shí)別系統(tǒng)能理解會(huì)思考
助力“重慶造”汽車(chē)走向國(guó)際市場(chǎng)
隨著智能汽車(chē)產(chǎn)業(yè)發(fā)展,不少重慶汽車(chē)品牌也開(kāi)始走向國(guó)際市場(chǎng)。智能汽車(chē)在海外使用,必須適用當(dāng)?shù)氐恼Z(yǔ)種,而在過(guò)去,外語(yǔ)的車(chē)載語(yǔ)音識(shí)別及合成系統(tǒng)被國(guó)外企業(yè)掌握,國(guó)內(nèi)車(chē)企只能使用國(guó)外企業(yè)的語(yǔ)音技術(shù)。
“過(guò)去很長(zhǎng)一段時(shí)間長(zhǎng)安汽車(chē)在面向中東、南美等海外發(fā)行的車(chē)型中,語(yǔ)音識(shí)別系統(tǒng)一直是采用的國(guó)外技術(shù),安全問(wèn)題是最大的考量?!瘪R鴻鵬坦言。
為了解決這一“卡脖子”問(wèn)題,馬鴻鵬團(tuán)隊(duì)聯(lián)合科大訊飛研究院展開(kāi)了長(zhǎng)安汽車(chē)車(chē)載外語(yǔ)語(yǔ)音識(shí)別及合成系統(tǒng)研發(fā)。
“做車(chē)載外語(yǔ)識(shí)別,不僅需要聽(tīng)懂,還要理解其他國(guó)家的語(yǔ)言文化習(xí)慣,甚至同一語(yǔ)種不同地區(qū)的口音,這就需要有強(qiáng)大的識(shí)別模型和機(jī)器學(xué)習(xí)做支撐?!瘪R鴻鵬解釋說(shuō),車(chē)載語(yǔ)音的“識(shí)別”分為“語(yǔ)音識(shí)別”和“語(yǔ)義識(shí)別”兩個(gè)技術(shù)層次,“語(yǔ)音識(shí)別”相當(dāng)于人的嘴巴和耳朵,負(fù)責(zé)表達(dá)和獲??;“語(yǔ)義識(shí)別”相當(dāng)于人的大腦,負(fù)責(zé)思考和信息處理。為了實(shí)現(xiàn)外語(yǔ)的能聽(tīng)會(huì)說(shuō)、能理解會(huì)思考,團(tuán)隊(duì)還找來(lái)“外援”,邀請(qǐng)一大批留學(xué)生和外語(yǔ)專(zhuān)家加入語(yǔ)音系統(tǒng)的訓(xùn)練中,通過(guò)算法的積累和機(jī)器學(xué)習(xí),讓車(chē)載外語(yǔ)語(yǔ)音系統(tǒng)更穩(wěn)定高效。
2021年,這套車(chē)載外語(yǔ)語(yǔ)音識(shí)別系統(tǒng)已成功實(shí)現(xiàn)國(guó)產(chǎn)化,長(zhǎng)安汽車(chē)海外發(fā)行的車(chē)型均采用了這一國(guó)產(chǎn)系統(tǒng)。
獨(dú)創(chuàng)神經(jīng)網(wǎng)絡(luò)降噪算法和“冷啟動(dòng)”系統(tǒng)
讓車(chē)主可以在車(chē)外喚醒車(chē)輛“開(kāi)出來(lái)”
在歐尚汽車(chē)上打造全球首發(fā)的車(chē)外語(yǔ)音交互系統(tǒng),也是智能汽車(chē)領(lǐng)域的一大技術(shù)創(chuàng)新。
“以前汽車(chē)的語(yǔ)音交互都在車(chē)內(nèi),實(shí)際上車(chē)外智能交互也是用戶的需求?!瘪R鴻鵬說(shuō),以往用戶在用車(chē)場(chǎng)景中,常會(huì)有開(kāi)門(mén)難、挪車(chē)難等痛點(diǎn),而這套車(chē)外語(yǔ)音交互系統(tǒng)可以讓車(chē)主在車(chē)外喚醒車(chē)輛,比如在擁擠的停車(chē)場(chǎng),可以叫它“把車(chē)開(kāi)出來(lái)”,車(chē)輛即可自動(dòng)向前駛出。購(gòu)物歸來(lái)雙手不方便開(kāi)門(mén),也可以說(shuō)一聲“打開(kāi)后備廂”,后備廂即可自動(dòng)開(kāi)啟。
車(chē)外語(yǔ)音交互較車(chē)內(nèi)語(yǔ)音交互來(lái)說(shuō),難點(diǎn)在于如何保障在有車(chē)外噪音等復(fù)雜環(huán)境下,機(jī)器能聽(tīng)清楚并執(zhí)行指令。馬鴻鵬介紹,為了實(shí)現(xiàn)車(chē)外的人車(chē)交互,他和團(tuán)隊(duì)獨(dú)創(chuàng)了神經(jīng)網(wǎng)絡(luò)降噪算法和“冷啟動(dòng)”系統(tǒng)兩項(xiàng)技術(shù),讓車(chē)外語(yǔ)音交互系統(tǒng)做到360度語(yǔ)音降噪和無(wú)死角識(shí)別覆蓋,實(shí)現(xiàn)穩(wěn)定高效的車(chē)外語(yǔ)音交互。
“汽車(chē)革命的下半場(chǎng)是智能化、網(wǎng)聯(lián)化、共享化?!彼硎?,未來(lái),他們還將繼續(xù)扎根重慶,進(jìn)一步探索汽車(chē)多語(yǔ)種、多模態(tài)交互技術(shù),為重慶的車(chē)域生態(tài)伙伴提供更具有生命力和創(chuàng)新力的智能化場(chǎng)景服務(wù),助力重慶汽車(chē)智能制造再上臺(tái)階。