日韩国产精品久久午夜夜伦鲁鲁,日韩国产欧美另类,国产黃色三級三級三級,亚洲中文字幕一片,久久无码专区国产精品,91精品国产高久久久久久五月天

江蘇昊目智能
當前位置: 自動焊接機 > 激光打標機 >

以語音為代表的人機交互或許是未來硬件和機器人的標配

點擊:130
2021年以來,機器人賽道受到資本熱捧。僅前10個月拿到融資的機器人項目就有299個,其中253個集中在C輪及以前,79個項目的融資額在億元人民幣以上。

天眼查數(shù)據還顯示,今年新增的機器人相關企業(yè)就超過10萬家。截至目前,我國有超過32萬家機器人相關企業(yè)(企業(yè)名稱或經營范圍包含機器人)。在地域上,廣東省機器人相關企業(yè)最多,有超過7萬家,占比達22.02%。是第二名江蘇的近2倍。

所以在這個產業(yè)和資本雙重背景下,36氪于11月25日在深圳舉辦了超前體驗·機器人峰會。此次峰會邀請了眾多投資人、科學家、學者、優(yōu)秀創(chuàng)業(yè)者以及相關從業(yè)者,共同探討行業(yè)新趨勢,以及在新環(huán)境下如何讓技術走進大眾生活。嘉賓包括中國工程院院士譚建榮、達晨財智業(yè)務合伙人任俊熙、藍馳創(chuàng)投董事總經理曹巍、阿里巴巴達摩院研究員付強、高仙機器人創(chuàng)始人兼CEO程昊天、大族機器人CEO王光能、未來機器人創(chuàng)始人李陸洋、云跡科技執(zhí)行總裁兼CTO林小俊等多位嘉賓。

“語音和多模態(tài)的人機交互會是以機器人為代表的智能硬件必備特征,實踐中首先要克服的是聲學的復雜性?!卑⒗镞_摩院擁有應對不同聲學環(huán)境下的思路和技術鏈條。

以語音為代表的人機交互或許是未來硬件和機器人的標配

以下是阿里達摩院的付強先生現(xiàn)場演講《復雜聲學環(huán)境下的語音交互》(經編輯):

其實在無論是智能硬件還是特指機器人這個行業(yè),以語音為代表的人機交互是一個比較重要的特征。剛才我聽達晨財智的任總也提到無論是VR、AR、機器人還是別的一些行業(yè),語音交互和知識圖譜的應用,都是一個必選項。但是這種人機交互,特別是語音交互的技術在應用上的問題在哪里?首先是不同的場景會遇到不同的聲學問題, 包括背景噪聲、混響等聲學環(huán)境特性的差異。

模組化是應對各種碎片場景的一個常用的技術手段。這是什么意思呢?就是說我們希望能夠通過對聲學器件、操作系統(tǒng)、聲頻算法和交互應用調度, 包括連接協(xié)議等做成從軟件到硬件的一體化封裝,去應對不同的場景里的離散性的問題,使得方案更加得平臺化,與聲學和音頻相關的技術也能被沉淀。另一方面,就是提升跟客戶對接的效率,包括我們也提供二次編程能力。

剛才我們講了應對不同的聲學場景下的思路和技術棧,接下來介紹阿里達摩院的整個語音AI技術棧。一個標準的語音交互鏈路,端上首先是有信號處理,然后是語音喚醒, 本地識別等,還有服務智能硬件所不可缺少的聲學設計配套。云端的語音服務主要就是識別、合成、對話管理,還有聲紋相關的技術棧等,這些構成了一個完整的從端到云的技術鏈。

下面逐一介紹一下整個技術鏈條上我們一些關鍵技術的突破,主要是近期比較著重打造的東西。

首先講聲學前端, 這一塊是跟場景,硬件適配最前端的一個接口。在我們這個方案里,比較重要的特色是強調了信號處理的重要性,如果說大家可能熟悉這個領域中的一些技術的前沿成果的話,可能會關注到比如說深度學習技術對交互中的滲透,但是從我們的實踐和對這個行業(yè)的理解來看,在相當一段時間內經典信號處理里的作用一定會被保留。這是為什么呢?就是我們講到的場景的復雜性,不是說通過較為單一的場景的樣本的數(shù)據就能獲得全場景的聲學環(huán)境適配能力, 經典信號處理理論存在這這里的意義在于在線的自適應優(yōu)化,這是“魂”。

在這個前提之下,我們著重發(fā)展一些我們有特色的信號處理相關的技術,比如說盲源分離,它的特點是什么?就是比較適合小陣列,在消費電子行業(yè)里,當麥克風的個數(shù)不能夠太多但是性能要求又比較高這樣的場景,這是選擇這一路線的基礎依據。特別是我們前期的工作,把它形成了以盲源分離理論為核心的對環(huán)境噪聲、房間混響和設備回聲的統(tǒng)一處理框架, 也是我們在該領域應用研究層面的學術貢獻。由相關理論支撐的AEC算法甚至還在由國際權威學術機構組織的挑戰(zhàn)賽上拿到國內第一的成績。

接下來是高抗噪的視覺聽覺多模態(tài)融合技術,視覺的融合對于聽覺來講是一個更好的補充。在業(yè)內來講,我們的多模態(tài)融合技術是走向實踐比較早的,我們2018年就跟上海地鐵合作,在地鐵這個場景里首次把多模態(tài)語音交互技術用到了實踐。

回到方案層面,剛剛講了聲學的這種模組化,我們在近幾年時間內提煉出來幾套應對不同場景的模組方案:

第一個,我們講高性價比,這是是什么意思呢?舉個例子,比如說智能音箱、家電等,對成本要求比較敏感,對性能要求也比較嚴苛,追求高性價比的場景。

第二個,就是高性能,這個性能主要體現(xiàn)在對噪聲環(huán)境的魯棒性。

第三個,就是多模態(tài),這里的多模態(tài)的, 更多還是指處理復雜聲學場景的技術能力。

還有一點,就是芯片化,也是我們模組化的一個極致表現(xiàn), 只有算法和芯片設計有機融合, 才能產生極致性價比的解決方案, 后面也有一些應用案例。

接下來講講我們語音技術的幾個落地案例。過去幾年我們的語音交互技術和方案以軟核形式落地了海爾、康佳,還有一些與優(yōu)酷合作的投影儀等跟與家庭場景相關的智能硬件, 同時也提供了拾音模組和聲學結構的參考設計, 包括業(yè)內唯一的聲學裝配效果產線專業(yè)測試設備。從規(guī)模上來講,幾年下來大約有近千萬級累計裝機量, 從客戶的滿意度調查反饋上, 也顯示出小陣列條件下難得的較強抗賣場環(huán)境噪聲能力。

以語音為代表的人機交互或許是未來硬件和機器人的標配視頻通話,來去替代前臺人工的服務,這也算是前臺服務機器人的一個表現(xiàn)形式。右邊這個本來是一個視頻,但是今天沒有時間去展示,我就簡單說一下,這其實是一個語音自助售貨機,展示的理念就是一方面它能夠做語音的交互,另一方面它有主動交互的功能,售貨機能自動打招呼,檢測你是男性女性,還有年齡大小,能主動給你做產品的推介,吸引你過來。我相信在機器人這個場景里,主動交互也是一個非常有價值的技術。

墨江| 珠海市| 巩义市| 中方县| 德阳市| 顺平县| 同德县| 郓城县| 成都市| 宝鸡市| 淳安县| 惠水县| 潞西市| 呼伦贝尔市| 莒南县| 泰顺县|