對(duì)于落地應(yīng)用正在端側(cè)呈現(xiàn)出巨大需求,百度大腦語(yǔ)音團(tuán)隊(duì)研發(fā)出一款針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音交互打造的芯片--百度芯片。芯片采用"軟件定義芯片"的全新設(shè)計(jì)思路。該芯片采用雙核HiFi4架構(gòu),2.8M大內(nèi)存,臺(tái)積電40nm工藝,在此硬件規(guī)格上,100mw左右平均工作功耗,即可支持遠(yuǎn)場(chǎng)語(yǔ)音交互核心的陣列信號(hào)處理和語(yǔ)音喚醒能力。同時(shí),按照車規(guī)級(jí)標(biāo)準(zhǔn)打造的芯片,可為車載語(yǔ)音交互,以及智能家居等場(chǎng)景帶來更大想象力。芯片流片的同時(shí),即實(shí)現(xiàn)了量產(chǎn)。
百度視覺技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān),5G時(shí)代,越來越多物理設(shè)備將連接到高可靠、低延時(shí)的網(wǎng)絡(luò)空間,這將徹底改變?nèi)藗兣c環(huán)境及設(shè)備的交互方式。本次全新發(fā)布視覺語(yǔ)義化平臺(tái)2.0,正在推進(jìn)視覺技術(shù)由"看清看懂"向"交互"進(jìn)行升級(jí)。視覺語(yǔ)義化平臺(tái)2.0在交互升級(jí)和軟硬件結(jié)合兩大方面實(shí)現(xiàn)突破。
交互升級(jí)包含一體化人機(jī)交互系統(tǒng)和大場(chǎng)景物理世界交互系統(tǒng)。簡(jiǎn)單而言,一體化人機(jī)交互系統(tǒng)是人與機(jī)器、虛擬環(huán)境的自然交互與融合,該系統(tǒng)適用于實(shí)現(xiàn)AR特效的直播、小視頻、特效小程序等場(chǎng)景,已應(yīng)用于百度多款視頻App.大場(chǎng)景物理世界交互系統(tǒng)是將視覺定位與AR技術(shù)突破性結(jié)合,實(shí)現(xiàn)大范圍的虛擬信息與物理世界的精準(zhǔn)疊加,從而建立起AI時(shí)代全新的交互系統(tǒng)。
視覺語(yǔ)義化平臺(tái)2.0更新了許多先進(jìn)的感知技術(shù),也讓機(jī)器人技術(shù)實(shí)現(xiàn)新突破。百度三維視覺首席科學(xué)家楊睿剛介紹,機(jī)器人就是一個(gè)智能體,除了感知技術(shù),智能體需要決策和動(dòng)作相關(guān)的技術(shù),實(shí)現(xiàn)從環(huán)境感知到主動(dòng)感知。
目前,百度研究的智能體技術(shù)主要集中在自動(dòng)駕駛Apollo、工程機(jī)械和服務(wù)機(jī)器人三大方面。上午主論壇中引人關(guān)注的機(jī)械臂"茶博士"不僅能說會(huì)道,還完成了傳統(tǒng)的長(zhǎng)嘴壺倒茶工作,其背后依靠的正是服務(wù)機(jī)器人方案。