堅(jiān)持為客戶提供有價(jià)值的服務(wù)和內(nèi)容

百度算法是怎么進(jìn)行全方位升級(jí)的

商企云 | 2019-07-09 | 分享至:
    識(shí)別方面,百度提出流式多級(jí)的截?cái)嘧⒁饬δP蚐MLTA,這是國(guó)際上首次實(shí)現(xiàn)局部注意力建模超越整句的注意力模型,也是國(guó)際上首次實(shí)現(xiàn)在線語(yǔ)音大規(guī)模使用注意力模型。



百度算法是怎么進(jìn)行全方位升級(jí)的


    SMLTA在大幅提升識(shí)別速度的同時(shí),也提高了識(shí)別準(zhǔn)確率。在輸入法有效產(chǎn)品相對(duì)準(zhǔn)確率提升15%,音箱有效產(chǎn)品相對(duì)準(zhǔn)確率提升20%.合成方面,針對(duì)現(xiàn)階段面臨風(fēng)格遷移、音色模擬和情感擬人的三大挑戰(zhàn),百度推出語(yǔ)音合成技術(shù)Meitron,可以將語(yǔ)音中的音色、風(fēng)格、情感等要素映射到不同的子空間,在使用時(shí),不同要素可以任意組合,靈活的控制合成語(yǔ)音的風(fēng)格。同時(shí)降低語(yǔ)言合成門檻,僅需20句話就可以制作一個(gè)人的專屬聲音。

    對(duì)于落地應(yīng)用正在端側(cè)呈現(xiàn)出巨大需求,百度大腦語(yǔ)音團(tuán)隊(duì)研發(fā)出一款針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音交互打造的芯片--百度芯片。芯片采用"軟件定義芯片"的全新設(shè)計(jì)思路。該芯片采用雙核HiFi4架構(gòu),2.8M大內(nèi)存,臺(tái)積電40nm工藝,在此硬件規(guī)格上,100mw左右平均工作功耗,即可支持遠(yuǎn)場(chǎng)語(yǔ)音交互核心的陣列信號(hào)處理和語(yǔ)音喚醒能力。同時(shí),按照車規(guī)級(jí)標(biāo)準(zhǔn)打造的芯片,可為車載語(yǔ)音交互,以及智能家居等場(chǎng)景帶來更大想象力。芯片流片的同時(shí),即實(shí)現(xiàn)了量產(chǎn)。

    百度視覺技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān),5G時(shí)代,越來越多物理設(shè)備將連接到高可靠、低延時(shí)的網(wǎng)絡(luò)空間,這將徹底改變?nèi)藗兣c環(huán)境及設(shè)備的交互方式。本次全新發(fā)布視覺語(yǔ)義化平臺(tái)2.0,正在推進(jìn)視覺技術(shù)由"看清看懂"向"交互"進(jìn)行升級(jí)。視覺語(yǔ)義化平臺(tái)2.0在交互升級(jí)和軟硬件結(jié)合兩大方面實(shí)現(xiàn)突破。

    交互升級(jí)包含一體化人機(jī)交互系統(tǒng)和大場(chǎng)景物理世界交互系統(tǒng)。簡(jiǎn)單而言,一體化人機(jī)交互系統(tǒng)是人與機(jī)器、虛擬環(huán)境的自然交互與融合,該系統(tǒng)適用于實(shí)現(xiàn)AR特效的直播、小視頻、特效小程序等場(chǎng)景,已應(yīng)用于百度多款視頻App.大場(chǎng)景物理世界交互系統(tǒng)是將視覺定位與AR技術(shù)突破性結(jié)合,實(shí)現(xiàn)大范圍的虛擬信息與物理世界的精準(zhǔn)疊加,從而建立起AI時(shí)代全新的交互系統(tǒng)。


百度算法是怎么進(jìn)行全方位升級(jí)的(圖2)



    目前,軟硬件結(jié)合可以滿足應(yīng)用場(chǎng)景更高效的視覺計(jì)算,以及更低延時(shí)的體驗(yàn),同時(shí)能保護(hù)數(shù)據(jù)隱私。百度視覺方面的軟硬件結(jié)合主要聚焦于模型壓縮平臺(tái)PaddleSlim、多模態(tài)FaceID開發(fā)組件以及軟硬件一體解決方案AI相機(jī)三部分。FaceID覆蓋設(shè)備量已超1200萬(wàn)臺(tái)。

    視覺語(yǔ)義化平臺(tái)2.0更新了許多先進(jìn)的感知技術(shù),也讓機(jī)器人技術(shù)實(shí)現(xiàn)新突破。百度三維視覺首席科學(xué)家楊睿剛介紹,機(jī)器人就是一個(gè)智能體,除了感知技術(shù),智能體需要決策和動(dòng)作相關(guān)的技術(shù),實(shí)現(xiàn)從環(huán)境感知到主動(dòng)感知。

    目前,百度研究的智能體技術(shù)主要集中在自動(dòng)駕駛Apollo、工程機(jī)械和服務(wù)機(jī)器人三大方面。上午主論壇中引人關(guān)注的機(jī)械臂"茶博士"不僅能說會(huì)道,還完成了傳統(tǒng)的長(zhǎng)嘴壺倒茶工作,其背后依靠的正是服務(wù)機(jī)器人方案。
掃二維碼與項(xiàng)目經(jīng)理溝通

7*24小時(shí)為您服務(wù)

解答:網(wǎng)站優(yōu)化,網(wǎng)站建設(shè),APP開發(fā),小程序開發(fā),H5開發(fā),品牌推廣,新聞推廣,輿情監(jiān)測(cè)等

  非常感謝您有耐心的讀完這篇文章:"百度算法是怎么進(jìn)行全方位升級(jí)的",更多內(nèi)容請(qǐng)繼續(xù)瀏覽,我們將為您提供更多參考使用或?qū)W習(xí)交流的信息。我們還可為您提供:網(wǎng)站建設(shè)與開發(fā)網(wǎng)站優(yōu)化、品牌推廣、APP開發(fā)、小程序開發(fā)新聞推廣等服務(wù),我們以“降低營(yíng)銷成本,提高營(yíng)銷效果”的服務(wù)理念,自創(chuàng)立至今,已成功服務(wù)過不同行業(yè)的1000多家企業(yè),獲得國(guó)家高新技術(shù)企業(yè)認(rèn)證,且擁有14項(xiàng)國(guó)家軟件著作權(quán),將力爭(zhēng)成為國(guó)內(nèi)企業(yè)心目中值得信賴的互聯(lián)網(wǎng)產(chǎn)品及服務(wù)提供商。如您需要合作,請(qǐng)掃碼咨詢,我們將誠(chéng)摯為您服務(wù)。
我要咨詢
姓名 :
電話 :
文章分類