11月28日,百度首席技術(shù)官王海峰透露,百度大腦語音能力日均調(diào)用量超過100億次。同日,百度大腦語音引擎發(fā)布、升級(jí)了14項(xiàng)產(chǎn)品和內(nèi)容,包括基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板及3個(gè)場(chǎng)景解決方案,升級(jí)了語音自訓(xùn)練平臺(tái)、呼叫中心語音解決方案等。

王海峰表示:“AI技術(shù)的進(jìn)化和產(chǎn)業(yè)賦能正向循環(huán),相互促進(jìn),AI在應(yīng)用場(chǎng)景中不斷進(jìn)化。百度的語音技術(shù)基于深度學(xué)習(xí)和產(chǎn)業(yè)應(yīng)用,已應(yīng)用到百度App,百度地圖、小度音箱,百度輸入法等百度產(chǎn)品,更通過AI開放平臺(tái)賦能眾多產(chǎn)業(yè)伙伴。百度大腦語音能力每天的調(diào)用量已經(jīng)超過100億。”

據(jù)悉,百度大腦開放平臺(tái)已開放228項(xiàng)AI能力,擁有超過150萬開發(fā)者。針對(duì)智能硬件設(shè)備,百度大腦發(fā)布了基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板,以及智能家居、智能車載、智能IoT設(shè)備3個(gè)端到端軟硬一體遠(yuǎn)場(chǎng)語音交互場(chǎng)景解決方案。

在語音識(shí)別領(lǐng)域,百度大腦升級(jí)了短語音識(shí)別、實(shí)時(shí)語音識(shí)別能力,發(fā)布了音頻文件轉(zhuǎn)寫能力,升級(jí)了可零代碼提升業(yè)務(wù)術(shù)語識(shí)別率的語音自訓(xùn)練平臺(tái),以及呼叫中心語音解決方案。針對(duì)語音合成,百度大腦發(fā)布了6個(gè)在線語音合成精品音庫和5個(gè)離線語音合成精品音庫,對(duì)語音能力,助力智能硬件、互聯(lián)網(wǎng)、呼叫中心等領(lǐng)域進(jìn)行了智能化升級(jí)。

除了升級(jí)產(chǎn)品,百度語音首席架構(gòu)師賈磊介紹了基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強(qiáng)和語音識(shí)別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號(hào)處理學(xué)科和語音識(shí)別學(xué)科的各種先驗(yàn)假設(shè),直接端到端進(jìn)行一體化建模。相較于傳統(tǒng)基于數(shù)字信號(hào)處理的麥克陣列算法,新技術(shù)的錯(cuò)誤率降低了超過30%。目前該方法已經(jīng)被集成到百度最新發(fā)布的百度鴻鵠芯片中。

百度大腦目前已開放了云、端、芯包含語音識(shí)別、語音合成等全棧語音引擎能力,并應(yīng)用于金融、政務(wù)、文娛等多種行業(yè)和場(chǎng)景。

創(chuàng)維AIoT研究院產(chǎn)品經(jīng)理李凱表示,大屏IoT的行業(yè)痛點(diǎn)在于信息檢索難和設(shè)備控制操作復(fù)雜。通過增加語音交互能力,創(chuàng)維和百度重構(gòu)了整個(gè)AIoT設(shè)備生態(tài)的交互體驗(yàn),在電視方面的合作成果已落地在10個(gè)電視芯片型號(hào)、2500萬臺(tái)電視上。在下一代遠(yuǎn)場(chǎng)語音方案中,百度鴻鵠語音芯片為創(chuàng)維產(chǎn)品帶來了高性價(jià)比硬件、整合優(yōu)化的軟件算法等價(jià)值,雙方將基于百度鴻鵠芯片展開多項(xiàng)產(chǎn)品合作。

瓴岳科技信貸運(yùn)營(yíng)總監(jiān)宋力介紹,依托百度大腦呼叫中心實(shí)時(shí)語音識(shí)別等AI服務(wù),瓴岳科技打造了降本提效的智能機(jī)器人,智能機(jī)器人、智能語音質(zhì)檢的應(yīng)用,讓瓴岳科技的貸后人力投入降低61.47%。

北京子杰寶貝科技有限公司項(xiàng)目經(jīng)理肖云峰說:“我們開發(fā)的智能錄入系統(tǒng),在百度大腦語音自訓(xùn)練平臺(tái)進(jìn)行語音識(shí)別模型訓(xùn)練,識(shí)別率從80%提升至95%以上。該系統(tǒng)有效降低了醫(yī)護(hù)人員的工作強(qiáng)度,提升了臨床護(hù)理效率。”

在農(nóng)業(yè)領(lǐng)域,從業(yè)者也遇到了農(nóng)業(yè)作物專業(yè)詞匯語音識(shí)別率低的問題。華智生物信息技術(shù)主任龍曉波表示,得益于百度大腦語音自訓(xùn)練平臺(tái),公司的農(nóng)業(yè)結(jié)構(gòu)化性狀數(shù)據(jù)語音識(shí)別準(zhǔn)確率從71.09%提升至98.75%,采集一個(gè)測(cè)試田地性狀信息從300人工時(shí)降低到160人工時(shí),工作效率提升了一倍。

善行智能聯(lián)合創(chuàng)始人黃小瑰介紹,基于百度大腦語音等技術(shù)打造的小Q智能導(dǎo)盲眼鏡,幫助盲人生活出行,為失能人群提供智能化的幫助。

據(jù)悉,百度大腦推出了“因AI而聲”公益計(jì)劃,將為提供公益性服務(wù)的公司或組織,提供語音技術(shù)免費(fèi)、專屬語音技術(shù)支持等福利。

標(biāo)簽: 百度大腦 語音能力