日均100億次是什么概念?百度大腦語音取得突破性進展
原標題:日均100億次是什么概念?百度大腦語音取得突破性進展
人們容易高估新技術短期的爆發力,卻低估其長期的影響力,比如語音交互。2012年,伴隨著iPhone 4S的發布,蘋果將語音助理服務Siri推向世人,一時之間,出現了許多類似“中國版Siri”的創業公司,然而幾年后,語音交互依然只是一個配角,一些人開始認為,語音可能只是小眾交互方式,特別是在羅永浩推出“堅果TNT”這樣的奇葩語音交互產品后。
到了2019年,語音是不是未來的主流交互方式,似乎已經沒有爭議。百度最近公布的一組數據足以說明語音交互的普及。11月28日在百度大腦語音能力引擎論壇上,百度宣布百度大腦語音能力日均調用量已超過100億次,應用規模處于業界第一,百度大腦面向各行各業開發者提供覆蓋云、端、芯的全棧全場景語音開放能力,這一數據基本體現出各行各業智能語音調用的熱度。
日均百億次,語音迎來新奇點
日均100億次是什么概念?截止到今年11月14日,小米小愛同學累積被語音喚醒341億次,百度大腦語音每日被調用的次數,跟小米小愛同學多年來積累的喚醒次數,在一個量級。當然,小米小愛同學以及百度小度、天貓精靈諸多智能音箱的強勁增長,也是語音交互爆發的側影。
只不過,智能音箱只是語音應用的冰山一角,語音搜索、語音助理、智能翻譯機、聲紋識別、虛擬偶像和智能硬件等C端軟硬件產品,互聯網教育、呼叫中心、智能客服等行業應用,都在大規模應用語音能力,語音成為跟觸摸一樣普及的交互方式,不同的是語音交互依賴底層AI技術,因此,才有了百度大腦這樣的第三方語音能力平臺的發展空間,才有了日均100億次的語音能力調用數據。
這樣的增長已經有了很長一段時間,2016年,KPCB合伙人、享有“互聯網女皇”稱號的瑪麗·米克爾在她一年一度的互聯網趨勢報告中預測:
“語音已成為人機交互的新范式,在過去75年里,每10年就有一次人機交互的重大革新,人類對機器的操作,從物理手柄按鍵,到物理鍵盤鼠標,再到觸摸屏,而現在語音成了重要的交互方式。”
在其看來,語音交互相對于傳統交互而言具有以下特點:輸入更快速,人類每分鐘可說出150個單詞,打字卻只能完成40個單詞;使用更簡單,不需要用手和眼,時間更及時,不需要任何學習;更加個性化,機器可基于上下文、環境、位置、語調等大環境更好地理解人類的需求。從技術角度來看,語音計算具有成本低、尺寸小的特點,特別適合物聯網。
當時互聯網女王認為,如果語音識別準確率從95%提升到99%將從量變引發質變,即“爆發點”到來。當年百度、搜狗和訊飛均宣布語音識別準確率達到97%,距離“爆發點”已很近,這幾年,語音識別準確率不斷提升。百度大腦語音能力引擎,采用領先國際的流式端到端語音語言一體化建模方法,融合百度自然語言處理技術,近場中文普通話識別準確率已達98%。同時,針對戶外嘈雜環境和講話者特性的語音識別,遠場交互,可支持自然對話的全雙工語音交互,諸多語音技術取得突破性進展,語音交互變得更加智能、自然和友好。
語音應用場景增加,各行各業都在用。2016年前語音只是科技公司以及少部分先知先覺企業的專屬,近兩年特別是2018年在AI產業化趨勢下,各行各業都在應用AI技術,語音是頭部AI能力,百度大腦這樣的平臺提供覆蓋云、端、芯的全棧全場景語音開放能力,讓各行各業低門檻應用語音。
百度語音開放平臺2013年10月上線,最初只有語音識別以及文本轉語音(TTS)功能,上線后每日使用量急速攀升,2016年11月22日百度語音開放平臺上線三周年之際,每日在線語音識別調用1億4千萬。最近幾年百度大腦語音引擎從基礎技術向全棧技術演進,擁有語音識別、語音合成、語音硬件等技術棧,覆蓋智能設備、互聯網應用、呼叫中心等核心場景,可滿足各行各業的語音需求,這一次引擎大會上,百度大腦語音引擎就全新發布和升級了14大產品內容,包括基于百度鴻鵠語音芯片的4款硬件模組、開發板及3大場景解決方案,升級了語音自訓練平臺、呼叫中心語音解決方案等。
?????投稿郵箱:jiujiukejiwang@163.com ??詳情訪問99科技網:http://www.hacbq.cn
推薦資訊














