日均100億次是什么概念？百度大腦語音取得突破性進展

2019-12-02 17:47來源：99科技綜合編輯：時寒峰

掃一掃

分享文章到微信

掃一掃

關注99科技網微信公眾號

復制網址

　　原標題：日均100億次是什么概念？百度大腦語音取得突破性進展

　　人們容易高估新技術短期的爆發力，卻低估其長期的影響力，比如語音交互。2012年，伴隨著iPhone 4S的發布，蘋果將語音助理服務Siri推向世人，一時之間，出現了許多類似“中國版Siri”的創業公司，然而幾年后，語音交互依然只是一個配角，一些人開始認為，語音可能只是小眾交互方式，特別是在羅永浩推出“堅果TNT”這樣的奇葩語音交互產品后。

　　到了2019年，語音是不是未來的主流交互方式，似乎已經沒有爭議。百度最近公布的一組數據足以說明語音交互的普及。11月28日在百度大腦語音能力引擎論壇上，百度宣布百度大腦語音能力日均調用量已超過100億次，應用規模處于業界第一，百度大腦面向各行各業開發者提供覆蓋云、端、芯的全棧全場景語音開放能力，這一數據基本體現出各行各業智能語音調用的熱度。

　　日均百億次，語音迎來新奇點

　　日均100億次是什么概念？截止到今年11月14日，小米小愛同學累積被語音喚醒341億次，百度大腦語音每日被調用的次數，跟小米小愛同學多年來積累的喚醒次數，在一個量級。當然，小米小愛同學以及百度小度、天貓精靈諸多智能音箱的強勁增長，也是語音交互爆發的側影。

　　只不過，智能音箱只是語音應用的冰山一角，語音搜索、語音助理、智能翻譯機、聲紋識別、虛擬偶像和智能硬件等C端軟硬件產品，互聯網教育、呼叫中心、智能客服等行業應用，都在大規模應用語音能力，語音成為跟觸摸一樣普及的交互方式，不同的是語音交互依賴底層AI技術，因此，才有了百度大腦這樣的第三方語音能力平臺的發展空間，才有了日均100億次的語音能力調用數據。

　　這樣的增長已經有了很長一段時間，2016年，KPCB合伙人、享有“互聯網女皇”稱號的瑪麗·米克爾在她一年一度的互聯網趨勢報告中預測：

　　“語音已成為人機交互的新范式，在過去75年里，每10年就有一次人機交互的重大革新，人類對機器的操作，從物理手柄按鍵，到物理鍵盤鼠標，再到觸摸屏，而現在語音成了重要的交互方式。”

　　在其看來，語音交互相對于傳統交互而言具有以下特點：輸入更快速，人類每分鐘可說出150個單詞，打字卻只能完成40個單詞；使用更簡單，不需要用手和眼，時間更及時，不需要任何學習；更加個性化，機器可基于上下文、環境、位置、語調等大環境更好地理解人類的需求。從技術角度來看，語音計算具有成本低、尺寸小的特點，特別適合物聯網。

　　當時互聯網女王認為，如果語音識別準確率從95%提升到99%將從量變引發質變，即“爆發點”到來。當年百度、搜狗和訊飛均宣布語音識別準確率達到97%，距離“爆發點”已很近，這幾年，語音識別準確率不斷提升。百度大腦語音能力引擎，采用領先國際的流式端到端語音語言一體化建模方法，融合百度自然語言處理技術，近場中文普通話識別準確率已達98%。同時，針對戶外嘈雜環境和講話者特性的語音識別，遠場交互，可支持自然對話的全雙工語音交互，諸多語音技術取得突破性進展，語音交互變得更加智能、自然和友好。

　　語音應用場景增加，各行各業都在用。2016年前語音只是科技公司以及少部分先知先覺企業的專屬，近兩年特別是2018年在AI產業化趨勢下，各行各業都在應用AI技術，語音是頭部AI能力，百度大腦這樣的平臺提供覆蓋云、端、芯的全棧全場景語音開放能力，讓各行各業低門檻應用語音。

　　百度語音開放平臺2013年10月上線，最初只有語音識別以及文本轉語音（TTS）功能，上線后每日使用量急速攀升，2016年11月22日百度語音開放平臺上線三周年之際，每日在線語音識別調用1億4千萬。最近幾年百度大腦語音引擎從基礎技術向全棧技術演進，擁有語音識別、語音合成、語音硬件等技術棧，覆蓋智能設備、互聯網應用、呼叫中心等核心場景，可滿足各行各業的語音需求，這一次引擎大會上，百度大腦語音引擎就全新發布和升級了14大產品內容，包括基于百度鴻鵠語音芯片的4款硬件模組、開發板及3大場景解決方案，升級了語音自訓練平臺、呼叫中心語音解決方案等。

?????投稿郵箱：jiujiukejiwang@163.com ??詳情訪問99科技網：http://www.hacbq.cn