搜狗開放聽寫服務(wù),錄音筆行業(yè)進(jìn)入AI時代
搜狗開放聽寫服務(wù),錄音筆行業(yè)進(jìn)入AI時代
發(fā)布時間:2019-09-03 點擊數(shù):38
搜狗開放聽寫服務(wù),錄音筆行業(yè)進(jìn)入AI時代
2019年8月28日,搜狗公司舉行了以“全新「聲」態(tài),AI未來”為主題的搜狗聽寫服務(wù)開放暨AI創(chuàng)新聯(lián)盟發(fā)布會。會上,搜狗將其核心技術(shù)能力
“搜狗聽寫”服務(wù)開放,并宣布與愛國者、Newmine紐曼、索尼錄音筆、萬城集團(tuán)四家錄音筆行業(yè)頭部企業(yè)成立AI創(chuàng)新聯(lián)盟。本次發(fā)布會的召開,標(biāo)志搜狗正引領(lǐng)錄音筆行業(yè)走向AI時代。
圖1:搜狗AI創(chuàng)新聯(lián)盟成立
目前搜狗輸入法語音請求峰值已超7億次,依托于此,搜狗聽寫服務(wù)背后的轉(zhuǎn)寫技術(shù)已處于行業(yè)領(lǐng)先地位,其實時語音轉(zhuǎn)寫運用了搜狗自研的延遲可控的Adaptive
Attention-based端到端建模技術(shù),非實時語音轉(zhuǎn)寫功能使用業(yè)界領(lǐng)先的深層Transformer-based端到端語音識別技術(shù),語音轉(zhuǎn)寫準(zhǔn)確率可達(dá)95%以上;在語音增強方面,搜狗自研的Smart
Voice麥克風(fēng)陣列算法能夠?qū)υ肼暫突祉戇M(jìn)行多重深度優(yōu)化,確保人聲的高保真還原。
圖2:搜狗聽寫,一邊聽一邊寫
在智能輔助編輯方面,搜狗語音轉(zhuǎn)寫可以通過云端智能糾錯編輯技術(shù),基于詞圖搜索和輸入糾錯模型,針對置信度低的轉(zhuǎn)寫結(jié)果提供多個候選詞,幫助用戶對轉(zhuǎn)寫結(jié)果進(jìn)行糾正,同時還具備了良好的自動區(qū)分說話人、智能文本順滑和標(biāo)點預(yù)測等能力,可以為用戶提供更多便捷功能。
憑借其強大的語音技術(shù)以及優(yōu)秀的軟硬件結(jié)合能力,搜狗今年3月份推出了AI錄音筆C1,其轉(zhuǎn)寫準(zhǔn)確率高達(dá)95%以上,并且擁有實時互譯、云端分享、中英同傳等多種AI功能,極短時間內(nèi)就在多個電商平臺取得了單品銷量第一的成績,可見搜狗語音轉(zhuǎn)寫技術(shù)已經(jīng)得到了市場的檢驗和認(rèn)可。此次發(fā)布會上,搜狗又推出升級版AI錄音筆炫彩版,滿足用戶更多元化、更時尚的需求,同時將AI錄音筆背后經(jīng)過市場檢驗的“搜狗聽寫“服務(wù)體系開放出來,進(jìn)而引領(lǐng)整個錄音筆行業(yè)的AI化變革,這正是搜狗踐行其AI戰(zhàn)略的一次有效嘗試。
值得一提的是,本次搜狗聽寫服務(wù)實現(xiàn)了與搜狗輸入法的打通,這不僅為聽寫服務(wù)帶來了流量和數(shù)據(jù)上的巨大優(yōu)勢,同時更是搜狗輸入法“表達(dá)信息更簡單”使命的延伸,也是搜狗聽寫服務(wù)相比其他語音轉(zhuǎn)寫平臺的優(yōu)勢所在。目前搜狗輸入法在PC端占有99%的市場份額,在手機端用戶日活超4.5億,搜狗聽寫服務(wù)基于搜狗輸入法的用戶使用習(xí)慣,能夠自動構(gòu)建個性化識別網(wǎng)絡(luò),使用戶常用語錯誤率下降40%。搜狗開放聽寫服務(wù)后,可以為市場上90%以上的錄音筆產(chǎn)品提供接入服務(wù),讓所有有需求的用戶享受“錄音1小時,出稿5分鐘”的極致體驗。
圖3:搜狗聽寫-語音轉(zhuǎn)文字
此外,在發(fā)布會上搜狗與錄音筆行業(yè)的幾家頭部企業(yè)達(dá)成AI創(chuàng)新聯(lián)盟,對于錄音筆行業(yè)的商業(yè)模式來說也是一次重大的顛覆和升級。聯(lián)盟達(dá)成將使錄音筆行業(yè)從以硬件為主的單一收益模式向硬件+服務(wù)的多種收益模式轉(zhuǎn)變,促進(jìn)錄音筆行業(yè)實現(xiàn)全面智能升級,與AI創(chuàng)新深度融合。通過AI錄音筆創(chuàng)新、開放搜狗語音轉(zhuǎn)寫服務(wù)、建立AI創(chuàng)新聯(lián)盟,搜狗正從產(chǎn)品、技術(shù)與產(chǎn)業(yè)鏈三個方向,引領(lǐng)著錄音筆行業(yè)進(jìn)入AI時代。
上一條:Q:付款方式有哪些? | 下一條:2019新廣告法,翻譯用錯禁用詞最高罰100萬! |