精投科技語音識(shí)別引擎的優(yōu)勢:
l 識(shí)別準(zhǔn)確率高
對(duì)于朗讀類型語音(如:手機(jī)語音輸入類語音、廣播電視新聞?wù)Z音等),識(shí)別準(zhǔn)確率在90%以上,經(jīng)過模型優(yōu)化訓(xùn)練以后能達(dá)到95%;對(duì)于自然對(duì)話類型語音(如:電話自然交談?wù)Z音、電視訪談?wù)Z音),識(shí)別準(zhǔn)確率為80%,經(jīng)過模型優(yōu)化訓(xùn)練以后能夠達(dá)到85%。
l 抗噪性好
在噪聲環(huán)境能夠達(dá)到較好的識(shí)別性能,采用維納濾波技術(shù)消除背景噪聲、混合高斯建模去除非自然語音、諧波檢測技術(shù)有效檢測語音起始點(diǎn),多條件的訓(xùn)練策略提高噪聲穩(wěn)健性。
l 識(shí)別速度快
WFST的Cross-word靜態(tài)搜索空間構(gòu)建;有效地單遍集成各種知識(shí)源;將聲學(xué)模型、聲學(xué)上下文、發(fā)音詞典、語言模型等知識(shí)源靜態(tài)編譯成狀態(tài)網(wǎng)絡(luò);前向后向歸并算法優(yōu)化網(wǎng)絡(luò),在識(shí)別率相當(dāng)?shù)那闆r下,比WFST開源工具包解碼速度快4倍以上。