精投科技語(yǔ)音識(shí)別引擎的優(yōu)勢(shì):
l 識(shí)別準(zhǔn)確率高
對(duì)于朗讀類(lèi)型語(yǔ)音(如:手機(jī)語(yǔ)音輸入類(lèi)語(yǔ)音、廣播電視新聞?wù)Z音等),識(shí)別準(zhǔn)確率在90%以上,經(jīng)過(guò)模型優(yōu)化訓(xùn)練以后能達(dá)到95%;對(duì)于自然對(duì)話(huà)類(lèi)型語(yǔ)音(如:電話(huà)自然交談?wù)Z音、電視訪談?wù)Z音),識(shí)別準(zhǔn)確率為80%,經(jīng)過(guò)模型優(yōu)化訓(xùn)練以后能夠達(dá)到85%。
l 抗噪性好
在噪聲環(huán)境能夠達(dá)到較好的識(shí)別性能,采用維納濾波技術(shù)消除背景噪聲、混合高斯建模去除非自然語(yǔ)音、諧波檢測(cè)技術(shù)有效檢測(cè)語(yǔ)音起始點(diǎn),多條件的訓(xùn)練策略提高噪聲穩(wěn)健性。
l 識(shí)別速度快
WFST的Cross-word靜態(tài)搜索空間構(gòu)建;有效地單遍集成各種知識(shí)源;將聲學(xué)模型、聲學(xué)上下文、發(fā)音詞典、語(yǔ)言模型等知識(shí)源靜態(tài)編譯成狀態(tài)網(wǎng)絡(luò);前向后向歸并算法優(yōu)化網(wǎng)絡(luò),在識(shí)別率相當(dāng)?shù)那闆r下,比WFST開(kāi)源工具包解碼速度快4倍以上。