Kaldi現(xiàn)在提供TensorFlow集成

由于近年來虛擬個(gè)人助理的迅猛發(fā)展和深度學(xué)習(xí)算法的運(yùn)用所帶來的字詞識(shí)別準(zhǔn)確率的飛躍，自動(dòng)語音識(shí)別 (ASR) 已經(jīng)得到廣泛的采用。許多語音識(shí)別團(tuán)隊(duì)都依靠 Kaldi，這是一款廣受歡迎的開放源代碼語音識(shí)別工具包。我們宣布 Kaldi 現(xiàn)在提供 TensorFlow 集成。

通過此集成，使用 Kaldi 的語音識(shí)別研究人員和開發(fā)者將能夠在他們的 Kaldi 語音識(shí)別管道中，使用 TensorFlow 來探索和部署深度學(xué)習(xí)模型。這樣，Kaldi 社區(qū)可以構(gòu)建更出色、更強(qiáng)大的 ASR 系統(tǒng)，并為 TensorFlow 用戶提供一種利用龐大的 Kaldi 開發(fā)者社區(qū)的經(jīng)驗(yàn)探索 ASR 的途徑。

構(gòu)建一套能夠理解每種對(duì)話語言、口音、環(huán)境和類型的人類語音的 ASR 系統(tǒng)是一項(xiàng)極其復(fù)雜的任務(wù)。傳統(tǒng)的 ASR 系統(tǒng)可被視為由許多獨(dú)立模塊組成的處理管道，其中，每個(gè)模塊的運(yùn)行都基于上一個(gè)模塊的輸出。原始音頻數(shù)據(jù)從管道的一端進(jìn)入管道，然后從另一端輸出已識(shí)別語音的轉(zhuǎn)錄文字。在 Kaldi 中，會(huì)以各種方式對(duì)這些 ASR 轉(zhuǎn)錄文字進(jìn)行后處理，以便支持不斷增多的最終用戶應(yīng)用。

Yishay Carmiel 和 Hainan Xu 來自總部位于西雅圖的公司 IntelligentWire，他們?cè)谶@兩個(gè)團(tuán)隊(duì)的支持下，領(lǐng)導(dǎo)開發(fā)了 Kaldi 和 TensorFlow 之間的集成，他們親身體會(huì)到這種復(fù)雜性。他們公司開發(fā)了云軟件在實(shí)時(shí)電話對(duì)話和商業(yè)應(yīng)用之間架設(shè)銜接的橋梁。

他們的目標(biāo)是：讓企業(yè)能夠?qū)崟r(shí)分析其業(yè)務(wù)代表與客戶之間成千上萬的對(duì)話內(nèi)容并據(jù)此采取行動(dòng)，同時(shí)自動(dòng)處理數(shù)據(jù)錄入或響應(yīng)請(qǐng)求之類的任務(wù)。

IntelligentWire 目前專注于呼叫中心市場(chǎng)，全球各地共有 2200 多萬名坐席代表每年花費(fèi) 500 億小時(shí)進(jìn)行電話交流，花費(fèi)大約 250 億小時(shí)查詢和操作各種業(yè)務(wù)應(yīng)用。

ASR 系統(tǒng)要在此環(huán)境中發(fā)揮作用，不僅必須提供準(zhǔn)確的轉(zhuǎn)錄文字，還應(yīng)確保很低的延遲時(shí)間，并且能夠升級(jí)，從而高效地支持成千上萬的并發(fā)對(duì)話。在這樣的情況下，近年來深度學(xué)習(xí)技術(shù)的發(fā)展可以幫助突破技術(shù)限制，TensorFlow 則大放異彩。

在過去幾年里，人們一直使用深度神經(jīng)網(wǎng)絡(luò)代替許多原有的 ASR 模塊，最終使得字詞識(shí)別準(zhǔn)確率得到顯著的提升。這些深度學(xué)習(xí)模塊通常需要處理海量的數(shù)據(jù)，而 TensorFlow 則可以簡化這一處理工作。然而，在開發(fā)生產(chǎn)級(jí)的 ASR 系統(tǒng)時(shí)，仍有幾個(gè)重大的挑戰(zhàn)需要克服：

算法 - 深度學(xué)習(xí)算法在針對(duì)手頭的任務(wù)進(jìn)行定制時(shí)效果***，包括聲音環(huán)境(如噪音)、所講的特定語言、詞匯范圍等。這些算法一經(jīng)部署，再要修改就不是很容易了。
數(shù)據(jù) - 針對(duì)不同的語言和不同的聲音環(huán)境構(gòu)建 ASR 系統(tǒng)需要多種類型的大量數(shù)據(jù)。如此龐大的數(shù)據(jù)并非總能得到，也可能并不適合用例。
擴(kuò)展 - 能夠支持龐大使用量和許多語言的 ASR 系統(tǒng)通常要消耗大量的運(yùn)算資源。

能夠說明這些挑戰(zhàn)的 ASR 系統(tǒng)模塊之一是語言模型。語言模型是***進(jìn)的 ASR 系統(tǒng)的關(guān)鍵部件之一，它們提供語言上下文，幫助預(yù)測(cè)詞語的正確順序并區(qū)分發(fā)音相似的詞語。借助***的機(jī)器學(xué)習(xí)突破，語音識(shí)別開發(fā)者現(xiàn)在利用基于深度學(xué)習(xí)的語言模型，也稱為神經(jīng)語言模型。特別是，相對(duì)于傳統(tǒng)的統(tǒng)計(jì)方法，循環(huán)神經(jīng)語言模型的識(shí)別結(jié)果更勝一籌。

然而，神經(jīng)語言模型的訓(xùn)練和部署相當(dāng)復(fù)雜，而且頗為耗時(shí)。對(duì) IntelligentWire 來說，將 TensorFlow 集成到 Kaldi 中已經(jīng)將 ASR 開發(fā)周期縮短了一個(gè)數(shù)量級(jí)。如果某個(gè)語言模型在 TensorFlow 中已存在，則從模型到概念證明只需要幾天時(shí)間，而不是幾周時(shí)間;對(duì)于新模型，開發(fā)時(shí)間可從幾個(gè)月縮短到幾周。在 Kaldi 生產(chǎn)管道中部署新的 TensorFlow 模型還很簡單，這對(duì)每個(gè)直接使用 Kaldi 以及未來很可能造福于每個(gè)人的更智能的 ASR 系統(tǒng)的人來說，不啻為一大福音。

類似地，這種集成讓 TensorFlow 開發(fā)者能夠輕松訪問強(qiáng)大的 ASR 平臺(tái)，能夠?qū)F(xiàn)有的語音處理管道(例如 Kaldi 強(qiáng)大的聲學(xué)模型)集成到他們的機(jī)器學(xué)習(xí)應(yīng)用中。Kaldi 模塊可以為 TensorFlow 深度學(xué)習(xí)模塊訓(xùn)練提供輸入，模塊的更換干脆利落，為探索研究提供了許多便利，同時(shí)還可重復(fù)利用生產(chǎn)中使用的管道來評(píng)估模型的質(zhì)量。

我們希望 Kaldi 和 TensorFlow 之間的這種集成能夠?qū)⑦@兩個(gè)生機(jī)勃勃的開放源代碼社區(qū)更緊密地結(jié)合在一起，為各種新的語音產(chǎn)品和相關(guān)研究取得突破提供支持。要開始使用集成 TensorFlow 的 Kaldi，請(qǐng)查看 Kaldi 代碼庫：

https://github.com/kaldi-asr/kaldi

另請(qǐng)參閱運(yùn)行 TensorFlow 的 Kaldi 設(shè)置示例：

https://github.com/kaldi-asr/kaldi/tree/master/egs/ami/s5/local/tfrnnlm

【本文是專欄機(jī)構(gòu)“谷歌開發(fā)者”的原創(chuàng)稿件，轉(zhuǎn)載請(qǐng)聯(lián)系原作者(微信公眾號(hào)：Google_Developers)】

戳這里，看該作者更多好文

網(wǎng)站題目：Kaldi現(xiàn)在提供TensorFlow集成
網(wǎng)站URL：http://uogjgqi.cn/article/cceoscs.html

掃二維碼與項(xiàng)目經(jīng)理溝通

我們?cè)谖⑿派?4小時(shí)期待你的聲音

解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流

其他資訊

<nav id="3zk2d"></nav>

av激情亚洲男人的天堂国语,日韩欧美精品一中文字幕,无码av一区二区三区无码,国产又色又爽又刺激的a片,国产又色又爽又刺激的a片

Kaldi現(xiàn)在提供TensorFlow集成

掃二維碼與項(xiàng)目經(jīng)理溝通

其他資訊

行業(yè)動(dòng)態(tài)

企業(yè)網(wǎng)站建設(shè)的重要性！

服務(wù)項(xiàng)目

網(wǎng)站建設(shè)

移動(dòng)端/APP

微信/小程序

技術(shù)支持

其它服務(wù)

更多服務(wù)項(xiàng)目

聯(lián)系吧在百度地圖上找到我們

電話：13518219792

av激情亚洲男人的天堂国语,日韩欧美精品一中文字幕,无码av一区二区三区无码,国产又色又爽又刺激的a片,国产又色又爽又刺激的a片

Kaldi現(xiàn)在提供TensorFlow集成

掃二維碼與項(xiàng)目經(jīng)理溝通

其他資訊

行業(yè)動(dòng)態(tài)

企業(yè)網(wǎng)站建設(shè)的重要性！

服務(wù)項(xiàng)目

網(wǎng)站建設(shè)

移動(dòng)端/APP

微信/小程序

技術(shù)支持

其它服務(wù)

更多服務(wù)項(xiàng)目

聯(lián)系吧 在百度地圖上找到我們

電話：13518219792

企業(yè)網(wǎng)站建設(shè)的重要性！

聯(lián)系吧在百度地圖上找到我們