掃二維碼與項目經(jīng)理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯(lián)網(wǎng)交流
TTS引擎用于實現(xiàn)文本到語音的轉換。隨著人工智能的普及以及數(shù)字設備應用的增加,相關系統(tǒng)對語音識別以及文語轉換技術日益依賴,TTS正在變得越來越重要。

10年積累的成都做網(wǎng)站、成都網(wǎng)站建設經(jīng)驗,可以快速應對客戶對網(wǎng)站的新想法和需求。提供各種問題對應的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡服務。我雖然不認識你,你也不認識我。但先網(wǎng)站設計后付款的網(wǎng)站建設流程,更有長島免費網(wǎng)站建設讓你可以放心的選擇與我們合作。
在這項技術的幫助下,可以將文本內容轉換為錄音。可以幫助視覺障礙的人理解文本內容,可以讓開車的人聽取一個文本工作報告,甚至模擬某個人的聲音播報一段內容、演唱一個歌曲,實現(xiàn)虛擬主播、虛擬歌手。
本文主要查找收集了一些較好的開源TTS引擎。這些項目有助于我們更加了解TTS的功能。
https://github.com/coqui-ai/TTS
這是一個在研究和生產(chǎn)中經(jīng)過了實戰(zhàn)考驗的TTS深度學習工具包,可以以200毫秒的延遲進行流傳輸,支持13種語言(包括中文)。
https://github.com/mozilla/TTS
TTS是一個用于文本到語音生成的高級庫。旨在實現(xiàn)易于訓練、高速度和高質量的最佳平衡。 提供預訓練模型,以及用于測量數(shù)據(jù)集質量的工具,支持用于產(chǎn)品和研究的20多種語言,包括支持中文。
https://github.com/synesthesiam/opentts
OpenTTS是TTS最有效的開源模型之一。因為該模型支持包括中文在內的多種語言。
https://github.com/marytts/marytts
MARY Text-to-Speech 語音合成是一個多語言TTS平臺,支持英語(英國和美國)、法語、德語、意大利語、俄語等語言。
產(chǎn)品特點:
https://github.com/espeak-ng/espeak-ng
eSpeak是一個緊湊的開源TTS引擎,可運行于Windows和Linux。支持100多種語種和語音(包括中文普通話)。
產(chǎn)品特點:
https://github.com/MycroftAI/mimic3
Mimic是一個快如閃電的開源TTS引擎。
產(chǎn)品特點:
目前,該工具正在為患有語言障礙的人帶來逼真的聲音。
https://github.com/festvox/flite
Festival Lite通常被稱為Flite。它是一個小型的運行時引擎,被認為是最快的TTS引擎之一。
由于它是一個開源引擎,并且是免費的,可以基于這個項目做許多自定義功能。因此,許多公司都選擇了這個TTS引擎。
核心特點:
https://github.com/numediart/MBROLA
MBROLA是Multi-Band Resynthesis OverLap Add的縮寫,也是最常用的開源TTS引擎之一。它支持多種語言。
功能特點:
https://github.com/ranchlai/mandarin-tts
這是一個模塊化的中文普通話TTS語音合成框架,旨在支持研究和快速產(chǎn)品開發(fā)。
主要功能包括:
https://github.com/atomicoo/FCH-TTS
一個快速語音合成模型,適用于英語、普通話/中文、日語、韓語、俄語和藏語。
https://github.com/rhasspy/piper
piper是一個快速的本地語音合成系統(tǒng),并針對Raspberry Pi 4(樹莓)進行了優(yōu)化。 支持包括中文在內的多種語言。
使用DEMO如:
echo 'Welcome to the world of speech synthesis!' | \
./piper --model en_US-lessac-medium.onnx --output_file welcome.wav

我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯(lián)網(wǎng)交流