MoeTTS是一款語(yǔ)音合成軟件,可以在軟件上輸入日語(yǔ),從而選擇模型將文本內(nèi)容朗讀,適合需要制作語(yǔ)音文件的朋友使用,相信很多用戶對(duì)于語(yǔ)音合成都是比較了解的,使用一些語(yǔ)音角色就可以將自己輸入的文本內(nèi)容朗讀,從而獲得音頻文件,如果不想自己錄音或者是配音就可以讓電腦軟件幫助您朗讀文本,從而完成配音,如果你需要合成日語(yǔ)音頻就可以通過(guò)這款MoeTTS軟件合成語(yǔ)音,軟件提供Tacotron2模型、HifiGAN模型,將模型加載到軟件就可以輸入文本內(nèi)容執(zhí)行合成,方便用戶為動(dòng)畫(huà)內(nèi)容配音,需要就下載吧!
1、MoeTTS提供語(yǔ)音合成功能,可以讓角色模型說(shuō)話
2、直接輸入文本內(nèi)容,選擇模型就可以立即合成語(yǔ)音文件
3、現(xiàn)在一些AI角色模型說(shuō)話都是通過(guò)語(yǔ)音合成的方式實(shí)現(xiàn)的
4、通過(guò)大量訓(xùn)練語(yǔ)音數(shù)據(jù)就可以讓角色模型說(shuō)任何內(nèi)容
5、MoeTTS提供很多模型內(nèi)容,加載模型到軟件,輸入日語(yǔ)就可以合成語(yǔ)音內(nèi)容
6、可以添加Tacotron2模型、HifiGAN模型到軟件合成新的語(yǔ)音
7、支持多角色合成,支持單角色合成,輕松輸出語(yǔ)音文件
1、通過(guò)合成語(yǔ)音可以讓電腦AI角色說(shuō)話,可以在配音的時(shí)候使用
2、制作視頻的時(shí)候如果不喜歡自己說(shuō)話就可以讓AI角色說(shuō)話
3、通過(guò)合成語(yǔ)音的方式就可以自動(dòng)說(shuō)話,可以輸入任何文本內(nèi)容朗讀
4、提供十多個(gè)角色,可以在VITS-Multi界面添加多角色模型
5、支持將日語(yǔ)內(nèi)容轉(zhuǎn)換為g2p,方便將轉(zhuǎn)換的文本添加到軟件合成語(yǔ)音
1、下載后打開(kāi)moe_tts_cpu_with_tool.v1.1.1文件夾,找到moe_tts_cpu_with_tool.exe直接啟動(dòng)
2、這里是模型內(nèi)容,可以將軟件提供的模型加載
3、添加合成的內(nèi)容,直接將日語(yǔ)內(nèi)容輸入,日語(yǔ)通過(guò)羅馬音輸入
4、單模型界面,點(diǎn)擊瀏覽文件找到模型內(nèi)容,點(diǎn)設(shè)置輸出地址,設(shè)置文本就可以立即合成語(yǔ)音
5、多角色模型生成界面,您可以設(shè)置需要使用的角色I(xiàn)D讓其幫助您朗讀文本
6、工具箱界面,輸入日語(yǔ)文本將其轉(zhuǎn)換g2p,可以選擇普通轉(zhuǎn)換,空格分詞設(shè)置,分詞+調(diào)形
可以查看視頻教程內(nèi)容
模型目錄格式
單模型可以放在任意位置,如果模型帶有配置文件,請(qǐng)將它重命名為config.json并與TTS模型放置在同一目錄。(例如hifigan,vits模型,它們是帶有配置文件的)
VITS模型請(qǐng)將config.json中的cleaners 改為custom_cleaners
文本輸入格式
文本一般是輸入音素(日語(yǔ)在這里應(yīng)該輸入羅馬音),但具體要看模型訓(xùn)練者的數(shù)據(jù)是怎么輸入的。比如我的ATRI模型(Tacotron2版本)是輸入無(wú)空格羅馬音,標(biāo)點(diǎn)符號(hào)只支持逗號(hào)句號(hào)。
自定義Cleaner與Symbols
你可以在與moetts.exe同級(jí)的目錄下找到custom文件夾,這里面存放了兩種模型的文本模塊。
自定義cleaner:找到cleaners.py并修改custom_cleaners函數(shù)即可(軟件默認(rèn)只會(huì)移除不在symbols中的字符,不對(duì)文本做進(jìn)一步處理)
自定義symbols:找到symbols.py,將里面的符號(hào)為你需要的符號(hào)
注意:不同模型可能使用不同的cleaners與symbols訓(xùn)練,有需要請(qǐng)修改他們,保證模型能正常使用。
GUI使用方法
tacotron2
選擇您的模型路徑與輸出目錄,最后輸入待合成文本,點(diǎn)擊合成語(yǔ)音等待一會(huì)軟件會(huì)將音頻輸出到輸出目錄/outpus.wav
注意事項(xiàng):
首次合成需要加載模型,耗時(shí)較長(zhǎng),相同模型再次合成不會(huì)再次加載,直接合成。
如果切換模型,再次合成會(huì)重新加載。
如果修改cleaners與symbols,重新啟動(dòng)軟件后才能生效。
軟件為64位版本,不支持32位系統(tǒng)。
VITS特殊說(shuō)明
VITS-Single,VITS-Multi分別為單角色模型與多角色模型
VITS-Multi中的原角色I(xiàn)D即待合成語(yǔ)音的角色I(xiàn)D,需要填入數(shù)字,目標(biāo)角色I(xiàn)D為語(yǔ)音遷移功能的待遷移目標(biāo)角色I(xiàn)D。
待遷移音頻需要22050的采樣率,16位,單聲道。
網(wǎng)友評(píng)論