(相關資料圖)
快科技6月19日消息,近日,Meta發布了Voicebox AI模型,它在音頻模擬方面有著顯著優勢。
據悉,Voicebox只需要一段2秒鐘的音頻樣本,即可準確辨別出音頻細節、音色,并基于文字結果轉換為語音輸出。
同時,它還可以基于語音片段的前后內容,自動補齊中間缺失的內容。
根據Meta的介紹,Voicebox能夠為AI助手,或是未來元宇宙的NPC提供自然且真實的語音效果,大大提升用戶使用時的沉浸感。
同時,它也能夠為聲帶受損的人群提供協助,幫助TA們重新“發聲”。
值得一提的是,Meta目前已經意識到了Voicebox被應用在造假領域時,存在的潛在危害,因此他們正在尋找一種區分真實語音和Voicebox生成語音的方法。
在找到解決方法前,Meta將不會向公眾公開Voicebox AI模型,以避免不必要的危害。
關于我們| 聯系方式| 版權聲明| 供稿服務| 友情鏈接
咕嚕網 www.fyuntv.cn 版權所有,未經書面授權禁止使用
Copyright©2008-2023 By All Rights Reserved 皖ICP備2022009963號-10
聯系我們: 39 60 29 14 2@qq.com