首頁>資訊 >
Meta發(fā)布Voicebox AI模型:能夠生成用于回復(fù)的音頻消息 2023-06-20 11:23:58  來源:TechWeb

6 月 19 日消息,Meta 目前發(fā)布了 Voicebox AI 模型,相對于只能使用文字或圖片回復(fù)的競品模型,Voicebox AI 模型的優(yōu)勢主要如其名,能夠生成用于回復(fù)的音頻消息。

據(jù)悉,Voicebox AI 模型只需要一段 2 秒鐘的音頻樣本,即可準(zhǔn)確辨別出音頻細(xì)節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語音輸出,支持英語、法語、德語、西班牙語。此外,Voicebox 還具備“基于語音片段前后內(nèi)容來補(bǔ)齊中間缺失內(nèi)容”的能力。

Meta 表示,Voicebox 可以為基于 AI 的虛擬助手或元宇宙中的 NPC 提供自然而真實的語音效果。而對于無障礙方面而言,Voicebox 也可以對聲帶受損的人群提供一定的協(xié)助作用。

IT之家經(jīng)過查詢得知,Voicebox AI 模型目前仍處于研發(fā)階段。Meta 表示,他們意識到這種人工智能技術(shù)在虛假偽造方面,可能會帶來潛在危害,因此 Meta 目前正在努力找到一種有效的方式來區(qū)分真實語音和由 Voicebox 生成的音頻,在找到解決方案前,暫時不會向公眾公開提供。目前可以在這里找到 Voicebox 模型的更多信息。

關(guān)鍵詞:

相關(guān)閱讀:
熱點
圖片