欧洲精品久久久av无码电影,日日噜噜夜夜爽爽,精品无码国产自产拍在线观看蜜,人妻少妇被粗大爽9797pw,羞国产在线拍揄自揄视频,国产白嫩漂亮美女在线观看,天码欧美日本一道免费,av大片在线无码免费

      歡迎來到同城快修-附近家電維修、家電清洗、家電安裝服務(wù)平臺

      24小時家電維修熱線:

      400—1558638

      當(dāng)前位置:主頁 > 熱水器 > 維修資訊 >

      Meta音頻AI三件套爆火:一句話生成音樂音效,還能高保真壓縮音頻

      發(fā)布日期:2023-08-04 18:09:48 瀏覽:
      Meta音頻AI三件套爆火:一句話生成音樂音效,還能高保真壓縮音頻

      蕭簫 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

      Meta突然放大招,直接給一系列音頻AI模型搞了個“全家桶”。

      從文本生成音樂、文本生成音效、到高質(zhì)量音頻壓縮,音頻編輯和音頻生成的AI工具全都有,命名為AudioCraft。

      AudioCraft中的所有模型,全部開源。

      值得一提的是,Meta刻意強調(diào)自己所有AI的訓(xùn)練數(shù)據(jù)都是經(jīng)過授權(quán)、或是從公開渠道獲取的。

      有網(wǎng)友聞訊趕來嘗試:

      這太瘋狂了,剛剛試了一下,生成的聲音效果真不錯!

      還有網(wǎng)友調(diào)侃,Meta這是要與OpenAI“劃界限”:

      很明顯,Meta試圖將自己與OpenAI區(qū)分開來,“我們不使用沒授權(quán)的數(shù)據(jù)”。

      所以,這個音頻AI“全家桶”里有些啥,實際生成編輯效果又如何?

      從生成到編輯,音頻AI三件套

      AudioCraft是一個音頻AI開源庫,目前包含MusicGen,AudioGen和EnCodec三個音頻AI工具。

      據(jù)Meta介紹,為了發(fā)布AudioCraft,他們這兩天還特意更新了一版EnCodec模型,讓它的輸出質(zhì)量更高。

      具體來說,這三個模型分別用于文本生成音樂、文本生成音效和音頻壓縮:

      • MusicGen:基于文本輸入生成音樂,使用Meta擁有和專門授權(quán)的音樂進(jìn)行訓(xùn)練
      • AudioGen:基于文本輸入生成音效(雨點聲、狗吠、警笛等),使用公共音效訓(xùn)練
      • EnCodec:壓縮音頻,以較低的音損保持音頻的高質(zhì)量

      首先是AudioGen,這是一個自回歸生成模型。

      AudioGen基于10個公開的音效數(shù)據(jù)集訓(xùn)練,里面包括狗吠、汽車鳴喇叭或木地板的腳步聲等各種音效。

      然后是MusicGen模型,一共包含300M、1.5B、3.3B三個不同參數(shù)量的自回歸Transformer。

      MusicGen使用了20000小時的音樂來訓(xùn)練,包含10000條內(nèi)部搜集的高質(zhì)量音軌,以及ShutterStock和Pond5素材庫中的數(shù)據(jù),后兩者的數(shù)據(jù)量分別為2.5萬和36.5萬。

      這些音樂數(shù)據(jù)在32kHz下被重新采樣,都配有流派、BPM等基本信息和復(fù)雜一些的文字說明。

      最后是EnCodec神經(jīng)音頻編解碼器(neural audio codec)。

      編碼器能從要壓縮的音頻信號中學(xué)習(xí)離散的音頻token;隨后,基于一個自回歸語言模型,將音頻信號壓縮到目標(biāo)大小;最后,基于解碼器,就能將壓縮的信號高保真重建回音頻。

      基于這種壓縮效果,音頻能被壓縮到比MP3格式還要小10倍。

      可直接上手試玩

      目前這幾個模型都已經(jīng)開源,框架都是基于PyTorch打造。

      包括MusicGen、AudioGen和EnCodec的論文細(xì)節(jié),可以在GitHub項目中找到:

      不過,訓(xùn)練代碼并非全部開源,目前可以看到只有EnCodec、MusicGEN和Multi Band Diffusion是開源的:

      其中MusicGEN還開啟了Demo試玩,我們之前也測試過:

      不過對于AudioCraft的發(fā)布,網(wǎng)友們的評價也是褒貶不一。

      有網(wǎng)友覺得,這樣音頻生成就變得更加大眾化了,所有人都可以上手嘗試:

      但也有網(wǎng)友認(rèn)為,這勢必導(dǎo)致人類連音頻的真假都區(qū)分不清:

      10年后,說不定我們就分辨不清過去的聲音、圖片、視頻了。

      One More Thing

      最近,音頻生成AI確實很火,就連效果都卷起來了。

      這兩天,一個論文和代碼都還在準(zhǔn)備的模型AudioLDM2,剛放出demo就已經(jīng)在網(wǎng)上傳開了來:

      作者Haohe Liu表示,這個模型在生成音效、音樂和可理解語音三個領(lǐng)域中均達(dá)到了SOTA。

      感興趣的小伙伴們,可以蹲一波后續(xù)了~

      MusicGEN試玩地址:https://huggingface.co/spaces/facebook/MusicGen

      參考鏈接:[1]https://ai.meta.com/blog/audiocraftmusicgenaudiogenencodecgenerativeaiaudio/[2]https://github.com/facebookresearch/audiocraft[3]https://twitter.com/LiuHaohe/status/1686782804518973440[4]https://news.ycombinator.com/item?id=36972347

      — 完 —

      量子位 QbitAI · 頭條號簽約

      關(guān)注我們,第一時間獲知前沿科技動態(tài)

      主站蜘蛛池模板: 激情二区| 国产精品国产av片国产| 白浆av| 亚欧三级| 综合伊人| 久久免费资源| 色五月丁香五月综合五月4438| 久艹在线视频| 奇米在线播放| 噜噜高清欧美内射短视频 | 精品一区二区不卡无码AV| 亚洲国产精品福利片在线观看| 中文字幕欧美一区| 色播影院性播影院私人影院| 人人爽人人爽人人爽| 亚洲 制服 丝袜 无码| 亚洲国内精品自在线影院牛牛| 暧暧视频在线观看| 成人做爰A片免费看网站找不到了| 天堂网www最新版官网| 黄色av资源| 欧洲美女与动性zozozo| 精品免费在线观看| 亚洲爽爆av一区二区| 一区二区三区蜜桃| 欧美精品毛片久久久久久久| av在线中文| 亚洲一区二区三区加勒比| 欧美又大又黄又粗又长a片| 欧美特黄一级| 福利视频导航网| 玩丰满高大邻居人妻无码| 丝袜自慰一区二区三区| 国产美女www爽爽爽视频| 精品国产午夜福利在线观看| 午夜亚洲国产理论片二级港台二级| 91爱爱网站| 网友自拍视频一区二区三区| 国产精品社区| 天天天天噜在线视频| 成人一区二区三区四区|