欧洲精品久久久av无码电影,日日噜噜夜夜爽爽,精品无码国产自产拍在线观看蜜,人妻少妇被粗大爽9797pw,羞国产在线拍揄自揄视频,国产白嫩漂亮美女在线观看,天码欧美日本一道免费,av大片在线无码免费

      歡迎來到同城快修-附近家電維修、家電清洗、家電安裝服務(wù)平臺

      24小時家電維修熱線:

      400—1558638

      當(dāng)前位置:主頁 > 熱水器 > 維修資訊 >

      Meta音頻AI三件套爆火:一句話生成音樂音效,還能高保真壓縮音頻

      發(fā)布日期:2023-08-04 18:09:48 瀏覽:
      Meta音頻AI三件套爆火:一句話生成音樂音效,還能高保真壓縮音頻

      蕭簫 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

      Meta突然放大招,直接給一系列音頻AI模型搞了個“全家桶”。

      從文本生成音樂、文本生成音效、到高質(zhì)量音頻壓縮,音頻編輯和音頻生成的AI工具全都有,命名為AudioCraft。

      AudioCraft中的所有模型,全部開源。

      值得一提的是,Meta刻意強調(diào)自己所有AI的訓(xùn)練數(shù)據(jù)都是經(jīng)過授權(quán)、或是從公開渠道獲取的。

      有網(wǎng)友聞訊趕來嘗試:

      這太瘋狂了,剛剛試了一下,生成的聲音效果真不錯!

      還有網(wǎng)友調(diào)侃,Meta這是要與OpenAI“劃界限”:

      很明顯,Meta試圖將自己與OpenAI區(qū)分開來,“我們不使用沒授權(quán)的數(shù)據(jù)”。

      所以,這個音頻AI“全家桶”里有些啥,實際生成編輯效果又如何?

      從生成到編輯,音頻AI三件套

      AudioCraft是一個音頻AI開源庫,目前包含MusicGen,AudioGen和EnCodec三個音頻AI工具。

      據(jù)Meta介紹,為了發(fā)布AudioCraft,他們這兩天還特意更新了一版EnCodec模型,讓它的輸出質(zhì)量更高。

      具體來說,這三個模型分別用于文本生成音樂、文本生成音效和音頻壓縮:

      • MusicGen:基于文本輸入生成音樂,使用Meta擁有和專門授權(quán)的音樂進(jìn)行訓(xùn)練
      • AudioGen:基于文本輸入生成音效(雨點聲、狗吠、警笛等),使用公共音效訓(xùn)練
      • EnCodec:壓縮音頻,以較低的音損保持音頻的高質(zhì)量

      首先是AudioGen,這是一個自回歸生成模型。

      AudioGen基于10個公開的音效數(shù)據(jù)集訓(xùn)練,里面包括狗吠、汽車鳴喇叭或木地板的腳步聲等各種音效。

      然后是MusicGen模型,一共包含300M、1.5B、3.3B三個不同參數(shù)量的自回歸Transformer。

      MusicGen使用了20000小時的音樂來訓(xùn)練,包含10000條內(nèi)部搜集的高質(zhì)量音軌,以及ShutterStock和Pond5素材庫中的數(shù)據(jù),后兩者的數(shù)據(jù)量分別為2.5萬和36.5萬。

      這些音樂數(shù)據(jù)在32kHz下被重新采樣,都配有流派、BPM等基本信息和復(fù)雜一些的文字說明。

      最后是EnCodec神經(jīng)音頻編解碼器(neural audio codec)。

      編碼器能從要壓縮的音頻信號中學(xué)習(xí)離散的音頻token;隨后,基于一個自回歸語言模型,將音頻信號壓縮到目標(biāo)大小;最后,基于解碼器,就能將壓縮的信號高保真重建回音頻。

      基于這種壓縮效果,音頻能被壓縮到比MP3格式還要小10倍。

      可直接上手試玩

      目前這幾個模型都已經(jīng)開源,框架都是基于PyTorch打造。

      包括MusicGen、AudioGen和EnCodec的論文細(xì)節(jié),可以在GitHub項目中找到:

      不過,訓(xùn)練代碼并非全部開源,目前可以看到只有EnCodec、MusicGEN和Multi Band Diffusion是開源的:

      其中MusicGEN還開啟了Demo試玩,我們之前也測試過:

      不過對于AudioCraft的發(fā)布,網(wǎng)友們的評價也是褒貶不一。

      有網(wǎng)友覺得,這樣音頻生成就變得更加大眾化了,所有人都可以上手嘗試:

      但也有網(wǎng)友認(rèn)為,這勢必導(dǎo)致人類連音頻的真假都區(qū)分不清:

      10年后,說不定我們就分辨不清過去的聲音、圖片、視頻了。

      One More Thing

      最近,音頻生成AI確實很火,就連效果都卷起來了。

      這兩天,一個論文和代碼都還在準(zhǔn)備的模型AudioLDM2,剛放出demo就已經(jīng)在網(wǎng)上傳開了來:

      作者Haohe Liu表示,這個模型在生成音效、音樂和可理解語音三個領(lǐng)域中均達(dá)到了SOTA。

      感興趣的小伙伴們,可以蹲一波后續(xù)了~

      MusicGEN試玩地址:https://huggingface.co/spaces/facebook/MusicGen

      參考鏈接:[1]https://ai.meta.com/blog/audiocraftmusicgenaudiogenencodecgenerativeaiaudio/[2]https://github.com/facebookresearch/audiocraft[3]https://twitter.com/LiuHaohe/status/1686782804518973440[4]https://news.ycombinator.com/item?id=36972347

      — 完 —

      量子位 QbitAI · 頭條號簽約

      關(guān)注我們,第一時間獲知前沿科技動態(tài)

      主站蜘蛛池模板: 欧美另类在线观看| 久久久久国产精品| 欧美视频一区二区三区| 热热久| 成人性生交大片免费| 久久精品免费国产大片| 色播综合| 久久久人人爽| 久久综合久色欧美综合狠狠| 亚洲欧美在线观看| 国产在线999| 夜夜躁很很躁日日躁麻豆| 国产精品人妻久久毛片高清无卡| 欧美日皮视频| 9l视频自拍蝌蚪9l视频| 无码视频在线观看| 国产揄拍国产精品| 手机看片亚洲| AV在线亚洲欧洲日产一区二区| 国产妇女馒头高清泬20p多毛| 空姐吹箫视频大全| 天堂av网址| 中文字幕丝袜精品久久| 亚洲国产精品无码7777一线| 亚洲一区欧美| 免费高清欧美大片在线观看| aⅴ在线视频男人的天堂| 成人爱做日本视频免费| 日本不卡高清视频| 国产精品丝袜一区二区| 精品亚洲成a人在线观看| 免费观看又色又爽又黄的| 国产精品美女一区二区三区| 亚洲av无码之国产精品网址蜜芽| 亚洲中文字幕无码中文| 婷婷色网| 亚洲在线免费观看视频| 国产99视频精品免费视频6| 中文字幕精品一区二区2021年| 国产精品午夜福利| av官网在线|