在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    音樂生成深度學(xué)習(xí)模型StemGen:聽取音樂上下文生成音樂作品

    極客號(Daydx.com)12月19日 消息:字節(jié)跳動AI研究團隊最近推出了一項名為StemGen的音樂生成項目,該項目采用了一種創(chuàng)新的深度學(xué)習(xí)方法,旨在讓模型能夠模仿現(xiàn)有音樂中的模式和結(jié)構(gòu),并以一種非常前衛(wèi)的方式回應(yīng)音樂背景。與常用的深度學(xué)習(xí)技術(shù)(如RNN、LSTM網(wǎng)絡(luò)和Transformer模型)不同,StemGen采用了一種非自回歸、基于Transformer的模型,強調(diào)對音樂背景的聽取和響應(yīng),而不是依賴于抽象的條件。

    音樂生成深度學(xué)習(xí)模型StemGen:聽取音樂上下文生成音樂作品

    研究中,來自SAMI和字節(jié)跳動公司的研究人員引入了一種非自回歸、基于Transformer的模型,該模型通過利用MusicGen模型的公開可用的Encodec檢查點來監(jiān)聽和響應(yīng)音樂背景。通過使用標(biāo)準(zhǔn)度量和音樂信息檢索描述符方法,包括Frechet Audio Distance(FAD)和Music Information Retrieval Descriptor Distance(MIRDD),研究團隊評估了模型的性能。結(jié)果顯示,該模型在音頻質(zhì)量和與音樂背景的穩(wěn)健對齊方面表現(xiàn)出競爭性,經(jīng)過客觀度量和主觀MOS測試的驗證。

    這項研究強調(diào)了最新在端到端音樂生成方面的進(jìn)展,借鑒了圖像和語言處理的技術(shù)。它強調(diào)了在音樂創(chuàng)作中對音頻片段進(jìn)行對齊的挑戰(zhàn),并對現(xiàn)有依賴于抽象條件的模型提出了批評。研究提出了一種訓(xùn)練范式,使用了一種非自回歸、基于Transformer的架構(gòu),使模型能夠?qū)σ魳繁尘白龀鲰憫?yīng)。該方法引入了兩個條件源,并將問題框架構(gòu)建為條件生成。

    該方法利用了一種非自回歸、基于Transformer的音樂生成模型,通過在單獨的音頻編碼模型中引入殘差向量量化器。通過將多個音頻通道組合成一個單一的序列元素,采用了嵌套的方法。訓(xùn)練過程中采用了掩碼程序,并在進(jìn)行令牌采樣期間使用了無分類器的指導(dǎo),以增強音頻背景的對齊??陀^度量包括Fr’echet Audio Distance和音樂信息檢索描述符距離等,用于評估模型的性能。

    研究團隊通過使用標(biāo)準(zhǔn)度量和音樂信息檢索描述符方法進(jìn)行生成模型的評估,包括FAD和MIRDD。與真實音頻片段的比較表明,該模型在音頻質(zhì)量上達(dá)到了與最先進(jìn)的文本條件模型相媲美的水平,并展現(xiàn)出與音樂背景的強大音樂連貫性。通過參與音樂培訓(xùn)的參與者進(jìn)行的Mean Opinion Score測試進(jìn)一步驗證了該模型生成逼真音樂結(jié)果的能力。MIRDD對生成和真實音頻片段的分布對齊進(jìn)行評估,提供了音樂連貫性和對齊的度量。

    總的來說,這項研究提出了一種新的訓(xùn)練方法,使生成模型能夠?qū)σ魳繁尘白龀鲰憫?yīng)。該方法引入了一種非自回歸語言模型,具有Transformer骨干和兩個未經(jīng)測試的改進(jìn):多源無分類器的指導(dǎo)和迭代解碼過程中的因果偏差。通過在開源和專有數(shù)據(jù)集上進(jìn)行訓(xùn)練,這些模型實現(xiàn)了最先進(jìn)的音頻質(zhì)量。標(biāo)準(zhǔn)度量和音樂信息檢索描述符方法驗證了其音頻質(zhì)量。通過Mean Opinion Score測試確認(rèn)了該模型生成逼真音樂結(jié)果的能力。

    項目網(wǎng)址:https://julian-parker.github.io/stemgen/

    論文網(wǎng)址:https://arxiv.org/abs/2312.08723

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2023年12月19日 12:07
    下一篇 2023年12月19日 12:11

    相關(guān)推薦

    • 日本電視劇收視率歷史排名(電視劇收視率歷史排名)

      收視率最高的電視劇排行榜前十名 1、但是《還珠格格》卻是我童年中我最喜歡看的電視劇。每到夏天的時候總會去看,好像如果這個夏天沒有看這個電視劇,夏天好像就沒有到來??梢娺@部電視劇對于…

      2024年1月24日
    • 液壓機械缸鍛造廠家品質(zhì)好的有哪些值得推薦?

      液壓機是一種以液體為工作介質(zhì)的重要機械設(shè)備,其核心功能是傳遞能量,實現(xiàn)各種工藝流程。除了在鍛壓成形方面的應(yīng)用,液壓機還廣泛應(yīng)用于矯正、壓裝、打包、壓塊和壓板等領(lǐng)域。根據(jù)工作介質(zhì)的不…

      2024年1月24日
    • 湖南暴雪已致1萬多人受災(zāi)

      據(jù)@湖南氣象 ,22日7時至23日7時,湘中、湘南出現(xiàn)大到暴雪,長沙(瀏陽)、株洲(醴陵、茶陵)等13個縣市區(qū)出現(xiàn)大暴雪,郴州(北湖區(qū))、株洲(荷塘區(qū))出現(xiàn)特大暴雪;全省23個縣市…

      2024年1月24日
    • 落馬貪官退贓像“割肉”,詢問能不能少交點

      “就像割我身上的肉一般,會讓我痛不欲生?!?24日,中央紀(jì)委國家監(jiān)委網(wǎng)站發(fā)布了針對云南省文山州住房和城鄉(xiāng)建設(shè)局原黨組成員、副局長李慶明嚴(yán)重違紀(jì)違法案的剖析。信奉金錢至上的李慶明惜財…

      2024年1月24日
    • 中國gdp排行榜城市(中國gdp排行榜)

      中國各省gdp排名 1、根據(jù)查詢國家統(tǒng)計局官網(wǎng)信息顯示,2023年各省排名,廣東:GDP為1243667億。江蘇:GDP為116362億。山東:GDP為83099億。浙江:GDP為…

      2024年1月24日
    • SK-II大中華區(qū)季度銷售額暴跌34%,寶潔:日本核污水排海是主因

      財聯(lián)社1月24日訊(編輯 卞純)全球日用消費品巨頭寶潔公司(ProcterGamble)周二表示,在截至12月底的第二財季,其高端護(hù)膚品牌SK-II在大中華區(qū)的銷售額下降了34%,…

      2024年1月24日
    • 呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退

      呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 原標(biāo)題: 呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 央視網(wǎng)消息:據(jù)@呼和浩特白塔國際機場 消息,呼和浩…

      2024年1月24日
    • 退休職工舉報局長被判刑,被舉報人卻提級退休把人看懵了

      文|龍之朱 又見錯抓錯判上了熱搜。 據(jù)媒體報道,從2016年3月起,安徽宿州市碭山縣農(nóng)機局退休職工李平實名向紀(jì)檢部門舉報局長王超經(jīng)濟問題,均石沉大海。 2017年7月,李平夫婦及親…

      2024年1月24日
    • 6寸蛋糕用5斤車?yán)遄拥昙业狼?

      【#6寸蛋糕用5斤車?yán)遄拥昙业狼?:客服能力不足,多報了2斤車?yán)遄印?遇到商家虛假宣傳你會怎么辦# 近日,有網(wǎng)友發(fā)帖稱做六寸蛋糕需要5斤車?yán)遄右裏嶙h。 1月22日,涉事店家就“6寸…

      2024年1月24日
    • 格蘭芬多院徽簡筆畫(格蘭芬多院徽)

      哈利波特的霍格沃茨學(xué)校分別是哪些學(xué)院? 1、《哈利波特》電影中的霍格沃茨學(xué)院,一共分為四個學(xué)院,分別是:格蘭芬多、赫奇帕奇、拉文克勞與斯萊特林。 2、霍格沃茨魔法學(xué)院共有格蘭芬多、…

      2024年1月24日

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時間:周一至周五,10:30-18:30,節(jié)假日休息