在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    【新智元導(dǎo)讀】Midjourney強(qiáng)敵來(lái)了!谷歌定制大師StyleDrop,將一張圖片作為參考,不論多復(fù)雜的藝術(shù)風(fēng)格都能復(fù)刻。

    谷歌StyleDrop一出,瞬間在網(wǎng)上刷屏了。

    給定梵高的星空,AI化身梵高大師,對(duì)這種抽象風(fēng)格頂級(jí)理解后,做出無(wú)數(shù)幅類似的畫作。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    再來(lái)一張卡通風(fēng),想要繪制的物體呆萌了許多。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    甚至,它還能精準(zhǔn)把控細(xì)節(jié),設(shè)計(jì)出原風(fēng)格的logo。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    StyleDrop的魅力在于,只需要一張圖作為參考,無(wú)論多么復(fù)雜的藝術(shù)風(fēng)格,都能解構(gòu)再?gòu)?fù)刻。

    網(wǎng)友紛紛表示,又是淘汰設(shè)計(jì)師的那種AI工具。

    StyleDrop爆火研究便是來(lái)自谷歌研究團(tuán)隊(duì)最新出品。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    論文地址:https://arxiv.org/pdf/2306.00983.pdf

    現(xiàn)在,有了StyleDrop這樣的工具,不但可以更可控地繪畫,還可以完成之前難以想象的精細(xì)工作,比如繪制logo。

    就連英偉達(dá)科學(xué)家將其稱為「現(xiàn)象級(jí)」成果。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    「定制」大師

    論文作者介紹道,StyleDrop的靈感來(lái)源Eyedropper(吸色/取色工具)。

    同樣,StyleDrop同樣希望大家可以快速、毫不費(fèi)力地從單個(gè)/少數(shù)參考圖像中「挑選」樣式,以生成該樣式的圖像。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    一只樹(shù)懶能夠有18種風(fēng)格:

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    一只熊貓有24種風(fēng)格:

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    小朋友畫的水彩畫,StyleDrop完美把控,甚至連紙張的褶皺都還原出來(lái)了。

    不得不說(shuō),太強(qiáng)了。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    還有StyleDrop參考不同風(fēng)格對(duì)英文字母的設(shè)計(jì):

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    同樣是梵高風(fēng)的字母。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    還有線條畫。線條畫是對(duì)圖像的高度抽象,對(duì)畫面生成構(gòu)成合理性要求非常高,過(guò)去的方法一直很難成功。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    原圖中奶酪陰影的筆觸還原到每種圖片的物體上。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    參考安卓LOGO創(chuàng)作。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    此外,研究人員還拓展了StyleDrop的能力,不僅能定制風(fēng)格,結(jié)合DreamBooth,還能定制內(nèi)容。

    比如,還是梵高風(fēng),給小柯基生成類似風(fēng)格的畫作:

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    再來(lái)一個(gè),下面這只柯基有種埃及金字塔上的「獅身人面像」的感覺(jué)。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    如何工作?

    StyleDrop基于Muse構(gòu)建,由兩個(gè)關(guān)鍵部分組成:

    一個(gè)是生成視覺(jué)Transformer的參數(shù)有效微調(diào),另一個(gè)是帶反饋的迭代訓(xùn)練。

    之后,研究人員再?gòu)膬蓚€(gè)微調(diào)模型中合成圖像。

    Muse是一種基于掩碼生成圖像Transformer最新的文本到圖像的合成模型。它包含兩個(gè)用于基礎(chǔ)圖像生成(256×256)和超分辨率(512×512或1024×1024)的合成模塊。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    每個(gè)模塊都由一個(gè)文本編碼器T,一個(gè)transformer G,一個(gè)采樣器S,一個(gè)圖像編碼器E和解碼器D組成。

    T將文本提示t∈T映射到連續(xù)嵌入空間E。G處理文本嵌入e∈E以生成視覺(jué)token序列的對(duì)數(shù)l∈L。S通過(guò)迭代解碼從對(duì)數(shù)中提取視覺(jué)token序列v∈V,該迭代解碼運(yùn)行幾步的transformer推理,條件是文本嵌入e和從前面步驟解碼的視覺(jué)token。

    最后,D將離散token序列映射到像素空間I。總的來(lái)說(shuō),給定一個(gè)文本提示t,圖像I的合成如下:

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    圖2是一個(gè)簡(jiǎn)化了的Muse transformer層的架構(gòu),它進(jìn)行了部分修改,為的是支持參數(shù)高效微調(diào)(PEFT)與適配器。

    使用L層的transformer處理在文本嵌入e的條件下以綠色顯示的視覺(jué)token序列。學(xué)習(xí)參數(shù)θ被用于構(gòu)建適配器調(diào)優(yōu)的權(quán)重。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    為了訓(xùn)練θ,在許多情況下,研究人員可能只給出圖片作為風(fēng)格參考。

    研究人員需要手動(dòng)附加文本提示。他們提出了一個(gè)簡(jiǎn)單的、模板化的方法來(lái)構(gòu)建文本提示,包括對(duì)內(nèi)容的描述,后面跟著描述風(fēng)格的短語(yǔ)。

    例如,研究人員在表1中用「貓」描述一個(gè)對(duì)象,并附加「水彩畫」作為風(fēng)格描述。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    在文本提示中包含內(nèi)容和風(fēng)格的描述至關(guān)重要,因?yàn)樗兄趶娘L(fēng)格中分離出內(nèi)容,這是研究人員的主要目標(biāo)。

    圖3則是帶反饋的迭代訓(xùn)練。

    當(dāng)在單一風(fēng)格參考圖像(橙色框)上進(jìn)行訓(xùn)練時(shí),StyleDrop生成的一些圖像可能會(huì)展示出從風(fēng)格參考圖像中提取出的內(nèi)容(紅色框,圖像背景中含有與風(fēng)格圖像類似的房子)。

    其他圖像(藍(lán)色框)則能更好地從內(nèi)容中拆分出風(fēng)格。對(duì)StyleDrop進(jìn)行好樣本(藍(lán)色框)的迭代訓(xùn)練,結(jié)果在風(fēng)格和文本保真度之間取得了更好的平衡(綠色框)。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    這里研究人員還用到了兩個(gè)方法:

    -CLIP得分

    該方法用于測(cè)量圖像和文本的對(duì)齊程度。因此,它可以通過(guò)測(cè)量CLIP得分(即視覺(jué)和文本CLIP嵌入的余弦相似度)來(lái)評(píng)估生成圖像的質(zhì)量。

    研究人員可以選擇得分最高的CLIP圖像。他們稱這種方法為CLIP反饋的迭代訓(xùn)練(CF)。

    在實(shí)驗(yàn)中,研究人員發(fā)現(xiàn),使用CLIP得分來(lái)評(píng)估合成圖像的質(zhì)量是提高召回率(即文本保真度)的有效方式,而不會(huì)過(guò)多損失風(fēng)格保真度。

    然而從另一方面看,CLIP得分可能不能完全與人類的意圖對(duì)齊,也無(wú)法捕捉到微妙的風(fēng)格屬性。

    -HF

    人工反饋(HF)是一種將用戶意圖直接注入到合成圖像質(zhì)量評(píng)估中的更直接的方式。

    在強(qiáng)化學(xué)習(xí)的LLM微調(diào)中,HF已經(jīng)證明了它的強(qiáng)大和有效。

    HF可以用來(lái)補(bǔ)償CLIP得分無(wú)法捕捉到微妙風(fēng)格屬性的問(wèn)題。

    目前,已有大量研究關(guān)注了文本到圖像的擴(kuò)散模型的個(gè)性化問(wèn)題,以合成包含多種個(gè)人風(fēng)格的圖像。

    研究人員展示了如何以簡(jiǎn)單的方式將DreamBooth和StyleDrop結(jié)合起來(lái),從而使風(fēng)格和內(nèi)容都能實(shí)現(xiàn)個(gè)性化。

    這是通過(guò)從兩個(gè)修改后的生成分布中采樣來(lái)完成的,分別由風(fēng)格的θs和內(nèi)容的θc指導(dǎo),分別是在風(fēng)格和內(nèi)容參考圖像上獨(dú)立訓(xùn)練的適配器參數(shù)。

    與現(xiàn)有的成品不同,該團(tuán)隊(duì)的方法不需要在多個(gè)概念上對(duì)可學(xué)習(xí)的參數(shù)進(jìn)行聯(lián)合訓(xùn)練,這就帶來(lái)了更大的組合能力,因?yàn)轭A(yù)訓(xùn)練的適配器是分別在單個(gè)主題和風(fēng)格上進(jìn)行訓(xùn)練的。

    研究人員的整體采樣過(guò)程遵循等式(1)的迭代解碼,每個(gè)解碼步驟中采樣對(duì)數(shù)的方式有所不同。

    設(shè)t為文本提示,c為無(wú)風(fēng)格描述符的文本提示,在步驟k計(jì)算對(duì)數(shù)如下:

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    其中:γ用于平衡StyleDrop和DreamBooth——如果γ為0,我們得到StyleDrop,如果為1,我們得到DreamBooth。

    通過(guò)合理設(shè)置γ,我們就可以得到合適的圖像。

    實(shí)驗(yàn)設(shè)置

    目前為止,還沒(méi)有對(duì)文本-圖像生成模型的風(fēng)格調(diào)整進(jìn)行廣泛的研究。

    因此,研究人員提出了一個(gè)全新實(shí)驗(yàn)方案:

    -數(shù)據(jù)收集

    研究者收集了幾十張不同風(fēng)格的圖片,從水彩和油畫,平面插圖,3D渲到不同材質(zhì)的雕塑。

    -模型配置

    研究人員使用適配器調(diào)優(yōu)基于Muse的StyleDrop 。對(duì)于所有實(shí)驗(yàn),使用Adam優(yōu)化器更新1000步的適配器權(quán)重,學(xué)習(xí)速率為0.00003。除非另有說(shuō)明,研究人員使用StyleDrop來(lái)表示第二輪模型,該模型在10多個(gè)帶有人工反饋的合成圖像上進(jìn)行訓(xùn)練。

    -評(píng)估

    研究報(bào)告的定量評(píng)估基于CLIP,衡量風(fēng)格一致性和文本對(duì)齊。此外,研究人員進(jìn)行了用戶偏好研究,以評(píng)估風(fēng)格一致性和文本對(duì)齊。

    如圖,研究人員收集的18個(gè)不同風(fēng)格的圖片,StyleDrop處理的結(jié)果。

    可以看到,StyleDrop能夠捕捉各種樣式的紋理、陰影和結(jié)構(gòu)的細(xì)微差別,能夠比以前更好地控制風(fēng)格。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    為了進(jìn)行比較,研究人員還介紹了DreamBooth在Imagen上的結(jié)果,DreamBooth在Stable Diffusion上的LoRA實(shí)現(xiàn)和文本反演的結(jié)果。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    具體結(jié)果如表所示,圖像-文本對(duì)齊(Text)和視覺(jué)風(fēng)格對(duì)齊(Style)的人類評(píng)分(上)和CLIP評(píng)分(下)的評(píng)價(jià)指標(biāo)。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    (a) DreamBooth,(b) StyleDrop,和 (c) DreamBooth + StyleDrop的定性比較:

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    這里,研究人員應(yīng)用了上面提到的CLIP分?jǐn)?shù)的兩個(gè)指標(biāo)——文本和風(fēng)格得分。

    對(duì)于文本得分,研究人員測(cè)量圖像和文本嵌入之間的余弦相似度。對(duì)于風(fēng)格得分,研究人員測(cè)量風(fēng)格參考和合成圖像嵌入之間的余弦相似度。

    研究人員為190個(gè)文本提示生成總共1520個(gè)圖像。雖然研究人員希望最終得分能高一些,但其實(shí)這些指標(biāo)并不完美。

    而迭代訓(xùn)練(IT)提高了文本得分,這符合研究人員的目標(biāo)。

    然而,作為權(quán)衡,它們?cè)诘谝惠喣P蜕系娘L(fēng)格得分有所降低,因?yàn)樗鼈兪窃诤铣蓤D像上訓(xùn)練的,風(fēng)格可能因選擇偏見(jiàn)而偏移。

    Imagen上的DreamBooth在風(fēng)格得分上不及StyleDrop(HF的0.644對(duì)比0.694)。

    研究人員注意到,Imagen上的DreamBooth的風(fēng)格得分增加并不明顯(0.569→0.644),而Muse上的StyleDrop的增加更加明顯(0.556→0.694)。

    研究人員分析,Muse上的風(fēng)格微調(diào)比Imagen上的更有效。

    另外,在細(xì)粒度控制上, StyleDrop捕捉微妙的風(fēng)格差異,如顏色偏移,層次,或銳角的把控。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    網(wǎng)友熱評(píng)

    要是設(shè)計(jì)師有了StyleDrop,10倍速工作效率,已經(jīng)起飛。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    AI一天,人間10年,AIGC正在以光速發(fā)展,那種晃瞎人眼的光速!

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    工具只是順應(yīng)了潮流,該被淘汰的已經(jīng)早被淘汰了。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    對(duì)于制作Logo來(lái)說(shuō)這個(gè)工具比Midjourney好用得多。

    Midjourney勁敵來(lái)了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術(shù)圈

    參考資料:

    https://styledrop.github.io/

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場(chǎng),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
    (0)
    用戶投稿
    上一篇 2023年6月4日 18:12
    下一篇 2023年6月4日 18:58

    相關(guān)推薦

    • 期指交割日對(duì)股市的影響(期指交割日)

      今天,我想和大家分享一些關(guān)于期指交割日以及期指交割日對(duì)股市的影響的問(wèn)題。以下是小編對(duì)這個(gè)問(wèn)題的總結(jié)。讓我們看一看。 什么是股指期貨交割日 就期貨合約而言,交割日是指約定進(jìn)行商品交割…

      2023年5月27日
    • 關(guān)于谷雨的詩(shī)句和諺語(yǔ) 谷雨的七言絕句

      谷雨是節(jié)氣之一,是春天的最后一個(gè)節(jié)氣,也是雨水增多的日子,谷雨將近,你會(huì)發(fā)現(xiàn)近期有很多降雨天氣,農(nóng)民伯伯在這時(shí)候也開(kāi)始忙活起來(lái),盼著秧苗能夠多吸引水分,長(zhǎng)勢(shì)良好。那么,關(guān)于谷雨的詩(shī)…

      2022年7月26日
    • 美洲的印第安人,是怎么對(duì)待落入他們手中的白人美女?

      大家好,我是和你們一樣愛(ài)好娛樂(lè),每天關(guān)注歷史資訊的【清元說(shuō)歷史】,跟著我?guī)銈兠刻炜醋钚沦Y訊。 數(shù)百年來(lái),歐洲的殖民主義者對(duì)廣袤的美洲大陸進(jìn)行了探索,這場(chǎng)沖突是不可避免的,也導(dǎo)致了…

      2023年5月13日
    • 如何將豆腐變大?小伙機(jī)智回答,秒錄取

      面試官:如何將豆腐變大?小伙機(jī)智回答,秒錄取。 如今,每一份的工作都是需要面試的,對(duì)于很多剛剛步入社會(huì)的面試者,他們常常會(huì)以為面試官會(huì)提問(wèn)他們一些專業(yè)的知識(shí)問(wèn)題,填填表格什么的,那…

      2023年4月30日
    • 揚(yáng)言再闖臺(tái)海,美國(guó)為何又拱火?專家解讀

      日前,有臺(tái)灣媒體報(bào)道,美國(guó)五角大樓官員以及美國(guó)白宮國(guó)安會(huì)印太事務(wù)協(xié)調(diào)員坎貝爾近期接連聲稱,“美軍將在未來(lái)幾周內(nèi)通過(guò)臺(tái)灣海峽”,同時(shí)也將在其它區(qū)域展開(kāi)所謂“航行自由行動(dòng)”,以此展示所…

      2022年8月22日
    • 夸克怎么看張津瑜視頻(夸克怎么看張津瑜視頻)

      最近一段時(shí)間張津瑜呂知樾視頻非?;鸨?,不少小伙伴想要看完整版視頻,但是不知道夸克上怎么搜到張津瑜呂知樾視頻,那么夸克怎么看張津瑜視頻?下面小編為大家?guī)?lái)夸克看張津瑜視頻方法步驟介紹…

      2023年3月6日
    • 社會(huì)實(shí)踐活動(dòng)有哪些(社會(huì)實(shí)踐活動(dòng))

      提起社會(huì)實(shí)踐活動(dòng),大家都知道,有人問(wèn)社會(huì)實(shí)踐活動(dòng)有哪些,你知道這是怎么回事?其實(shí)社會(huì)實(shí)踐活動(dòng)有哪些,下面就一起來(lái)看看社會(huì)實(shí)踐活動(dòng),希望能夠幫助到大家! 什么是社會(huì)實(shí)踐活動(dòng) 社會(huì)實(shí)踐…

      2023年4月28日
    • 行程碼摘星的條件是什么 行程碼多久會(huì)記錄到過(guò)某地

      在近期疫情爆發(fā)的時(shí)候,許多地區(qū)受到影響行程碼變?yōu)閹?,如果想要行程碼摘星都需要一些什么樣的條件呢?一般行程碼上的星代表著什么?行程碼在一個(gè)地方停留多久會(huì)有相關(guān)記錄?和小編一起來(lái)詳細(xì)…

      2022年7月26日
    • 什么微波爐好用又實(shí)惠質(zhì)量最好(家庭用什么微波爐比較實(shí)用)

      微波爐,顧名思義,就是用微波做飯。微波爐是一種利用微波爐加熱食物的現(xiàn)代烹飪爐。微波是一種電磁波。微波爐由電源、磁控管、控制電路和烹飪腔組成。電源為磁控管提供大約4000伏的高壓。在…

      2022年4月21日
    • iPhone 14/14 Plus降價(jià)多少

      今天iPhone15系列手機(jī)正式發(fā)布了,按照蘋果慣例,新機(jī)發(fā)布之后,舊機(jī)就會(huì)降價(jià),因此現(xiàn)在不少小伙伴好奇iPhone 14系列是否有降價(jià)?iPhone 14系列降價(jià)多少呢?最新消息…

      2023年9月13日

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息