在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    這兩天,一段AI修圖視頻在國內外社交媒體上傳瘋了。

    不僅直接躥升B站關鍵詞聯(lián)想搜索第一,視頻播放上百萬,微博推特也是火得一塌糊涂,轉發(fā)者紛紛直呼“PS已死”。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    怎么回事?

    原來,現在P圖真的只需要“輕輕點兩下”,AI就能徹底理解你的想法!

    小到豎起狗子的耳朵:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    大到讓整只狗子蹲下來,甚至讓馬岔開腿“跑跑步”,都只需要設置一個起始點和結束點,外加拽一拽就能搞定:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    不止是動物的調整,連像汽車這樣的“非生物”,也能一鍵拉升底座,甚至升級成“加長豪華車”:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    這還只是AI修圖的“基操”。

    要是想對圖像實現更精準的控制,只需畫個圈給指定區(qū)域“涂白”,就能讓狗子轉個頭看向你:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    或是讓照片中的小姐姐“眨眨眼”:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    甚至是讓獅子張大嘴,連牙齒都不需要作為素材放入,AI自動就能給它“安上”:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    如此“有手就能做”的修圖神器,來自一個MIT、谷歌、馬普所等機構聯(lián)手打造的DragGAN新模型,論文已入選SIGGRAPH2023。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    沒錯,在擴散模型獨領風騷的時代,竟然還能有人把GAN玩出新花樣!

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    目前這個項目在GitHub上已經有5k+ Star,熱度還在不斷上漲中(盡管一行代碼還沒發(fā))。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    所以,DragGAN模型究竟長啥樣?它又如何實現上述“神一般的操作”?

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    拽一拽關鍵點,就能修改圖像細節(jié)

    這個名叫DragGAN的模型,本質上是為各種GAN開發(fā)的一種交互式圖像操作方法。

    論文以StyleGAN2架構為基礎,實現了點點鼠標、拽一拽關鍵點就能P圖的效果。

    具體而言,給定StyleGAN2生成的一張圖像,用戶只需要設置幾個控制點(紅點)和目標點(藍點),以及圈出將要移動的區(qū)域(比如狗轉頭,就圈狗頭)。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    然后模型就將迭代執(zhí)行運動監(jiān)督和點跟蹤這兩個步驟,其中運動監(jiān)督會驅動紅色的控制點向藍色的目標點移動,點跟蹤則用于更新控制點來跟蹤圖像中的被修改對象。

    這個過程一直持續(xù)到控制點到達它們對應的目標點。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    不錯,運動監(jiān)督和點跟蹤就是我們今天要講的重點,它是DragGAN模型中最主要的兩個組件。

    先說運動監(jiān)督。在此之前,業(yè)界還沒有太多關于如何監(jiān)督GAN生成圖像的點運動的研究。

    在這項研究中,作者提出了一種不依賴于任何額外神經網絡的運動監(jiān)督損失(loss)。

    其關鍵思想是,生成器的中間特征具有很強的鑒別能力,因此一個簡單的損失就足以監(jiān)督運動。

    所以,DragGAN的運動監(jiān)督是通過生成器特征圖上的偏移補丁損失(shifted patch loss)來實現的。

    如下圖所示,要移動控制點p到目標點t,就要監(jiān)督p點周圍的一小塊patch(紅圈)向前移動的一小步(藍圈)。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    再看點跟蹤。

    先前的運動監(jiān)督會產生一個新的latent code、一個新特征圖和新圖像。

    由于運動監(jiān)督步驟不容易提供控制點的精確新位置,因此我們的目標是更新每個手柄點p使其跟蹤上對象上的對應點。

    此前,點跟蹤通常通過光流估計模型或粒子視頻方法實現。

    但同樣,這些額外的模型可能會嚴重影響效率,并且在GAN模型中存在偽影的情況下可能使模型遭受累積誤差。

    因此,作者提供了一種新方法,該方法通過最近鄰檢索在相同的特征空間上進行點跟蹤。

    而這主要是因為GAN模型的判別特征可以很好地捕捉到密集對應關系。

    基于這以上兩大組件,DragGAN就能通過精確控制像素的位置,來操縱不同類別的對象完成姿勢、形狀、布局等方面的變形。

    作者表示,由于這些變形都是在GAN學習的圖像流形上進行的,它遵從底層的目標結構,因此面對一些復雜的任務(比如有遮擋),DragGAN也能產生逼真的輸出。

    單張3090幾秒鐘出圖

    所以,要實現幾秒鐘“精準控圖”的效果,是否需要巨大的算力?

    nonono。大部分情況下,每一步拖拽修圖,單張RTX3090GPU在數秒鐘內就能搞定。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    具體到生成圖像的效果上,實際評估(均方誤差MSE、感知損失LPIPS)也超越了一系列類似的“AI修圖”模型,包括RAFT和PIPs等等:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    如果說文字的還不太直觀,具體到視覺效果上就能感受到差異了:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    值得一提的是,DragGAN的“潛力”還不止于此。

    一方面,如果增加關鍵點的數量,還能實現更加精細的AI修圖效果,用在人臉這類對修圖要求比較嚴格的照片上,也是完全沒問題:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    另一方面,不止開頭展示的人物和動物,放在汽車、細胞、風景和天氣等不同類型的圖像上,DragGAN也都能精修搞定。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    除了不同的照片類型,從站到坐、從直立到跑步、從跨站到并腿站立這種姿勢變動較大的圖像,也能通過DragGAN實現:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    也難怪網友會調侃“遠古的PS段子成真”,把大象轉個身這種甲方需求也能實現了。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    不過,也有網友指出了DragGAN目前面臨的一些問題。

    例如,由于它是基于StyleGAN2生成的圖像進行P圖的,而后者訓練成本很高,因此距離真正商業(yè)落地可能還有一段距離。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    除此之外,在論文中提到的“單卡幾秒鐘修圖”的效果,主要還是基于256×256分辨率圖像:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    至于模型是否能擴展到256×256以外圖像,生成的效果又是如何,都還是未知數。

    有網友表示“至少高分辨率圖像從生成時間來看,肯定還要更長”。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    實際上手的效果究竟如何,我們可以等6月論文代碼開源后,一測見真章。

    團隊介紹

    DragGAN的作者一共6位,分別來自馬克斯?普朗克計算機科學研究,薩爾布呂肯視覺計算、交互與AI研究中心,MIT,賓夕法尼亞大學和谷歌AR/VR部門。

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    其中包括兩位華人:

    一作潘新鋼,他本科畢業(yè)于清華大學(2016年),博士畢業(yè)于香港中文大學(2021年),師從湯曉鷗教授。

    現在是馬普計算機科學研究所的博士后,今年6月,他將進入南洋理工大學擔任助理教授(正在招收博士學生)。

    另一位是Liu Lingjie,香港大學博士畢業(yè)(2019年),后在馬普信息學研究所做博士后研究,現在是賓夕法尼亞大學助理教授(也在招學生),領導該校計算機圖形實驗室,也是通用機器人、自動化、傳感與感知 (GRASP)實驗室成員。

    值得一提的是,為了展示DragGAN的可控性,一作還親自上陣,演示了生發(fā)、瘦臉和露齒笑的三連P圖效果:

    讓GAN再次偉大!拽一拽關鍵點就能讓獅子張嘴&大象轉身,湯曉鷗弟子的DragGAN爆火,網友:R.I.P. Photoshop

    是時候給自己的主頁照片“修修圖”了(手動狗頭)。

    論文地址:

    https://vcai.mpi-inf.mpg.de/projects/DragGAN/data/paper.pdf

    項目地址(代碼6月開源):

    https://github.com/XingangPan/DragGAN

    參考鏈接:

    [1]https://weibo.com/1727858283/N1iKl4zVG

    [2]https://twitter.com/_akhaliq/status/1659424744490377217

    [3]https://twitter.com/mrgreen/status/1659482594516377601

    —完—

    鄭重聲明:本文內容及圖片均整理自互聯(lián)網,不代表本站立場,版權歸原作者所有,如有侵權請聯(lián)系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2023年5月22日 12:32
    下一篇 2023年5月22日 12:33

    相關推薦

    • 日本電視劇收視率歷史排名(電視劇收視率歷史排名)

      收視率最高的電視劇排行榜前十名 1、但是《還珠格格》卻是我童年中我最喜歡看的電視劇。每到夏天的時候總會去看,好像如果這個夏天沒有看這個電視劇,夏天好像就沒有到來??梢娺@部電視劇對于…

      2024年1月24日
    • 液壓機械缸鍛造廠家品質好的有哪些值得推薦?

      液壓機是一種以液體為工作介質的重要機械設備,其核心功能是傳遞能量,實現各種工藝流程。除了在鍛壓成形方面的應用,液壓機還廣泛應用于矯正、壓裝、打包、壓塊和壓板等領域。根據工作介質的不…

      2024年1月24日
    • 湖南暴雪已致1萬多人受災

      據@湖南氣象 ,22日7時至23日7時,湘中、湘南出現大到暴雪,長沙(瀏陽)、株洲(醴陵、茶陵)等13個縣市區(qū)出現大暴雪,郴州(北湖區(qū))、株洲(荷塘區(qū))出現特大暴雪;全省23個縣市…

      2024年1月24日
    • 落馬貪官退贓像“割肉”,詢問能不能少交點

      “就像割我身上的肉一般,會讓我痛不欲生?!?24日,中央紀委國家監(jiān)委網站發(fā)布了針對云南省文山州住房和城鄉(xiāng)建設局原黨組成員、副局長李慶明嚴重違紀違法案的剖析。信奉金錢至上的李慶明惜財…

      2024年1月24日
    • 中國gdp排行榜城市(中國gdp排行榜)

      中國各省gdp排名 1、根據查詢國家統(tǒng)計局官網信息顯示,2023年各省排名,廣東:GDP為1243667億。江蘇:GDP為116362億。山東:GDP為83099億。浙江:GDP為…

      2024年1月24日
    • SK-II大中華區(qū)季度銷售額暴跌34%,寶潔:日本核污水排海是主因

      財聯(lián)社1月24日訊(編輯 卞純)全球日用消費品巨頭寶潔公司(ProcterGamble)周二表示,在截至12月底的第二財季,其高端護膚品牌SK-II在大中華區(qū)的銷售額下降了34%,…

      2024年1月24日
    • 呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退

      呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 原標題: 呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 央視網消息:據@呼和浩特白塔國際機場 消息,呼和浩…

      2024年1月24日
    • 退休職工舉報局長被判刑,被舉報人卻提級退休把人看懵了

      文|龍之朱 又見錯抓錯判上了熱搜。 據媒體報道,從2016年3月起,安徽宿州市碭山縣農機局退休職工李平實名向紀檢部門舉報局長王超經濟問題,均石沉大海。 2017年7月,李平夫婦及親…

      2024年1月24日
    • 6寸蛋糕用5斤車厘子店家道歉

      【#6寸蛋糕用5斤車厘子店家道歉#:客服能力不足,多報了2斤車厘子】#遇到商家虛假宣傳你會怎么辦# 近日,有網友發(fā)帖稱做六寸蛋糕需要5斤車厘子引熱議。 1月22日,涉事店家就“6寸…

      2024年1月24日
    • 格蘭芬多院徽簡筆畫(格蘭芬多院徽)

      哈利波特的霍格沃茨學校分別是哪些學院? 1、《哈利波特》電影中的霍格沃茨學院,一共分為四個學院,分別是:格蘭芬多、赫奇帕奇、拉文克勞與斯萊特林。 2、霍格沃茨魔法學院共有格蘭芬多、…

      2024年1月24日

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時間:周一至周五,10:30-18:30,節(jié)假日休息