Google輕量化臉部編輯GAN模型,低端手機也可即時生成高品質輸出

來源:十輪網
作者:十輪網
時間:2023-09-20
2863
Google針對生成對抗網絡(Generative Adversarial Network,GAN)的高運算復雜度提出解決方案,將原本需要在服務器執(zhí)行的臉部編輯模型輕量化,推出可在手機上運行的少樣本臉部風格模型MediaPipe FaceStylizer,提供高品質臉部圖片生成,并且通過MediaPipe平臺公開,讓用戶能夠自訂部署到移動設備上。

mediapipe_facestylizer_on-device_real-time_few-shot_face_stylizatio.jpg

Google針對生成對抗網絡(Generative Adversarial Network,GAN)的高運算復雜度提出解決方案,將原本需要在服務器執(zhí)行的臉部編輯模型輕量化,推出可在手機上運行的少樣本臉部風格模型MediaPipe FaceStylizer,提供高品質臉部圖片生成,并且通過MediaPipe平臺公開,讓用戶能夠自訂部署到移動設備上。

生成對抗網絡是一種深度學習模型,其包含生成器和鑒別器兩部分,生成器負責生成圖像,而鑒別器的任務則是分辨圖像是不是真實的,也就是發(fā)現(xiàn)該圖像是否由生成器所產生。而MediaPipe FaceStylizer針對臉部風格化設計,具有臉部生成器和臉部編碼器兩個主要組件。臉部編碼器的主要功能用于生成對抗網絡反轉(GAN Inversion),將圖像映射到生成器的潛在碼(Latent Code)中。

生成對抗網絡反轉是指用于尋找導致模型輸出的輸入,這個輸入再經過生成對抗網絡的生成器時,會產生特定圖像,換句話說,當存在一張圖片,想要知道生成對抗網絡的生成器中,可以產生該張圖片的潛在碼,這個過程便稱為生成對抗網絡反轉。臉部編碼器便是找出潛在碼的角色,以便臉部生成器可以再次使用該潛在碼,生成相同或是類似的臉部圖像。

除此之外,研究人員為了優(yōu)化生成器,特別設計了一些損失函數,并且結合常用的生成對抗網絡損失函數,借以最小化生成器的錯誤,他們從一個較為復雜的StyleGAN模型,提煉出一個更輕量的生成器BlazeStyleGAN。輕量生成器雖然容量小、執(zhí)行快,但生成的圖片品質仍然很高。下圖研究結果顯示,BlazeStyleGAN生成的圖像品質很好(圖下),而且因為研究人員在損失函數的設計,進一步減少了StyleGAN可能產生的瑕疵和偽影(圖上)。

image229.jpg

從參數數量和計算FLOPs評估模型復雜度,與StyleGAN擁有3,340萬參數相比,BlazeStyleGAN的復雜度大幅降低,在輸出圖片分辨率為256x256的情況下,僅需要約200萬參數和1.28G FLOPs的BlazeStyleGAN模型。當輸出分辨率為1024x1024,BlazeStyleGAN-1024可減少95%運算復雜度,而且輸出圖像品質與StyleGAN-1024模型沒有明顯差異,甚至抑制來自StyleGAN模型的偽影。

研究人員在高性能的設備上,對MediaPipe FaceStylizer的推論時間進行基準測試,BlazeStyleGAN-256和BlazeStyleGAN-512在所有擁有GPU的設備上都能達到即時運算,在更高端手機的執(zhí)行時間甚至不到10毫秒。BlazeStyleGAN-256還可以在iOS設備上以CPU即時生成結果。

Google將會通過MediaPipe平臺,向用戶公開MediaPipe FaceStylizer。BlazeStyleGAN模型經過訓練之后,只需要幾行程序代碼,就能通過MediaPipe Tasks FaceStylizer API部署已導出的TFLite模型到各平臺的應用程序。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
版權說明:本文內容來自于十輪網,本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質服務商推薦
更多
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家