Vad är CycleGAN?

c

CycleGAN är en typ av generativ motståndsmodell som introducerades i en uppsats med titeln “Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks” av Jun-Yan Zhu, Taesung Park, Phillip Isola, och Alexei A. Efros. De grundläggande arbetet kretsar kring begreppet om “obalanserade bild-till-bild-översättningar”, vilket innebär att systemet tar två obalanserade datamängder och översätter varje enskild bild från den ena mängden till den motsvarande bilden i den andra mängden.

Grunderna bakom CycleGAN består av två huvudkomponenter: generatorn och diskriminatorn. Generatorns uppgift är att skapa realistiska bilder, medan diskriminatorns uppgift är att avgöra om en given bild är äkta eller genererad. Diskriminatorens feedback används för att successivt förbättra generatorns prestation.

En av de mest noterbara egenskaperna hos CycleGAN är dess förmåga att lära sig en bildmappning “X till Y” i närvaro av så kallad “cykelkonsistens”. Det innebär att om en bild översätts från en uppsättning till en annan och sedan tillbaka igen, bör slutresultatet vara en identitetstjänst. Detta är vad som skiljer CycleGAN från andra GAN-arkitekturer.

Kommentera