Vad är Pix2Pix (Bild AI)?

p

Pix2Pix, även känt som ”Bild-till-Bild-överföring med Villkorlig Adversarialna Nätverk”, är en AI-modell utvecklad av forskare vid University of California, Berkeley. Dess huvudsakliga uppgift är att konvertera en bild till en annan bild. Detta görs genom att använda tekniken bakom generativa adversariella nätverk (GAN) där två olika neurala nätverk arbetar i en mot varandra riktad process. Det ena nätverket, som kallas för ”generatorn”, skapar bilder baserat på det data den matas med. Det andra nätverket, ”diskriminatorn”, bedömer och jämför de genererade bilderna med ursprungsmaterialet och ger feedback till generatorn om huruvida de skapade bilderna lyckas efterlikna de ursprungliga bilderna.

Pix2Pix-modellen använder sig av ”parade bilder”, det vill säga, den tränas på par av relaterade bilder, till exempel en svartvit och färgkodad version av samma bild. När Pix2Pix sedan får en ny, obehandlad bild, försöker den utifrån den lärdom den skaffat sig generera en motsvarighet till denna nya bild. Teknikens potential är enorm, då den kan användas inom allt från att förbättra bildkvalitet, konvertera skisser till realistiska bilder, till att transformera satellitbilder till korresponderande kartbilder.

Det som gör Pix2Pix speciellt intressant är dess förmåga att producera relativt realistiska resultat från mycket skissartade och simpla input. Denna utmärkta genereringsförmåga skiljer Pix2Pix från tidigare AI-baserade bildgenereringstekniker. Trots detta så finns det ännu mycket att utforska och utveckla, framför allt när det kommer till att hantera komplexa och detaljerade bilder.

Kommentera

av Mikael Patel