Der er sket noget stort i AI-land – og denne gang handler det ikke om at skrive stil eller kode, men om at lave billeder, der faktisk ligner… ja, noget. OpenAI har netop opgraderet ChatGPT med en ny billedmotor baseret på den spritnye GPT-4o-model, og resultatet er mildest talt imponerende.
Tidligere har det været lidt af en kunstart at få ChatGPT (og DALL·E) til at generere noget, der ikke lignede et Photoshop-eksperiment fra 2003. Men nu er der kommet styr på perspektiver, hænder og – trommehvirvel – tekst. Jep, hvis du beder AI’en om at lave en enhjørning, der læser Børsen , så vil forsiden faktisk være læsbar og ikke bare noget sludder med russiske bogstaver og tilfældige symboler.
Skabt i ChatGPT med prompten: „Lav en enhjørning, der læser Børsen „. Det hele sker direkte i ChatGPT, hvor du nu kan både generere og redigere billeder med et par klik. Du kan ændre baggrunde, manipulere objekter og tilpasse detaljer, som var du en digital Picasso – bare uden de svedige timers arbejde i Photoshop.
Opgraderingen har i øvrigt også pustet liv i internettets favoritdisciplin: memes. Takket være GPT-4o’s forbedrede billedforståelse og stilsikre pensel, bliver X (tidl. Twitter), Reddit og Instagram i disse dage oversvømmet af AI-genererede memes i Ghibli-stil – altså med den karakteristiske, bløde æstetik, der minder om japanske animationsfilm fra Studio Ghibli. Forestil dig Elon Musk som Totoro i rummet. Jep, det er der allerede nogen, der har gjort.
Jeg bad ChatGPT lave en infografik der viser, hvad GPT-4o kan bruges til. Faktisk er det hele blevet så populært, at OpenAI har måttet skrue ned for antallet af billedforespørgsler, fordi deres servere var ved at smelte – ifølge CEO Sam Altman, bogstaveligt talt.
Så hvis du har drømt om at visualisere din mærkeligste tanke – en kat i rumdragt, der spiller guitar på Månen? – så er det nu, du skal i gang. ChatGPT er ikke længere kun en tekstbaseret hjerne, men også en fuldblods kunstner med pixels på paletten.
Jeg kan varmt anbefale videoen nedenfor, der gennemgår 15 forskellige eksempler på, hvad de nye funktioner kan bruges til – og hvordan man gør.
Videoen er på engelsk.