Cos’è l’arte generata da intelligenza artificiale?
I generatori di immagini o di arte AI sono sistemi basati sull’intelligenza artificiale in grado di creare immagini da descrizioni testuali, foto o stili. Queste applicazioni utilizzano algoritmi di apprendimento profondo per generare immagini realistiche, artistiche o fantasiose, in base alle richieste degli utenti.
Dall-E, Midjourney, NightCafe e DreamStudio sono esempi di piattaforme web che sfruttano l’intelligenza artificiale per creare immagini a partire da descrizioni o stili.
- Dall-E: Creato da OpenAI, è noto per generare immagini uniche da descrizioni testuali, interpretando in modo originale le richieste degli utenti.
- Midjourney: Concentrandosi su opere d’arte e design visivi, è utilizzato sia da artisti che da designer per esplorare nuove idee visive.
- Nightcafe: Questa piattaforma utilizza l’IA per generare arte e immagini, offrendo diverse opzioni per la creazione di opere d’arte digitali basate su descrizioni o ispirazioni.
- DreamStudio: Simile agli altri strumenti, utilizza algoritmi di intelligenza artificiale per generare immagini e opere d’arte basate sulle descrizioni degli utenti. Accessibile anche a chi non ha esperienze di grafica o design, permette la creazione di immagini complesse senza competenze tecniche particolari.
Cos’è un Prompt per i Generatori di Arte AI?
Per ottimizzare le capacità dei generatori di arte AI, è essenziale fornire loro un input accurato, composto da parole chiave selezionate attentamente. Questo input è comunemente noto come “prompt” – un testo redatto in linguaggio naturale che contiene istruzioni per il sistema di intelligenza artificiale.
Un prompt efficace dovrebbe comprendere le seguenti informazioni:
- Soggetto: Specifica al sistema la scena da creare, includendo il soggetto, l’azione, la posizione e il contesto.
- Caratteristiche: Fornisce dettagli supplementari sul soggetto, come aggettivi (meraviglioso, affascinante) e ulteriori descrizioni del contesto.
- Tema: Suggerisce il genere dell’immagine, potrebbe essere il nome di un artista (come Picasso) o un tema personalizzato come fantasy, dettagliato, moderno o contemporaneo.
- Motore grafico: Stabilisce il tipo di tecnologia grafica per rendere l’immagine più realistica, con parole chiave come unreal engine, 3D rendering e octane render.
- Qualità: Definisce la qualità dell’immagine, ad esempio, 4K, 8K o HD.
Sebbene i vari generatori AI possano produrre risultati diversi, la struttura dei prompt segue in generale questi stessi principi.
La lunghezza del prompt
La lunghezza del prompt è flessibile, ma generalmente si consiglia di utilizzare almeno 3-7 parole per ottenere immagini dettagliate e meno astratte. Ciò è dovuto al fatto che l’IA generativa si basa su immagini di riferimento trovate su internet, e l’uso di più parole tende a restringere il campo di ricerca.
Naturalmente, non è obbligatorio seguire rigidamente questa indicazione. Tuttavia, se si desidera ottenere un’immagine più complessa e ricca di dettagli, un prompt composto da 3-7 parole può essere una scelta efficace. Un prompt più descrittivo tende a migliorare la comprensione dell’IA generativa riguardo a ciò che si intende ottenere.
Il soggetto del prompt
Nel processo creativo dell’IA generativa, il soggetto del prompt svolge un ruolo centrale, simile a quanto accade per gli artisti umani. Il soggetto rappresenta il protagonista dell’immagine e può variare, includendo persone, oggetti o luoghi. È anche possibile utilizzare più di un soggetto all’interno del prompt.
Il soggetto dovrebbe essere delineato attraverso l’uso di sostantivi, come ad esempio: donna, bicicletta, deserto, fragola, uomo, lattina. Se si desidera ottenere un’immagine più specifica e personalizzata, è consigliabile arricchire il prompt aggiungendo descrittori pertinenti al soggetto.
I descrittori del prompt
L’introduzione di descrittori al prompt è fondamentale per fornire informazioni aggiuntive al sistema di IA generativa, consentendo la creazione di immagini più aderenti alle aspettative dell’utente. I descrittori possono essere verbi o aggettivi che rispondono a domande come cosa sta succedendo, cosa sta facendo il soggetto, come sta facendo il soggetto, cosa c’è intorno al soggetto, e che aspetto ha il soggetto.
Ad esempio, se il prompt di base è “cane Jack Russell che legge”, l’immagine risultante sarà semplice e diretta. Tuttavia, l’aggiunta di descrittori come “cane Jack Russell che legge un libro in una biblioteca” renderà l’immagine più complessa e dettagliata.
Si consiglia di sperimentare con diversi descrittori per osservare come influiscono sui risultati. L’uso e il numero dei descrittori dipendono dalle preferenze e dalle esigenze personali. Ad esempio, per un’immagine semplice di un colibrì, il prompt potrebbe essere “colibrì”, mentre per un’immagine più elaborata e originale, si potrebbero aggiungere descrittori come “colibrì che beve il nettare da un fiore esotico”. L’esplorazione di varie combinazioni di descrittori consente di ottenere risultati diversificati e personalizzati.
L’aspetto finale dell’immagine
L’aspetto finale del prompt è cruciale per definire lo stile, la prospettiva e l’estetica dell’immagine generata. Questa sezione del prompt utilizza parole o frasi chiave per indicare specifiche sulla composizione visiva, come ad esempio “foto”, “pittura a olio” o “scultura 3D”. Inoltre, è possibile utilizzare termini come “close up”, “wide shot” o “portrait” per specificare il tipo di inquadratura desiderata.
Per personalizzare ulteriormente l’immagine, è possibile incorporare uno stile artistico specifico e menzionare artisti particolari di cui si desidera che l’IA generativa si ispiri. Ad esempio, si può richiedere la creazione di un dipinto impressionista nello stile di Vincent Van Gogh raffigurante una Batmobile bloccata nel traffico di Los Angeles. Questa fase del prompt consente di affinare ulteriormente l’aspetto e l’impatto visivo dell’immagine generata.
Come usare ChatGPT per creare prompt per i generatori di immagine/arte AI
Per sfruttare appieno le potenzialità dei generatori di immagini/arte AI, è possibile arricchire e dettagliare ulteriormente un prompt utilizzando ChatGPT. Ad esempio, partendo dal prompt di base “Un bellissimo villaggio natalizio, coperto di neve, moderno, unreal engine, 8K”, si può coinvolgere ChatGPT per ottenere suggerimenti più ricchi di dettagli.
Ecco un esempio di come ChatGPT potrebbe arricchire il prompt: “Un villaggio di Natale incantevole, che sembra uscito da una favola. Ghirlande verdi e rosse adornano le strade innevate, avvolgendo gli edifici colorati e scintillanti. Ogni casa è decorata con cura, trasmettendo un’atmosfera affascinante e festosa. Le luci scintillanti creano un effetto magico. Potresti suggerirmi ulteriori aggettivi e descrizioni per le decorazioni delle case, delle strade, delle piazze e degli alberi? Sto cercando di rendere l’immagine iperrealistica e affascinante, realizzata con Unreal Engine 5 e con una risoluzione di 8K.”
In questo modo, ChatGPT contribuisce a espandere il prompt, aggiungendo dettagli e arricchendo la descrizione del villaggio natalizio.