In questo articolo spiegheremo come creare un semplice Modello AI con PyTorch, un framework open-source…

Cos’è un Modello di intelligenza artificiale?
In questo articolo spiegheremo cos’è un Modello di intelligenza artificiale, utilizzando un linguaggio semplice e senza scendere in dettagli tecnici. Se invece siete interessati a vedere come si crea e come funziona un Modello a livello tecnico (cioè di codice di programmazione), leggete l’articolo Esempio pratico di un semplice Modello AI.
Il prerequisito per la comprensione di questo articolo è la conoscenza di base dell’intelligenza artificiale, se non l’avete, potete leggere l’articolo Cos’è l’Intelligenza Artificiale? Una Guida per Principianti.
Nell’intelligenza artificiale (IA), un Modello, è il cuore del sistema di apprendimento automatico, è ciò che “pensa”. È l’entità matematica/computazionale che apprende dai dati e generalizza su nuovi dati per fare previsioni, classificazioni o altre operazioni intelligenti.
Possiamo riassumere il suo ruolo nei seguenti punti:
- rappresentare la conoscenza appresa dai dati: Il modello impara dai dati di addestramento a riconoscere schemi, relazioni o regole. Es.: un modello di visione artificiale può imparare a riconoscere gatti dalle immagini;
- generalizzare a nuovi dati: dopo l’addestramento, il modello dovrebbe essere in grado di applicare ciò che ha imparato a dati mai visti prima. Es.: riconoscere correttamente un gatto in una nuova foto;
- fornire output a partire da input: dato un input (es. un testo, un’immagine, un suono), il modello restituisce un output (es. una traduzione, una previsione, una classificazione);
- ottimizzare le prestazioni attraverso l’addestramento: il modello migliora nel tempo durante l’addestramento, minimizzando l’errore su un insieme di dati. Questo processo avviene tipicamente tramite algoritmi di ottimizzazione come la discesa del gradiente.
Alcuni esempi di Modelli
Di seguito trovare alcuni dei principali Modelli di linguaggio attualmente disponibili:
- GPT-4 – di OpenAI, utilizzabile su chatgpt.com per conversazioni e assistenza generale;
- Claude – di Anthropic, disponibile su claude.ai per conversazioni, analisi e supporto creativo;
- Gemini – di Google, accessibile tramite Bard/Gemini per ricerche integrate e assistenza;
- LLaMA 2 – di Meta, modello open-source utilizzato da sviluppatori per varie applicazioni;
- PaLM – di Google, utilizzato principalmente per ricerca e applicazioni enterprise di Google;
- Mistral – di Mistral AI, modello europeo open-source per sviluppatori e aziende.
Ogni modello ha caratteristiche diverse in termini di capacità, accessibilità e casi d’uso specifici. Alcuni sono più orientati al pubblico generale, altri verso sviluppatori o applicazioni aziendali.
Se volete saperne di più sui Modelli AI oggi disponibili leggete l’articolo I 20 Modelli di Intelligenza Artificiale più utilizzati nel 2025.
Che cos’è un Modello a livello informatico?
Prima di tutto diciamo cosa non è: un Modello AI non contiene le informazioni sul contenuto delle risposte che vi offre, non è un database o una tabella SQL o un semplice file di testo.
A livello informatico, un modello di intelligenza artificiale è solitamente rappresentato da uno o più file che contengono i parametri appresi, la struttura del modello e, talvolta, le informazioni per il caricamento o l’esecuzione del modello stesso.
In termini pratici, un modello può essere:
1. Un file binario o una serie di file
In questo caso i sui contenuti, formato e dimensione potrebbero essere i seguenti:
- contenuto: parametri (pesi e bias), architettura (reti neurali, trasformatori, ecc.), a volte metadati;
- formato: il formato del file dipende dalla libreria usata, ad esempio: TensorFlow: .pb (protobuf), .ckpt (checkpoint), PyTorch: .pt o .pth, ONNX (formato portabile): .onnx;
- dimensione: da pochi KB a decine (o centinaia) di GB nei modelli grandi.
2. Una struttura di dati in memoria
- Durante l’uso, il file del modello viene caricato in RAM o GPU e rappresentato come una struttura dati (oggetti, tensori, grafi computazionali).
- In Python, ad esempio, è spesso un oggetto della classe torch.nn.Module (PyTorch) o un tf.keras.Model (TensorFlow).
3. Un grafo computazionale
- Alcuni framework (come TensorFlow) rappresentano il modello come un grafo di operazioni matematiche, utile per ottimizzazioni e parallelizzazione.
In questa tabella trovate una sintesi di cosa è, a livello informatico, un Modello di intelligenza artificiale:
Aspetto | Descrizione |
---|---|
Tipo di oggetto | File binario, struttura dati in memoria |
Contenuto | Parametri appresi + architettura (a volte) |
Formato | .pt , .pb , .onnx , ecc. |
Uso | Viene caricato, eseguito e aggiornato da codice Python, C++, ecc. |
Non è | Un database, tabella SQL o un semplice file di testo |
Volete vedere un esempio pratico di come creare un semplice Modello AI in PyTorch?
Leggete questo articolo: Esempio pratico di un semplice Modello AI.