GPT-4

GPT-4: capacità, limitazioni e applicazioni

  • Pubblicato
  • Aggiornato
  • 5 minuti di lettura

OpenAI, la società di ricerca sull’intelligenza artificiale (AI) dietro ChatGPT e il generatore artistico DALL-E 2, ha svelato l’attesissimo modello GPT-4. Emozionante, l’azienda lo ha anche reso immediatamente disponibile al pubblico attraverso un servizio a pagamento.

GPT-4 è un modello di linguaggio di grandi dimensioni (LLM), una rete neurale addestrata su enormi quantità di dati per comprendere e generare testo. È il successore di GPT-3.5, il modello alla base di ChatGPT.

Il modello GPT-4 introduce una serie di miglioramenti rispetto ai suoi predecessori. Questi includono più creatività, ragionamento più avanzato, prestazioni più elevate in più lingue, la capacità di accettare input visivi e la capacità di gestire significativamente più testo.

Più potente del popolarissimo ChatGPT, GPT-4 è destinato a ispirare un’esplorazione approfondita delle sue capacità e ad accelerare ulteriormente l’adozione dell’IA generativa.

Capacità migliorate

Tra i tanti risultati evidenziati da OpenAI, quello che spicca immediatamente è la performance di GPT-4 su una serie di test standardizzati. Ad esempio, GPT-4 ottiene punteggi tra i primi 10% in un esame di abilitazione statunitense simulato, mentre GPT-3.5 ottiene punteggi nel 10% inferiore.

GPT-4 supera anche GPT-3.5 in una serie di attività di scrittura, ragionamento e codifica.

Un modello di intelligenza artificiale che vede il mondo

Un altro sviluppo significativo è che GPT-4 è multimodale, a differenza dei precedenti modelli GPT. Ciò significa che accetta sia input di testo che di immagini.

I campioni forniti da OpenAI rivelano che GPT-4 è in grado di interpretare le immagini, spiegare l’umorismo visivo e fornire ragionamenti basati su input visivi. Tali abilità vanno oltre lo scopo dei modelli precedenti.

Questa capacità di “vedere” potrebbe fornire a GPT-4 un quadro più completo di come funziona il mondo, proprio come gli esseri umani acquisiscono una conoscenza migliorata attraverso l’osservazione. Si ritiene che questo sia un ingrediente importante per lo sviluppo di un’intelligenza artificiale sofisticata che potrebbe colmare il divario tra i modelli attuali e l’intelligenza a livello umano.

In effetti, GPT-4 non è il primo modello linguistico con queste funzionalità. Qualche settimana fa, Microsoft ha rilasciato Kosmos-1, un modello di linguaggio che accetta input visivi allo stesso modo di GPT-4. Google ha anche recentemente ampliato il suo modello di linguaggio PaLM per essere in grado di acquisire dati di immagini e dati di sensori raccolti dai robot. La multimodalità è una tendenza in crescita nella ricerca sull’IA.

Testi più lunghi

GPT-4 può accettare e generare fino a 25.000 parole di testo, che è molto più del limite di ChatGPT di circa 3.000 parole.

Può gestire richieste più complesse e dettagliate e generare testi più estesi. Ciò consente una narrazione più ricca, un’analisi più approfondita, riassunti di lunghi brani di testo e interazioni conversazionali più profonde.

Limitazioni

Anche se il controverso rapporto tecnico GPT-4 non fornisce dettagli su come è stato sviluppato il modello, tutti i segnali indicano che si tratta essenzialmente di una versione ingrandita di GPT-3.5 con miglioramenti della sicurezza. In altre parole, non è un nuovo paradigma nella ricerca sull’IA.

La stessa OpenAI ha affermato che GPT-4 è soggetto alle stesse limitazioni dei modelli linguistici precedenti, come essere soggetto a errori di ragionamento e pregiudizi e inventare informazioni false.

Detto questo, i risultati di OpenAI su GPT-4 suggeriscono che è almeno più affidabile dei precedenti modelli GPT.

OpenAI ha utilizzato il feedback umano per mettere a punto GPT-4 e produrre output più utili e meno problematici. GPT-4 è molto più efficace nel rifiutare richieste inappropriate ed evitare contenuti dannosi rispetto alla versione iniziale di ChatGPT.

Il suo arrivo continuerà un dibattito cruciale tra i critici. Cioè se sono necessari approcci alternativi per risolvere fondamentalmente i problemi di veridicità e affidabilità, o se gettare più dati e risorse sui modelli linguistici alla fine farà il lavoro.

Si potrebbe sostenere che GPT-4 rappresenta solo un miglioramento incrementale rispetto ai suoi predecessori in molti scenari pratici. I risultati hanno mostrato che i giudici umani preferivano gli output GPT-4 rispetto alla variante più avanzata di GPT-3.5 solo circa il 61% delle volte.

Inoltre non mostra alcun miglioramento rispetto a GPT-3.5 in alcuni test, inclusi gli esami di lingua inglese e di storia dell’arte.

Bing AI

Subito dopo il lancio di GPT-4, Microsoft ha rivelato che il suo controverso chatbot Bing era sempre in esecuzione su GPT-4. L’annuncio ha confermato le speculazioni dei commentatori che hanno notato che era più potente di ChatGPT.

Ciò significa che Bing fornisce un modo alternativo per sfruttare GPT-4, poiché è un motore di ricerca piuttosto che un semplice chatbot.

Tuttavia, come sa chiunque abbia letto le notizie sull’intelligenza artificiale, Bing ha iniziato a impazzire. Ma non credo che seguirà il nuovo ChatGPT poiché sembra essere stato messo a punto pesantemente utilizzando il feedback umano.

Nel suo rapporto tecnico, OpenAI mostra come GPT-4 possa effettivamente andare completamente fuori dai binari senza questa formazione di feedback umano.

Applicazioni commerciali

Un aspetto notevole del rilascio di GPT-4 è stato che, oltre a Bing, è già utilizzato da aziende e organizzazioni come DuolingoKhan AcademyMorgan StanleyStripe e il governo islandese per creare nuovi servizi e strumenti.

La sua implementazione commerciale alimenterà ulteriormente la concorrenza tra i principali laboratori di intelligenza artificiale e alimenterà l’appetito degli investitori per le tecnologie generative.

Autore

Marcel ScharthUniversità di Sydney