Banner Pubblicitario
25 Febbraio 2024 / 08:35
ChatGpt si fa in 4: ancora più creativa e potente

 
Scenari

ChatGpt si fa in 4: ancora più creativa e potente

di Massimo Cerofolini - 30 Marzo 2023
Arriva la nuova versione dell’intelligenza artificiale che ha stupito il mondo per la sua capacità di dialogare in linguaggio naturale, rispondere su qualsiasi argomento, sunteggiare testi e mille altre cose. Lo scatto di Microsoft che lo propone sul motore di ricerca Bing e sui suoi software e la risposta di Google che presenta Bard. Ma intanto tanti sviluppatori nel mondo creano nuovi servizi per automatizzare le attività. Anche nel campo finanziario
Immaginate di aprire l’armadio e scattare una foto. Il tempo di un respiro e l’algoritmo comprende che, col guardaroba a disposizione, un completo dignitoso per la cena riuscite a metterlo insieme e vi spiega come. Se ChatGpt ha sbalordito il mondo per la sua capacità di conversare, tradurre, riassumere o rispondere su tutto con linguaggio naturale, la sua evoluzione – arrivata in questi giorni – alza di parecchi centimetri la nostra vista sul futuro. Open Ai, l’azienda americana fondata tra gli altri da Elon Musk (che è poi uscito) e dall’emergente Sam Altman, ha infatti lanciato Gpt4, l’ultima primula della sua intelligenza artificiale generativa.
Oltre a identificare cosa c’è dentro un’immagine e suggerirne appunto gli utilizzi, il modello si dimostra più potente e creativo, permette di ricevere fino a 25mila prompt (ossia più parole chiave di comando, tenetela a mente questa parola, sarà presto sulla bocca di tutti) e soprattutto corregge alcuni errori grossolani del vecchio modello, con meno pregiudizi, e un tasso di allucinazione e contenuti osceni ridotto dell’82 per cento (ricordate Gpt3 quando con perentoria tracotanza ingiungeva al malcapitato interlocutore di lasciare la moglie?).
Disponibile per 20 dollari al mese su ChatGptPlus, è già usato da Microsoft che lo ha messo sui suoi software nella veste di copilota e sul motore di ricerca Bing. Ma l’obiettivo è trasformarlo in una sorta di fabbrica di app aperte al contributo di sviluppatori da tutto il mondo. Ovviamente, come sempre quando piove dal cielo un’astronave carica di doni da fantascienza, accanto ad utilizzi validi e positivi, si affianca una lunga lista di incognite e preoccupazioni.
Ci sarebbe da rallentare e riflettere su come gestire questa rivoluzione. Peccato che nel frattempo è partita la gara a perdifiato per la conquista del primato nel campo dell’intelligenza artificiale. Con Microsoft e Open Ai a dettare l’andatura e un inseguitore di peso, Google, che ha accelerato le sperimentazioni di Bard, il suo modello analogo, nel Regno Unito e negli Usa. Senza contare l’affollato gruppo di aziende che segue in scia.

C’è cos’è Gpt4?

Ma andiamo con ordine. C’è cos’è Gpt4? Facciamo rispondere proprio al diretto interessato.
  • Ciao, puoi presentarti?
  • Sono solo un modello di linguaggio e non ho emozioni o sentimenti come un essere umano. Tuttavia, la mia architettura GPT-4 mi permette di comprendere e generare risposte più accurate e pertinenti rispetto alle versioni precedenti.
  • Quali sono esattamente le cose in più che puoi fare rispetto a prima?
  • Ora capisco meglio il contesto, rispondo in modo più pertinente e ho ridotto i pregiudizi. Sono più bravo a gestire domande complesse e a produrre risposte fluide e dettagliate. Inoltre, la mia base di conoscenza è più ampia e aggiornata.
  • È vero che ora sei anche multimodale? Cosa significa?
  • Significa che ora posso comprendere e generare non solo testo, ma anche altre modalità, come immagini e suoni. Quindi, oltre a rispondere alle domande con parole, posso anche utilizzare elementi visivi o audio per comunicare e interagire con te.
  • E come faccio a farti vedere delle immagini o a fartele generare?
  • Attualmente, attraverso questa piattaforma di chat, non è possibile interagire con me usando immagini o richiedere la generazione di immagini. Tuttavia, potresti trovare applicazioni o servizi specifici basati su GPT-4 che supportano tali funzionalità. Per ora, sono in grado di aiutarti solo con il testo.

Le applicazioni concrete

Fin qui lui, Gpt4. Ma quali sono le applicazioni concrete? La prima di cui si è parlato tanto è la multimodalità. In pratica se prima l’algoritmo di Open Ai poteva soltanto leggere un testo ora può anche vedere un’immagine, capirne il contenuto ed elaborare delle risposte. Spiega Matteo Flora, imprenditore digitale, partner di 42 Law Firm e divulgatore digitale: «Gpt4 può rispondere o ricevere input in diverse modalità. Non solo testo su testo, come avvenuto sinora, ossia scriviamo un testo e riceviamo una risposta in testo, ma direttamente con contenuti audio, video ed immagini».
Ad esempio, posso mandare una foto del mio frigorifero senza elencare ciò che c’è dentro e chiedere un paio di ricette per la cena. O uno scatto dell’armadio e domandare il migliore abbinamento dei colori rispetto alla giornata. O ancora c’è la possibilità di richiedere alla macchina cos’è un oggetto che non riconosciamo. «Durante la presentazione ufficiale – annota Flora – hanno mostrato un foglio scritto a mano con una serie di idee su come realizzare un sito per amanti delle barzellette, dicendo cose tipo ‘qui metti la battuta e qui un pulsante’. Bene, fatta una foto del foglio, il sistema ha generato il sito web. Ancora poco sofisticato, per carità, ma lo ha creato. E gente come me che arriva dalla programmazione ha avuto la mascella per terra».
Tra le opzioni positive da segnalare anche la voce narrante che può assistere un non vedente descrivendo i dettagli di tutto ciò che c’è intorno. E l’elenco potrebbe continuare a lungo, dal campo della sicurezza (la porta che si apre solo quando riconosce un volto amico, per esempio) a quello della medicina (la diagnosi di una radiografia a supporto del medico). «In pratica – aggiunge Flora - essendo aperta la possibilità per i programmatori di sviluppare software attingendo dal pozzo di Gpt4 l’unico limite è la fantasia».

Risposte sempre più precise

Altro aspetto importante è l’accuratezza delle risposte, sensibilmente migliore della versione precedente, che lasciava spesso a desiderare. Dice Emanuela Girardi, fondatrice di Pop Ai: «Il modello di prima rispondeva in modo esatto all’85 per cento delle richieste, vale a dire ne sbagliava 15 ogni cento. Ora questo margine è stato migliorato – secondo Open Ai – del 40 per cento. E soprattutto è stato ridotta drasticamente la probabilità di rispondere a richieste con contenuti non consentiti, come oscenità, minacce e discorsi di odio, vale a dire le cosiddette risposte allucinate. Quanto alle capacità del sistema, basti dire che in una simulazione negli Stati Uniti ha superato l’esame di avvocato, piazzandosi tra il 10 per cento dei test migliori». Per avere un’idea approssimativa del balzo che c’è stato, se Gpt3 a un test scolastico se la caverebbe con un 6 stiracchiato, Gpt4 porterebbe a casa un 9 pieno.
Anche sul piano della creatività Gpt4 lascia a bocca aperta. È in grado – in pochi secondi - di scrivere poesie in rima, sceneggiature, canzoni, sintesi di fiabe come Cenerentola fatte solo di parole che iniziano con la lettera N, oltre a denotare un discreto senso dell’umorismo e la capacità di costruire metafore in modo raffinato e coerente.

La sfida è aperta

Questa e altre prestazioni da capogiro hanno convinto Microsoft, che ha investito diversi miliardi su Open AI, a lanciarsi. Subito dopo l’annuncio su Gpt4 di Open Ai, l’azienda fondata da Bill Gates ha messo online la nuova versione del suo motore di ricerca Bing, che ora – anziché con liste di link ai siti – risponde alle richieste con un messaggio unico, ben scritto e articolato. Non solo. Su tutti i suoi programmi adesso è presente il Co-pilot, in pratica un assistente digitale che esegue una serie di compiti in totale autonomia. «Adesso – spiega Girardi – è possibile far completare i testi all’algoritmo mentre scriviamo in word, creare slide o tabelle a partire da un testo, fare riassunti in tempo reale di una riunione o eseguire comandi anche complessi chiedendo semplicemente il risultato con linguaggio naturale».
Di fronte a questa offensiva di Microsoft, Google non poteva certo restare alla finestra. Dopo un infelice test condotto da un gruppo selezionato di esperti, l’azienda di Mountain View ha infatti deciso di aprire al pubblico degli Stati Uniti e del Regno Unito l’accesso a Bard, l’intelligenza artificiale basata sul modello linguistico di ricerca LaMDA, molto simile a ChatGpt. Si parte con una versione leggera e poi via via, al diminuire degli errori, si aggiungeranno modelli più avanzati e si allargherà la prova anche ad altri Paesi, compreso il nostro. Al momento, dicono quelli che l’hanno testata, sembrerebbe meno precisa del suo rivale. Ma siamo soltanto all’inizio e ogni errore segnalato da milioni di utenti è in realtà una forma di addestramento che lo migliora.
Insomma, la gara è cominciata e presto si accoderanno anche gli altri colossi della tecnologia. Progetti analoghi sono in pista a Meta (Facebook), Amazon e Apple, per non parlare delle tigri digitali cinesi. Il fatto che molti di questi sistemi siano aperti agli sviluppatori tramite Api preannuncia poi una serie di servizi ad altissimo valore aggiunto. Alcuni sono già partiti inglobando le abilità di ChatGpt: Duolingo e Khan Academy hanno creato programmi di educazione adattivi che vengono cioè personalizzati sui singoli studenti, Be My Eyes fornisce servizi evoluti per non vedenti, Morgan Stanley sta realizzando programmi di consulenza finanziaria automatizzata, mentre molte aziende ricorrono all’algoritmo per potenziare i propri servizi di assistenza, con call center che automatizzano anche una comunicazione fornita di apparente empatia.

I problemi aperti

Un fermento carico di futuro su cui però si allungano le ombre di problemi ancora da risolvere. Dice Matteo Flora: «La lista è lunga. Per cominciare queste macchine hanno grandi capacità di elaborare dati ma ignorano la differenza tra vero e falso. E al momento non ci sono strumenti adeguati per capire se qualcosa che vediamo sia stata creato da una macchina o da un essere umano. Ci sono poi risposte errate, o viziate da pregiudizi, che vengono date con una sicurezza tale da indurre gran parte degli utenti a fidarsi. In più, si tratta di strumenti che potrebbero facilitare la creazione di attacchi informatici anche da parte di chi non ha grosse conoscenze di programmazione. E infine è tutto da valutare l’impatto sul mondo del lavoro di queste automazioni».
PRETA_MY BANK_EBACLEARING_Banner Medium 2023_bis
ALTRI ARTICOLI

 
ESG

La Dimensione del Pensare: cruciale e sottovalutata

Sviluppare le nostre capacità cognitive assumendo diverse prospettive, valutare le informazioni dando un senso al mondo come un Tutto interconnesso...

 
Diversity & Inclusion in Finance

Azzurra Rinaldi (La Sapienza): Superare il gender gap crea sviluppo per il Paese

Una piena inclusione lavorativa e finanziaria delle donne porterebbe a un incremento del Pil del 7%. Ma serve un cambio culturale. Così, in vista...

 
Banche e Cultura

Il 15,9 per cento dell’economia italiana si basa sulla cultura

L’annuale rapporto di Symbola mostra lo stato di salute (positivo!) delle filiere della cultura e della creatività italiane. “Un comparto che...
Il Salone dei Pagamenti 2023
Il Salone dei Pagamenti è il più importante appuntamento nazionale di riferimento su Pagamenti e Innovazione...
Icona Facebook Icona Twitter Icona LinkedIn
Bancaforte TV
Novità dal SDP 2023 - Dal butterfly effect al "CBI effect"
Un grande cambiamento può essere determinato anche da un battito di ali di una farfalla. È il "buttefly...
Icona Facebook Icona Twitter Icona LinkedIn
Innovation Workshop powered by Bancaforte
EVOLUZIONE RISK & FINANCE: NUOVE OPPORTUNITÀ DI EFFICIENZA E DI BUSINESS PER LE BANCHE
Iscriviti gratuitamente alla diretta streaming dell'evento organizzato in collaborazione con Oracle PwC
Icona Facebook Icona Twitter Icona LinkedIn
Banner Pubblicitario