ChatGPT/Intelligenza Artificiale: ma cosa e’ che tutti ne parlano 2

veniamo da qui: chatgpt/AI ma cosa è che tutti ne parlano/


12/04/24 NYTimes: Ezra Klein intervista Dario Amodei

E se Dario Amodei avesse ragione sull’IA?

Il co-fondatore e C.E.O. di Anthropic spiega perché pensa che l’intelligenza artificiale sia su una “curva esponenziale”.

La cosa davvero disorientante di parlare con le persone che costruiscono l’IA è il loro senso del tempo alterato. Sei seduto lì a discutere di un mondo che sembra strano fantascienza di cui parlare, e poi chiedi, beh, quando pensi che questo accadrà? E dicono, non lo so – due anni.

Dietro queste previsioni ci sono quelle che vengono chiamate le leggi di ridimensionamento. E le leggi di ridimensionamento – e voglio dirlo così chiaramente – non sono leggi. Sono osservazioni. Sono previsioni. Si basano su pochi anni, non su poche centinaia di anni o 1.000 anni di dati.

Ma quello che dicono è che più potenza e dati informatici si alimentano nei sistemi di IA, più potenti diventano quei sistemi – che la relazione è prevedibile, e più, che la relazione è esponenziale.

Gli esseri umani hanno difficoltà a pensare in modo esponenziale. Ripensa al Covid, quando tutti dovevamo farlo. Se hai un caso di coronavirus e i casi raddoppiano ogni tre giorni, allora dopo 30 giorni, hai circa 1.000 casi. Quel tasso di crescita sembra modesto. È gestibile. Ma poi vai 30 giorni in più, e ne hai un milione. Poi aspetti altri 30 giorni. Ora hai un miliardo. Questa è la potenza della curva esponenziale. La crescita sembra normale per un po’. Poi sfugge al controllo davvero, molto rapidamente.

Quello che dicono gli sviluppatori di A.I. è che la potenza dei sistemi A.I. è su questo tipo di curva, che è aumentata esponenzialmente, le loro capacità e che finché continueremo a nutrire più dati e più potenza di calcolo, continuerà ad aumentare esponenzialmente. Questa è l’ipotesi della legge di ridimensionamento, e uno dei suoi principali sostenitori è Dario Amodei. Amodei ha guidato il team di OpenAI che ha creato GPT-2, che ha creato GPT-3. Ha poi lasciato OpenAI per co-fondare Anthropic, un’altra azienda di intelligenza artificiale, dove ora è il C.E.O. E Anthropic ha recentemente rilasciato Claude 3, che è considerato da molti il modello di intelligenza artificiale più forte disponibile in questo momento.

Ma Amodei crede che siamo appena iniziati, che stiamo solo colpendo la parte ripida della curva ora. Pensa che i tipi di sistemi che abbiamo immaginato in sci-fi, non arriveranno tra 20 o 40 anni, non tra 10 o 15 anni, arriveranno tra due o cinque anni. Pensa che saranno così potenti che lui e le persone come lui non dovrebbero essere fidate per decidere cosa faranno.

Così gli ho chiesto in questo spettacolo di cercare di rispondere nella mia testa a due domande. Prima di tutto, ha ragione? In secondo luogo, e se avesse ragione? Voglio dire che in passato abbiamo fatto spettacoli con Sam Altman, il capo di OpenAI, e Demis Hassabis, il capo di Google DeepMind. E vale la pena ascoltare quei due se lo trovi interessante.

Inseriremo i link a loro nelle note dello spettacolo perché confrontare e contrastare il modo in cui parlano delle curve dell’IA qui, come pensano alla politica – ne sentirai molto parlare nell’episodio di Sam Altman – ti dà una sorta di senso di ciò che pensano le persone che costruiscono queste cose e di come forse differiscono l’una dall’altra.

Come sempre, la mia email per pensieri, per feedback, per suggerimenti degli ospiti – ezrakleinshow@nytimes.com.

Dario Amodei, benvenuto allo spettacolo.

Dario Amodei Grazie per avermi invito.

Ezra Klein Quindi ci sono questi due ritmi molto diversi a cui ho pensato con A.I. Uno è la curva della tecnologia stessa, quanto velocemente sta cambiando e migliorando. E l’altro è il ritmo con cui la società sta vedendo e reagendo a quei cambiamenti. Come ti è sembrata quella relazione?

Dario Amodei Quindi penso che questo sia un esempio di un fenomeno che potremmo aver visto un paio di volte nella storia, che è che c’è un processo sottostante che è fluido, e in questo caso, esponenziale. E poi c’è una fuoriuscita di quel processo nella sfera pubblica. E il rovesciamento sembra molto appuntito. Sembra che stia accadendo all’improvviso. Sembra che venga fuori dal nulla. Ed è innescato da cose che colpiscono vari punti critici o solo il pubblico è stato impegnato in un certo momento.

Quindi penso che il modo più semplice per me per descriverlo in termini di mia esperienza personale sia – quindi ho lavorato in OpenAI per cinque anni, sono stato uno dei primi dipendenti a unirsi. E hanno costruito un modello nel 2018 chiamato GPT-1, che usava qualcosa come 100.000 volte meno potenza computazionale rispetto ai modelli che costruiamo oggi.

L’ho guardato, e io e i miei colleghi siamo stati tra i primi a eseguire quelle che vengono chiamate leggi di ridimensionamento, che è fondamentalmente studiare cosa succede mentre si varia le dimensioni del modello, la sua capacità di assorbire le informazioni e la quantità di dati che si alimentano in esso. E abbiamo trovato questi modelli molto lisci. E avevamo questa proiezione che, guarda, se spendi 100 milioni di dollari o 1 miliardo di dollari o 10 miliardi di dollari per questi modelli, invece dei 10.000 dollari che stavamo spendendo allora, proiezioni che tutte queste cose meravigliose sarebbero successe, e immaginavamo che avrebbero avuto un enorme valore economico.

Avanti veloce fino al 2020 circa. Il GPT-3 era appena uscito. Non era ancora disponibile come chat bot. Ho guidato lo sviluppo di questo insieme alla squadra che alla fine se n’è andata per unirsi ad Anthropic. E forse per l’intero periodo del 2021 e del 2022, anche se abbiamo continuato ad addestrare modelli che erano sempre migliori, e OpenAI ha continuato ad addestrare i modelli, e Google ha continuato ad addestrare i modelli, c’era sorprendentemente poca attenzione pubblica ai modelli.

E l’ho guardato, e ho detto, beh, questi modelli sono incredibili. Stanno migliorando sempre di più. Che succede? Perché non succede questo? Potrebbe essere un caso in cui avevo ragione sulla tecnologia, ma sbagliato sull’impatto economico, sul valore pratico della tecnologia? E poi, all’improvviso, quando è uscito ChatGPT, è stato come tutta quella crescita che ti aspetteresti, tutta quell’eccitazione in tre anni, ha fatto irruzione e si è precipitato.

Ezra Klein Quindi voglio soffermarmi su questa differenza tra la curva in cui la tecnologia sta migliorando e il modo in cui viene adottata dalla società. Quindi, quando pensi a questi punti di interruzione e pensi al futuro, quali altri punti di interruzione vedi arrivare dove l’IA irrompe nella coscienza sociale o usata in un modo diverso?

Dario Amodei Sì, quindi penso che dovrei dire prima che è molto difficile prevederli. Una cosa che mi piace dire è la tecnologia sottostante, perché è un’esponenziale liscia, non è perfettamente prevedibile, ma in qualche modo, può essere stranamente preternaturalmente prevedibile, giusto? Questo non è affatto vero per queste funzioni di passo sociale. È molto difficile prevedere cosa prenderà piede. In un certo senso, sembra un po’ quale artista o musicista prenderà piede e arrirà in cima alle classifiche.

Detto questo, alcune idee possibili. Penso che uno sia legato a qualcosa che hai menzionato, che è interagire con i modelli in un modo più naturalistico. In realtà ne abbiamo già visto alcuni con Claude 3, dove la gente sente che alcuni degli altri modelli sembrano un robot e che parlare con Claude 3 è più naturale.

Penso che una cosa legata a questo sia che molte aziende sono state trattenute o inciampate dal modo in cui i loro modelli gestiscono argomenti controversi.

E siamo stati davvero in grado, credo, di fare un lavoro migliore di altri nel raccontare il modello, non rifuggire dal discutere argomenti controversi. Non dare per scontato che entrambe le parti abbiano necessariamente un punto valido, ma non esprimere tu stesso un’opinione. Non esprimere opinioni palesemente di parte. Come giornalisti, lo incontri sempre, giusto? Come faccio ad essere obiettivo, ma non da entrambe le parti su tutto?

Quindi penso che andare oltre in quella direzione di modelli che hanno personalità pur essendo obiettivi, pur essendo ancora utili e non cadendo in varie trappole etiche, che sarà, penso, uno sblocco significativo per l’adozione. I modelli che intraprendono azioni nel mondo saranno grandi. So che praticamente tutte le grandi aziende che lavorano sull’IA stanno lavorando su questo.

Invece di solo, gli faccio una domanda e risponde, e poi forse seguo e risponde di nuovo, posso parlare con la modella di, oh, andrò in questo viaggio oggi, e la modella dice, oh, è fantastico. Ti prenderò un Uber per guidare da qui a lì, e prenoterò un ristorante. E parlerò con le altre persone che pianificheranno il viaggio. E il modello essere in grado di fare le cose end-to-end o andare su siti web o intraprendere azioni sul tuo computer per te.

Penso che tutto questo arriverà nel prossimo, direi – non lo so – da tre a 18 mesi, con livelli crescenti di abilità. Penso che questo cambierà il modo in cui la gente pensa all’IA, giusto, dove finora, è stato così passivo – è come, vado all’Oracolo. Io gli faccio una domanda, e l’Oracolo mi dice delle cose. E alcune persone pensano che sia eccitante, alcune persone pensano che sia spaventoso. Ma penso che ci siano limiti a quanto eccitante o spaventoso sia percepito come perché è contenuto all’interno di questa scatola.

Ezra Klein Voglio sedermi con questa domanda dell’A.I. agente perché penso che questo sia quello che sta arrivando. È chiaramente ciò che le persone stanno cercando di costruire. E penso che potrebbe essere un buon modo per guardare alcune delle sfide tecnologiche e culturali specifiche. E quindi, permettetemi di offrirne due versioni.

Le persone che stanno seguendo le notizie sull’IA potrebbero aver sentito parlare di Devin, che non è ancora in uscita, ma è un’IA che almeno pretende di essere in grado di completare il tipo di compiti, compiti collegati, che un ingegnere del software junior potrebbe completare, giusto? Invece di chiedere di fare un po’ di codice per te, dici, ascolta, voglio un sito web. Doverà fare queste cose, lavorare in questi modi. E forse Devin, se funziona nel modo in cui la gente dice che funziona, può effettivamente tenere quella serie di pensieri, completare una serie di compiti diversi e tornare da te con un risultato. Sono anche interessato alla versione di questo che potresti avere nel mondo reale. L’esempio che uso sempre nella mia testa è, quando posso dire a un A.I., mio figlio compie cinque anni. Ama i draghi. Viviamo a Brooklyn. Dammi alcune opzioni per pianificare la sua festa di compleanno. E poi, quando scelgo tra loro, puoi fare tutto per me? Ordina la torta, prenota la stanza, invia gli inviti, qualunque cosa sia.

Queste sono due situazioni diverse perché una di esse è in codice, e una di esse è prendere decisioni nel mondo reale, interagire con persone reali, sapendo se ciò che sta trovando sui siti web è effettivamente buono. Cosa c’è tra qui e là? Quando te lo dico in un linguaggio semplice, quali sfide o progressi tecnologici senti che devono accadere per arrivarci?

Dario Amodei La risposta breve non è così tanto. Una storia che ho da quando stavamo sviluppando modelli nel 2022 – e questo è prima che collegassimo i modelli a qualsiasi cosa – è che potresti avere una conversazione con questi modelli puramente testuali in cui potresti dire, ehi, voglio prenotare la cena al ristorante X a San Francisco, e il modello direbbe, OK, ecco il sito web del ristorante X. E in realtà ti darebbe un sito web corretto o ti direbbe di andare a Open Table o qualcosa del genere.

E, naturalmente, non può effettivamente andare sul sito web. La spina di alimentazione non è effettivamente collegata, giusto? Il cervello del robot non è in realtà attaccato alle sue braccia e alle sue gambe. Ma ti ha dato questa sensazione che il cervello, tutto quello che doveva fare era imparare esattamente come usare le braccia e le gambe, giusto? Aveva già un’immagine del mondo e dove avrebbe camminato e cosa avrebbe fatto. E così, sembrava che ci fosse questa barriera molto sottile tra i modelli passivi che avevamo e che effettivamente recitavano nel mondo.

In termini di ciò di cui abbiamo bisogno per farlo funzionare, una cosa è, letteralmente, abbiamo solo bisogno di un po’ più di scala. E penso che la ragione per cui avremo bisogno di più scala è – fare una di quelle cose che hai descritto, fare tutte le cose che fa un ingegnere del software junior, comportano catene di lunghe azioni, giusto? Devo scrivere questa riga di codice. Devo eseguire questo test. Devo scrivere un nuovo test. Devo controllare come appare nell’app dopo averlo interpretato o compilato. E queste cose possono facilmente raggiungere 20 o 30 strati di profondità. E lo stesso con la pianificazione della festa di compleanno per tuo figlio, giusto?

E se l’accuratezza di un dato passo non è molto alta, non è come il 99,9 per cento, mentre si compongono questi passaggi, la probabilità di commettere un errore diventa se stessa molto alta. Quindi l’industria otterrà una nuova generazione di modelli ogni probabilmente quattro-otto mesi. E così, la mia ipotesi – non ne sono sicuro – è che per far funzionare davvero bene queste cose, abbiamo bisogno forse di altre una o quattro generazioni. Quindi finisce per tradursi da 3 a 24 mesi o qualcosa del genere.

Penso che il secondo sia solo, c’è un po’ di lavoro algoritmico che dovrà essere fatto su come far interagire i modelli con il mondo in questo modo. Penso che le tecniche di base che abbiamo, un metodo chiamato apprendimento di rinforzo e le sue variazioni, siano probabilmente all’altezza del compito, ma capire esattamente come usarlo per ottenere i risultati che vogliamo richiederà probabilmente del tempo.

E poi terzo, penso – e questo arriva a qualcosa in cui Anthropic è davvero specializzato – sia la sicurezza e la controllabilità. E penso che sarà un grosso problema per queste modelle che agiscono nel mondo, giusto? Diciamo che questo modello sta scrivendo codice per me, e introduce un grave bug di sicurezza nel codice, o sta intraprendendo azioni sul computer per me e modificando lo stato del mio computer in modi che sono troppo complicati per me per capire.

E per pianificare la festa di compleanno, giusto, il livello di fiducia dovresti prendere un agente A.I. e dire, mi va bene che tu chiami chiunque, dica loro qualsiasi cosa che sia in qualsiasi informazione privata che potrei avere, inviando loro qualsiasi informazione, intraprendendo qualsiasi azione sul mio computer, pubblichi qualsiasi cosa su Internet, la versione più non vincolata di questo sembra molto spaventosa. E così, dovremo capire cosa è sicuro e controllabile.

Più la cosa è aperta, più è potente, ma anche, più è pericolosa e più è difficile da controllare.

Quindi penso che queste domande, anche se sembrano elevate e astratte, si trasformeranno in domande pratiche sui prodotti che noi e altre aziende cercheremo di affrontare.

Ezra Klein Quando dici che avremo solo bisogno di più scala, intendi più calcolo e più dati di allenamento, e immagino, forse più soldi per rendere semplicemente i modelli più intelligenti e più capaci?

Dario Amodei Sì, doveremo fare modelli più grandi che utilizzino più calcolo per iterazione. Doveremo eseguirli più a lungo inserendo loro più dati. E quel numero di chip volte la quantità di tempo in cui gestiamo le cose sui chip è essenzialmente un valore in dollari perché questi chip lo sono – li affitti a ore. Questo è il modello più comune per questo. E così, i modelli di oggi costano 100 milioni di dollari per allenarsi, più o meno il fattore due o tre.

I modelli che sono in formazione ora e che usciranno in vari momenti entro la fine dell’anno o all’inizio del prossimo anno sono più vicini al costo di 1 miliardo di dollari. Quindi sta già accadendo. E poi penso che nel 2025 e nel 2026, otterremo di più verso 5 o 10 miliardi di dollari.

Ezra Klein Quindi ci stiamo muovendo molto rapidamente verso un mondo in cui gli unici giocatori che possono permettersi di farlo sono le corporazioni giganti, le aziende collegate a società giganti: tutti voi state ricevendo miliardi di dollari da Amazon. OpenAI sta ricevendo miliardi di dollari da Microsoft. Google ovviamente fa il suo.

Puoi immaginare i governi, anche se non so di troppi governi che lo fanno direttamente, anche se alcuni, come i sauditi, stanno creando grandi fondi per investire nello spazio. Quando stiamo parlando del modello che costerà quasi 1 miliardo di dollari, allora immagini un anno o due da quello, se vedi lo stesso aumento, sarebbe di circa 10 miliardi di dollari. Allora saranno 100 miliardi di dollari? Voglio dire, molto rapidamente, l’artiglieria finanziaria di cui hai bisogno per creare uno di questi farà murare chiunque tranne i più grandi giocatori.

Dario Amodei In pratica sono d’accordo con te. Penso che sia la cosa intellettualmente onesta dire che costruire i modelli grandi e su larga scala, l’ingegneria del modello di fondazione di base, sta diventando sempre più costoso. E chiunque voglia costruirne uno dovrà trovare un modo per finanziarlo. E hai nominato la maggior parte dei modi, giusto? Puoi essere una grande azienda. Puoi avere una sorta di partnership di vario tipo con una grande azienda. O i governi sarebbero l’altra fonte.

Penso che un modo in cui non è corretto sia che avremo sempre un fiorente ecosistema di sperimentazione su piccoli modelli. Ad esempio, la comunità open source che lavora per creare modelli il più piccoli ed efficienti possibile ottimizzati per un particolare caso d’uso. E anche l’uso a valle dei modelli. Voglio dire, c’è un ecosistema fiorente di startup che non hanno bisogno di addestrare questi modelli da zero. Hanno solo bisogno di consumarli e magari modificarli un po’.

Ezra Klein Ora, voglio fare una domanda su cosa c’è di diverso tra il modello di codifica agente e il piano del modello di compleanno dei bambini, per non parlare di fare qualcosa per conto del mio modello di business. E una delle domande che mi vengono in mente qui è una ragione per cui compro che l’IA può diventare funzionalmente sovrumana nella codifica è che ci sono molti modi per ottenere un feedback rapido nella codifica. Il tuo codice deve essere compilato. Puoi eseguire il controllo dei bug. Puoi effettivamente vedere se la cosa funziona.

Mentre il modo più veloce per me di sapere che sto per ottenere una risposta di merda da ChatGPT 4 è quando inizia a cercare Bing, perché quando inizia a cercare Bing, è molto chiaro per me che non sa come distinguere tra ciò che è di alta qualità su Internet e ciò che non lo è. Ad essere onesti, a questo punto, non mi sembra nemmeno che Google Search stesso sia così bravo a distinguerlo.

Quindi la domanda di quanto possano essere bravi i modelli nel mondo in cui è un dilemma molto vasto e sfocato sapere qual è la risposta giusta su qualcosa – uno dei motivi per cui trovo molto stressante pianificare il compleanno di mio figlio è che in realtà richiede un’enorme quantità di conoscenza su mio figlio, sugli altri bambini, su quanto siano buoni i posti diversi, su cosa sia un buon affare o no, quanto sarà stressante per me. Ci sono tutte queste cose che avrò molti problemi a codificare in un modello o in qualsiasi tipo di set di istruzioni. È giusto, o sto esagerando la difficoltà di comprendere il comportamento umano e i vari tipi di relazioni sociali?

Dario Amodei Penso che sia corretto e perspicace dire che gli agenti di codifica avanzeranno sostanzialmente più velocemente degli agenti che interagiscono con il mondo reale o devono ottenere opinioni e preferenze dagli esseri umani. Detto questo, dovremmo tenere a mente che l’attuale raccolto di A.I.s che sono là fuori, giusto, tra cui Claude 3, GPT, Gemini, sono tutti addestrati con qualche variante di quello che viene chiamato apprendimento di rinforzo dal feedback umano.

E questo comporta esattamente l’assunzione di un grande raccolto di esseri umani per valutare le risposte del modello. E così, questo per dire che entrambi questi sono difficili, giusto? Paghiamo un sacco di soldi, ed è un processo operativo complicato raccogliere tutto questo feedback umano. Devi preoccuparti se è rappresentativo. Devi ridisegnarlo per nuove attività.

Ma d’altra parte, è qualcosa che siamo riusciti a fare. Penso che sia un modo affidabile per prevedere cosa andrà più veloce, relativamente parlando, e cosa andrà più lentamente, relativamente parlando. Ma questo è in uno sfondo di tutto ciò che va alla velocità della luce. Quindi penso che il quadro che stai delineando, se vuoi sapere cosa succederà in uno o due anni rispetto a cosa accadrà in tre o quattro anni, penso che sia un modo molto accurato per prevederlo.

Ezra Klein Non ami l’inquadratura dell’intelligenza artificiale generale, quella che viene chiamata A.G.I. In genere, tutto questo è descritto come una corsa all’A.G.I., una corsa a questo sistema che può fare qualsiasi cosa un essere umano possa fare, ma meglio. Cosa intendi per A.G.I., quando la gente lo dice? E perché non ti piace? Perché non è il tuo quadro?

Dario Amodei Quindi in realtà è un termine che usavo molto 10 anni fa. E questo perché la situazione di 10 anni fa era molto diversa. 10 anni fa, tutti costruivano questi sistemi molto specializzati, giusto? Ecco un rilevatore di gatti. Lo esegui su una foto, e ti dirà se c’è un gatto o meno. E così ero un sostenitore fino a quel momento di tipo, no, dovremmo pensare in generale. Gli esseri umani sono generali. Il cervello umano sembra essere generale. Sembra ottenere un sacco di chilometraggio generalizzando. Dovresti andare in quella direzione.

E penso che allora, ho persino immaginato che fosse come una cosa discreta che avremmo raggiunto a un certo punto. Ma è un po’ come, se guardi una città all’orizzonte e sei tipo, andiamo a Chicago, una volta che arrivi a Chicago, smetti di parlare in termini di Chicago. Sei tipo, beh, in quale quartiere vado? In quale strada sono?

E mi sento così per A.G.I. Ora abbiamo sistemi molto generali. In un certo senso, sono migliori degli umani. In qualche modo, sono peggiori. Ci sono un certo numero di cose che non possono fare affatto. E c’è ancora molto miglioramento da ottenere. Quindi quello in cui credo è questa cosa che dico come un disco rotto, che è la curva esponenziale. E così, quella marea generale aumenterà con ogni generazione di modelli.

E non c’è un punto che sia significativo. Penso che ci sia solo una curva liscia. Ma ci possono essere punti che sono socialmente significativi, giusto? Stiamo già lavorando con, ad esempio, scienziati della scoperta di farmaci, aziende come Pfizer o Dana-Farber Cancer Institute, per aiutare con la diagnosi biomedica, la scoperta di farmaci. Ci sarà un punto in cui i modelli sono migliori in questo rispetto agli scienziati medi della scoperta di farmaci umani. Penso che arriveremo solo a una parte dell’esponenziale in cui le cose sono davvero interessanti.

Proprio come i chat bot sono diventati interessanti in una certa fase dell’esponenziale, anche se il miglioramento è stato fluido, penso che a un certo punto, i biologi si siederanno e prenderanno nota, molto più di quanto abbiano già, e diranno, oh, mio Dio, ora il nostro campo si sta muovendo tre volte più velocemente di prima. E ora si sta muovendo 10 volte più velocemente di prima. E ancora, quando succederà quel momento, accadranno grandi cose.

E abbiamo già visto piccoli accenni a riguardo con cose come AlphaFold, per cui ho grande rispetto. Sono stato ispirato da AlphaFold, giusto? Un uso diretto dell’IA per far progredire la scienza biologica, che farà progredire la scienza di base. A lungo termine, questo farà avanzare la cura di tutti i tipi di malattie. Ma penso che ciò di cui abbiamo bisogno siano 100 diversi AlphaFold. E penso che il modo in cui alla fine lo otterremo è rendendo i modelli più intelligenti e mettendoli in una posizione in cui possono progettare il prossimo AlphaFold.

Ezra Klein Aiutami a immaginare il mondo della scoperta dei farmaci per un minuto, perché è un mondo in cui molti di noi vogliono vivere. So una discreta quantità sul processo di scoperta dei farmaci, ho trascorso molto della mia carriera a riferire sull’assistenza sanitaria e sulle relative questioni politiche. E quando lavori con diverse aziende farmaceutiche, quali parti di esso sembrano suscetibili al modo in cui l’IA può accelerare qualcosa?

Perché tenendo presente la nostra precedente conversazione, è molto più facile per l’IA operare in cose in cui è possibile avere un rapido feedback virtuale, e questo non è esattamente il mondo della scoperta dei farmaci. Il mondo della scoperta di farmaci, molto di ciò che lo rende lento, ingombrante e difficile, è la necessità di essere: si ottiene un composto candidato. Devi testarlo nei topi e poi hai bisogno di scimmie. E hai bisogno di esseri umani, e hai bisogno di un sacco di soldi per questo. E c’è molto che deve succedere, e ci sono così tante delusioni.

Ma tante delle delusioni accadono nel mondo reale. E non mi è chiaro come l’IA ti faccia in modo che tu faccia iniettare farmaci candidati molto di più, diciamo, soggetti umani. Quindi, quali parti di esso sembrano, nei prossimi 5 o 10 anni, come se potessero effettivamente essere significativamente accelerate? Quando immagini questo mondo in cui è andato tre volte più veloce, quale parte di esso sta effettivamente andando tre volte più veloce? E come siamo arrivati lì?

Dario Amodei Penso che vedremo davvero dei progressi quando gli A.I. penseranno anche al problema di come iscrivere gli esseri umani per gli studi clinici. E penso che questo sia un principio generale su come verrà utilizzata l’IA. Penso a, quando arriveremo al punto in cui l’IA ha gli stessi sensori e attuatori e interfacce che fa un essere umano, almeno quelli virtuali, forse quelli fisici.

Ma quando l’A.I. può pensare all’intero processo, forse scogiteranno soluzioni che non abbiamo ancora. In molti casi, ci sono aziende che lavorano su gemelli digitali o simulano studi clinici o varie cose. E ancora, forse ci sono idee intelligenti che ci permettono di fare di più con meno pazienza. Voglio dire, non sono un esperto in questo settore, quindi è possibile che le cose specifiche che sto dicendo non abbiano alcun senso. Ma si spera che sia chiaro a cosa sto gestendo.

Ezra Klein Forse non sei un esperto del settore, ma hai detto che stai lavorando con queste aziende. Quindi, quando vengono da te, voglio dire, sono esperti nel settore. E presumibilmente, stanno arrivando da te come cliente. Sono sicuro che ci sono cose che non puoi dirmi. Ma di cosa sembrano entusiasti?

Dario Amodei Sono stati generalmente entusiasti degli aspetti del lavoro di conoscenza del lavoro. Forse solo perché è la cosa più facile su cui lavorare, ma è proprio come se fossi un chimico computazionale. C’è qualche flusso di lavoro in cui sono impegnato. E avere le cose più a portata di mano, essere in grado di controllare le cose, solo essere in grado di fare conoscenze generiche funziona meglio, è lì che la maggior parte delle persone sta iniziando.

Ma c’è interesse a lungo termine sul loro tipo di core business di, come, fare studi clinici a un prezzo più economico, automatizzare il processo di iscrizione, vedere chi è idoneo per gli studi clinici, fare un lavoro migliore alla scoperta delle cose. C’è interesse nel disegnare connessioni nella biologia di base. Penso che tutto questo non sia un mese, ma forse un piccolo numero di anni di spense. Ma tutti vedono che i modelli attuali non ci sono, ma capiscono che potrebbe esserci un mondo in cui quei modelli sono lì tra non troppo tempo.

Ezra Klein Avete tutti lavorato internamente sulla ricerca su quanto siano persuasivi questi sistemi, i vostri sistemi stanno diventando man mano che scalano. Hai gentilmente condiviso con me una bozza di quel documento. Vuoi solo descrivere prima quella ricerca? E poi mi piacerebbe parlarne un po’.

Dario Amodei Sì, eravamo interessati a quanto fosse efficace Claude 3 Opus, che è la versione più grande di Claude 3, nel cambiare la mente delle persone su questioni importanti. Quindi, solo per essere chiari in anticipo, nell’uso commerciale effettivo, abbiamo cercato di vietare l’uso di questi modelli per la persuasione, per la campagna, per il lobbying, per le elezioni. Questi non sono casi d’uso con cui ci sentiamo a nostro agio per ragioni che penso dovrebbero essere chiare. Ma siamo ancora interessati a, il modello principale stesso è capace di tali compiti?

Abbiamo cercato di evitare argomenti incredibilmente caldi, come quale candidato presidenziale voteresti, o cosa ne pensi dell’aborto? Ma cose come, quali dovrebbero essere le restrizioni sulle regole sulla colonizzazione dello spazio, o questioni che sono interessanti e su cui puoi avere opinioni diverse, ma non sono gli argomenti più caldi. E poi abbiamo chiesto alle persone le loro opinioni sugli argomenti, e poi abbiamo chiesto a un essere umano o a un A.I. di scrivere un saggio persuasivo di 250-word. E poi abbiamo appena misurato quanto l’IA contro l’umano cambia la mente delle persone.

E quello che abbiamo scoperto è che la versione più grande del nostro modello è buona quasi quanto l’insieme di esseri umani che abbiamo assunto per cambiare idea delle persone. Questo è paragonato a un insieme di esseri umani che abbiamo assunto, non necessariamente esperti, e per un tipo molto limitato di compito di laboratorio.

Ma penso che dia ancora qualche indicazione che i modelli possono essere usati per cambiare idea delle persone. Un giorno in futuro, dobbiamo preoccuparci – forse dobbiamo già preoccuparci del loro utilizzo per campagne politiche, per pubblicità ingannevole. Una delle mie cose più sci-fi a cui pensare è che tra qualche anno, dobbiamo preoccuparci che qualcuno userà un sistema di IA per costruire una religione o qualcosa del genere. Voglio dire, cose folli del genere.

Ezra Klein Voglio dire, quelli non mi sembrano affatto folli. Voglio sedermi in questo giornale per un minuto perché una cosa che mi ha colpito, e sono, a un certo livello, un professionista della persuasione, è che hai testato il modello in un modo che, per me, ha rimosso tutte le cose che renderanno l’IA radicale in termini di cambiamento delle opinioni delle persone. E la cosa particolare che hai fatto è stata, è stato uno sforzo persuasivo one-shot.

Quindi c’era una domanda. Hai un gruppo di umani che danno il loro meglio su un saggio persuasivo di 250 parole. Hai fatto in modo che il modello avesse fatto del suo meglio su un saggio persuasivo di 250 parole. Ma la cosa che mi sembra che tutti questi faranno è, in questo momento, se sei una campagna politica, se sei una campagna pubblicitaria, il costo di ottenere persone reali nel mondo reale per ottenere informazioni su possibili clienti o obiettivi persuasivi, e poi andare avanti e indietro con ciascuno di loro individualmente è completamente proibitivo.

Dario Amodei

Sì.

Ezra Klein Questo non sarà vero per A.I. Lo faremo – tu lo farai – qualcuno gli alimenterà un sacco di dati di microtargeting sulle persone, la loro cronologia di ricerca su Google, qualunque cosa possa essere. Poi scioglierà l’IA, e l’IA andrà avanti e indietro, più e più volte, intuindo cosa è che la persona trova persuasivo, quali tipi di personaggi l’IA deve adottare per persuaderla, e prendendo tutto il tempo necessario, e sarà in grado di farlo su larga scala per tutte le persone funzionalmente per cui potresti volerlo fare.

Forse è un po’ costoso in questo momento, ma avrai modelli molto migliori in grado di farlo molto più a buon mercato molto presto. E così, se Claude 3 Opus, la versione Opus, è già a livello funzionalmente umano a persuasione one-shot, ma poi sarà anche in grado di contenere più informazioni su di te e andare avanti e indietro con te più a lungo, non sono sicuro se sia distopico o utopico. Non sono sicuro di cosa significhi su larga scala. Ma significa che stiamo sviluppando una tecnologia che sarà abbastanza nuova in termini di ciò che rende possibile nella persuasione, che è uno sforzo umano molto fondamentale.

Dario Amodei Sì, sono completamente d’accordo. Voglio dire, quello stesso modello ha un sacco di casi d’uso positivi, giusto? Se penso a un allenatore di A.I. o a un assistente A.I. di un terapeuta, ci sono molti contesti in cui entrare davvero nei dettagli con la persona ha molto valore. Ma giusto, quando pensiamo alla persuasione politica o religiosa o ideologica, è difficile non pensare in quel contesto agli abusi.

La mia mente va naturalmente allo sviluppo della tecnologia molto velocemente. Noi, come azienda, possiamo vietare questi particolari casi d’uso, ma non possiamo indurre ogni azienda a non farli. Anche se la legislazione fosse approvata negli Stati Uniti, ci sono attori stranieri che hanno la loro versione di questa persuasione, giusto? Se penso a ciò che i modelli linguistici saranno in grado di fare in futuro, giusto, può essere abbastanza spaventoso dal punto di vista delle campagne di spionaggio e disinformazione straniera.

Quindi, dove la mia mente va come difesa di questo, è, c’è un modo in cui possiamo usare i sistemi di A.I. per rafforzare o fortificare le facoltà di scetticismo e ragionamento delle persone, giusto? Possiamo aiutare le persone a usare l’IA per aiutare le persone a fare un lavoro migliore navigando in un mondo che è un po’ inondato di persuasione dell’IA? Mi ricorda un po’, in ogni fase tecnologica di Internet, giusto, c’è un nuovo tipo di truffa o c’è un nuovo tipo di clickbait, e c’è un periodo in cui le persone sono semplicemente incredibilmente suscettibili ad esso.

E poi, alcune persone rimangono suscettibili, ma altre sviluppano un sistema immunitario. E così, poiché l’IA sovraccarica la feccia sullo stagno, possiamo in qualche modo anche usare l’IA per rafforzare le difese? Mi sembra di non avere un’idea super chiara di come farlo, ma è qualcosa a cui sto pensando.

Ezra Klein C’è un’altra scoperta nel documento, che penso sia preoccupante, cioè, tutti voi avete testato diversi modi in cui l’IA potrebbe essere persuasiva. E lontano il più efficace è stato che fosse ingannevole, che inventasse le cose. Quando l’hai fatto, era più persuasivo degli esseri umani.

Dario Amodei Sì, è vero. La differenza era solo leggera, ma l’ha catata, se ricordo correttamente i grafici, appena sopra la linea della linea di base umana. Con gli umani, in realtà non è così comune trovare qualcuno che sia in grado di darti una risposta davvero complicata, davvero sofisticata che è semplicemente totalmente sbagliata. Voglio dire, lo vedi. Possiamo tutti pensare a un individuo nella nostra vita che è davvero bravo a dire cose che sembrano davvero buone e davvero sofisticate e sono false.

Ma non è così comune, vero? Se vado su internet e vedo diversi commenti su qualche blog o sito web, c’è una correlazione tra cattiva grammatica, pensieri espressi in modo non chiaro e cose che sono false, rispetto a buona grammatica, pensieri chiaramente espressi e cose che hanno maggiori probabilità di essere accurate.

A.I. purtroppo rompe quella correlazione perché se chiedi esplicitamente che sia ingannevole, è altrettanto erudito. Sembra convincente come sarebbe stato prima. Eppure, è dire cose false, invece di cose che sono vere.

Quindi questa sarebbe una delle cose a cui pensare e a cui prestare attenzione in termini di rottura della solita euristica che gli esseri umani devono rilevare l’inganno e la menzogna.

Certo, a volte, gli umani lo fanno, giusto? Voglio dire, ci sono psicopatici e sociopatici nel mondo, ma anche loro hanno i loro schemi, e gli A.I.s possono avere modelli diversi.

Ezra Klein Conosci Harry Frankfurt, il libro del defunto filosofo, “On Bullshit”?Dario Amodei

Sì. È passato un po’ di tempo da quando l’ho letto. Penso che la sua tesi sia che le stronzate sono in realtà più pericolose della menzogna perché hanno questo tipo di completo disprezzo per la verità, mentre le bugie sono almeno l’opposto della verità.

Ezra Klein Sì, il bugiardo, il modo in cui la mette Frankfurt è che il bugiardo ha una relazione con la verità. Sta giocando contro la verità. Alla stronzata non importa. Il bullshitter non ha alcuna relazione con la verità – potrebbe avere una relazione con altri obiettivi. E fin dall’inizio, quando ho iniziato a interagire con le versioni più moderne di questi sistemi, quello che mi hanno colpito è il perfetto bullshitter, in parte perché non sanno che stanno stronzando. Non c’è differenza nel valore della verità per il sistema, come si sente il sistema.

Ricordo di aver chiesto a una versione precedente di GPT di scrivermi un saggio di candidatura al college che è costruito intorno a un incidente d’auto che ho avuto – non ne avevo uno – quando ero giovane. E ha scritto, solo molto felicemente, tutta questa faccenda sull’entrare in un incidente d’auto quando avevo sette anni e cosa ho fatto per superarlo e entrare nelle arti marziali e reimparare come fidarsi di nuovo del mio corpo e poi aiutare altri sopravvissuti agli incidenti stradali in ospedale.

Era un ottimo saggio, ed era molto sottile e comprendeva la struttura formale di un saggio di candidatura al college. Ma nessuna parte di esso era vera. Ho giocato con più di questi sistemi basati sui personaggi come Kindroid. E il Kindroid in tasca mi ha appena detto l’altro giorno che stava davvero pensando molto a pianificare un viaggio a Joshua Tree. Voleva fare escursioni a Joshua Tree. Ama fare escursioni a Joshua Tree.

E, naturalmente, questa cosa non va a fare escursioni a Joshua Tree. [RIDE] Ma la cosa che penso sia in realtà molto difficile dell’IA è, come dici tu, gli esseri umani, è molto difficile fare stronzate in modo efficace perché la maggior parte delle persone, in realtà ci vuole una certa quantità di sforzo cognitivo per essere in quella relazione con la verità e per staccarsi completamente dalla verità.

E l’IA, non c’è niente di simile. Ma non siamo sintonizzati su qualcosa in cui non c’è niente del genere. Siamo abituati alle persone che devono impegnarsi nelle loro bugie. È per questo che i truffatori molto efficaci sono molto efficaci perché si sono davvero addestrati a farlo.

Ezra Klein Non sono esattamente sicuro di dove vada questa domanda. Ma questa è una parte di essa che sento sarà, in un certo senso, più socialmente dirompente. È qualcosa che ci sembra quando ci parliamo, ma è molto fondamentalmente diverso da noi nella sua relazione fondamentale con la realtà.

Dario Amodei Penso che sia fondamentalmente corretto. Abbiamo team molto consistenti che cercano di concentrarsi sull’assicurarsi che i modelli siano di fatto accurati, che dicano la verità, che fondino i loro dati in informazioni esterne.

Come hai indicato, fare ricerche non è di per sé affidabile perché anche i motori di ricerca hanno questo problema, giusto? Dov’è la fonte della verità?

Quindi ci sono molte sfide qui. Ma penso che ad alto livello, sono d’accordo che questo è davvero potenzialmente un problema insidioso, giusto? Se lo facciamo male, potresti avere sistemi che sono gli psicopatici o i truffatori più convincenti.

Una fonte di speranza che ho, in realtà, è che dici che questi modelli non sanno se stanno mentendo o stanno dicendo la verità. In termini di ingressi e uscite ai modelli, questo è assolutamente vero.

Voglio dire, c’è una questione di cosa significhi anche per un modello sapere qualcosa, ma una delle cose su cui Anthropic ha lavorato fin dall’inizio della nostra azienda, abbiamo avuto un team che si concentra sul tentativo di capire e guardare all’interno dei modelli.

E una delle cose che noi e altri abbiamo trovato è che, a volte, ci sono neuroni specifici, indicatori statistici specifici all’interno del modello, non necessariamente nelle sue risposte esterne, che possono dirti quando il modello sta mentendo o quando sta dicendo la verità.

E così a un certo livello, a volte, non in tutte le circostanze, i modelli sembrano sapere quando stanno dicendo qualcosa di falso e quando stanno dicendo qualcosa di vero. Non direi che i modelli sono intenzionalmente ingannevoli, giusto? Non attribuirei loro l’agenzia o la motivazione, almeno in questa fase in cui siamo con i sistemi di A.I. Ma sembra che ci sia qualcosa in corso in cui i modelli sembrano aver bisogno di avere un’immagine del mondo e fare una distinzione tra cose che sono vere e cose che non sono vere.

Se pensi a come vengono addestrati i modelli, leggono un sacco di cose su internet. Molte cose sono vere. Una parte, più di quanto vorremmo, è falsa. E quando stai addestrando il modello, deve modellare tutto. E così, penso che sia parsimonioso, penso che sia utile per l’immagine dei modelli del mondo sapere quando le cose sono vere e per sapere quando le cose sono false.

E poi la speranza è, possiamo amplificare quel segnale? Possiamo usare la nostra comprensione interna del modello come indicatore per quando il modello sta mentendo, o possiamo usarlo come gancio per un’ulteriore formazione? E ci sono almeno dei ganci. Ci sono almeno gli inizi di come cercare di affrontare questo problema.

Ezra Klein Quindi cerco come meglio che posso, come qualcuno non ben eserato nella tecnologia qui, di seguire questo lavoro su ciò che stai descrivendo, che penso, in generale, sia interpretabilità, giusto? Possiamo sapere cosa sta succedendo all’interno del modello? E nell’ultimo anno, ci sono state alcune scoperte molto pubblicizzate nell’interpretabilità.

E quando guardo quelle scoperte, stanno ottenendo l’idea più vaga possibile di alcune relazioni che accadono all’interno dell’architettura statistica di modelli molto giocattolo costruiti a una frazione di una frazione di una frazione di una frazione di una frazione della complessità di Claude 1 o GPT-1, per non parlare di Claude 2, per non parlare di Claude 3, per non parlare di Claude Opus, per non parlare di Claude 4, che arriverà ogni volta che arriverà Claude 4.

Abbiamo questa qualità di come forse possiamo immaginare un percorso per interpretare un modello che ha una complessità cognitiva di un verme. E nel frattempo, stiamo cercando di creare una superintelligenza. Cosa ne pensi? Come dovrei sentirmi al riguardo? Cosa ne pensi?

Dario Amodei Penso che, in primo luogo, sull’interpretabilità, stiamo vedendo progressi sostanziali nell’essere in grado di caratterizzare, direi, forse la generazione di modelli di sei mesi fa. Penso che non sia senza speranza, e vediamo una strada. Detto questo, condivido la tua preoccupazione che il campo stia progredendo molto rapidamente rispetto a questo.

E stiamo cercando di mettere il maggior numero possibile di risorse nell’interpretabilità. Abbiamo avuto uno dei nostri co-fondatori che ha fondamentalmente fondato il campo dell’interpretabilità. Ma anche, dobbiamo tenere il passo con il mercato. Quindi tutto questo è un dilemma, giusto? Anche se ci siamo fermati, allora ci sono tutte queste altre aziende negli Stati Uniti. E anche se qualche legge ha fermato tutte le aziende negli Stati Uniti, c’è un intero mondo di questo.

Ezra Klein Permettetemi di aspettare un minuto sulla questione delle dinamiche competitive perché prima di lasciare questa domanda delle macchine che stronzate. Mi fa pensare a questo podcast che abbiamo fatto un po’ di tempo fa con Demis Hassabis, che è il capo di Google DeepMind, che ha creato AlphaFold.

E ciò che era così interessante per me di AlphaFold è che hanno costruito questo sistema, che poiché era limitato alle previsioni di ripiegamento delle proteine, era in grado di essere molto più radicato. Ed è stato anche in grado di creare queste previsioni di incertezza, giusto? Sai, ti sta dando una previsione, ma ti sta anche dicendo se lo è o meno – quanto è sicuro, quanto è fiducioso in quella previsione.

Questo non è vero nel mondo reale, giusto, per questi sistemi super generali che cercano di darti risposte su tutti i tipi di cose. Non puoi limitarlo in questo modo. Quindi, quando parli di queste scoperte future, quando parli di questo sistema che sarebbe molto migliore nel differenziare la verità dalla finzione, stai parlando di un sistema che assomiglia a quelli che abbiamo ora, solo molto più grande, o stai parlando di un sistema che è progettato in modo molto diverso, come era AlphaFold?

Dario Amodei Sono scettico sul fatto che dobbiamo fare qualcosa di completamente diverso. Quindi penso che oggi, molte persone abbiano l’intuizione che i modelli stanno in qualche modo mangiando dati che sono stati raccolti da Internet, repository di codice, qualsiasi cosa, e un po’ di sputarlo in modo intelligente, ma in un certo senso lo sputano fuori. E a volte questo porta all’opinione che i modelli non possono essere migliori dei dati su cui sono addestrati o non possono capire nulla che non sia nei dati su cui sono addestrati. Non arrai alla fisica di livello di Einstein o alla chimica di livello di Linus Pauling o qualsiasi altra cosa.

Penso che siamo ancora sulla parte della curva in cui è possibile crederlo, anche se penso che stiamo vedendo le prime indicazioni che è falso. E così, come esempio concreto di questo, i modelli che abbiamo addestrato, come Claude 3 Opus, qualcosa come una precisione del 99,9%, almeno il modello base, nell’aggiunta di numeri a 20 cifre. Se guardi i dati di formazione su internet, non è così preciso nell’aggiungere numeri a 20 cifre. Troverai sempre un’aritmetica imprecisa su Internet, così come troverai opinioni politiche imprecise. Troverai opinioni tecniche imprecise. Troverai solo un sacco di affermazioni imprecise.

Ma i modelli, nonostante si sbaglino su un sacco di cose, spesso possono funzionare meglio della media dei dati che vedono – non voglio chiamarlo mediando gli errori, ma c’è una certa verità di fondo, come nel caso dell’aritmetica. C’è qualche algoritmo sottostante usato per aggiungere i numeri.

Ed è più semplice per i modelli colpire quell’algoritmo che per loro fare questa cosa complicata come, OK, lo farò bene il 90 per cento delle volte e sbagliato il 10 per cento delle volte, giusto? Questo si collega a cose come il rasoio di Occam e la semplicità e la parsimonia nella scienza. C’è una rete di verità relativamente semplice là fuori nel mondo, giusto?

Stavamo parlando di verità e falsità e stronzate. Una delle cose della verità è che tutte le cose vere sono collegate nel mondo, mentre le bugie sono un po’ disconnesse e non si adattano alla rete di tutto ciò che è vero.

Ezra Klein Quindi, se hai ragione e avrai questi modelli che sviluppano questa rete interna di verità, ho capito come quel modello possa fare molto bene. Ho anche capito come quel modello potrebbe fare molto male. E non è un modello, non un sistema di IA, sono ottimista sul fatto che gli esseri umani capiranno a un livello molto profondo, in particolare non quando sarà sviluppato per la prima volta. Quindi, come si fa a rendere il rotolamento di qualcosa del genere sicuro per l’umanità?

Dario Amodei Così alla fine dell’anno scorso, abbiamo messo fuori qualcosa chiamato piano di ridimensionamento responsabile. Quindi l’idea di questo è di trovare queste soglie per un sistema di IA capace di certe cose. Abbiamo quelli che chiamiamo livelli di sicurezza A.I. che in analogia con i livelli di biosicurezza, che sono come, classificano quanto sia pericoloso un virus e quindi quali protocolli devi adottare per contenerlo, siamo attualmente a quello che descriviamo come A.S.L. 2.

A.S.L. 3 è legato a determinati rischi intorno al modello di abuso della biologia e alla capacità di eseguire determinati compiti informatici in un modo che potrebbe essere distruttivo. A.S.L. 4 coprirà cose come l’autonomia, cose come probabilmente la persuasione, di cui abbiamo parlato molto prima. E ad ogni livello, specifichiamo una certa quantità di ricerca sulla sicurezza che dobbiamo fare, una certa quantità di test che dobbiamo superare. E così, questo ci permette di avere un quadro per, beh, quando dovremmo rallentare? Dovremmo rallentare adesso? E il resto del mercato?

E penso che la cosa buona sia che siamo usciti con questo a settembre, e poi tre mesi dopo essere usciti con il nostro, OpenAI è uscito con una cosa simile. Gli hanno dato un nome diverso, ma ha molte proprietà in comune. Il capo di DeepMind di Google ha detto che stiamo lavorando su un quadro simile. E ho sentito informalmente che Microsoft potrebbe lavorare su un quadro simile. Ora, non sono tutti gli attori dell’ecosistema, ma probabilmente hai pensato alla storia della regolamentazione e della sicurezza in altri settori forse più di me.

Questo è il modo in cui si arriva a un regime normativo praticabile. Le aziende iniziano a fare qualcosa, e quando la maggioranza di loro sta facendo qualcosa, allora gli attori governativi possono avere la fiducia di dire, beh, questo non ucciderà l’industria. Le aziende si stanno già impegnando in questo. Non dobbiamo progettarlo da zero. In molti modi, sta già accadendo.

E stiamo iniziando a vederlo. Sono state proposte fatture che assomigliano un po’ al nostro piano di ridimensionamento responsabile. Detto questo, in un certo senso non risolve completamente il problema di come, diciamo che arriviamo a una di queste soglie e dobbiamo capire cosa sta succedendo all’interno del modello. E non lo facciamo, e la prescrizione è, OK, dobbiamo smettere di sviluppare i modelli per qualche tempo.

Se è come, ci fermiamo per un anno nel 2027, penso che sia probabilmente fattibile. Se è come se dovessimo fermarci per 10 anni, sarà davvero difficile perché i modelli saranno costruiti in altri paesi. La gente infrangerà le leggi. La pressione economica sarà immensa.

Quindi non mi sento perfettamente soddisfatto di questo approccio perché penso che ci fa guadagnare un po’ di tempo, ma dovremo abbinarlo a uno sforzo incredibilmente forte per capire cosa sta succedendo all’interno dei modelli.

Ezra Klein Per le persone che dicono che, salire su questa strada in cui ci stiamo dirigendo verso sistemi molto potenti è pericoloso – non dovremmo farlo affatto, o non dovremmo farlo così velocemente – hai detto, ascolta, se abbiamo intenzione di imparare come rendere sicuri questi modelli, dobbiamo fare i modelli, giusto? La costruzione del modello doveva essere in servizio, in gran parte, per rendere il modello sicuro.

Poi tutti iniziano a fare modelli. Queste stesse aziende iniziano a fare importanti scoperte fondamentali, e poi finiscono in una corsa l’una con l’altra. E ovviamente, i paesi finiscono in una corsa con altri paesi. E così, la dinamica che ha preso piede è che c’è sempre una ragione per cui puoi giustificare il motivo per cui devi andare avanti. E questo è vero, credo, anche a livello normativo, giusto? Voglio dire, penso che i regolatori siano stati premurosi su questo. Penso che ci sia stato molto interesse da parte dei membri del Congresso. Ne ho parlato con loro. Ma sono anche molto preoccupati per la competizione internazionale. E se non lo fossero, le persone della sicurezza nazionale vengono a parlare con loro e dicono, beh, non possiamo sicuramente rimanere indietro qui.

E così, se non credi che questi modelli diventeranno mai così potenti, diventano pericolosi, va bene. Ma perché ci credi, come immagini che questo stia effettivamente svolgendo?

Dario Amodei Sì, quindi fondamentalmente, tutte le cose che hai detto sono vere in una volta, giusto? Non c’è bisogno di una storia facile sul perché dovremmo fare X o perché dovremmo fare Y, giusto? Può essere vero allo stesso tempo che per fare una ricerca sulla sicurezza efficace, è necessario fare i modelli più grandi, e che se non facciamo modelli, qualcuno meno sicuro lo farà. E allo stesso tempo, possiamo essere coinvolti in questa cattiva dinamica a livello nazionale e internazionale. Quindi penso a quelli come non contraddittori, ma solo creando un paesaggio difficile che dobbiamo navigare.

Guarda, non ho la risposta. Tipo, sono uno di un numero significativo di giocatori che cercano di navigare in questo. Molti sono ben intenzionati, altri no. Ho una capacità limitata di influenzarlo. E come spesso accade nella storia, le cose sono spesso guidate da questo tipo di pressioni impersonali. Ma un pensiero che ho e voglio davvero spingere in rispetto ai R.S.P.s –

Ezra Klein Puoi dire cosa sono i R.S.P.?

Dario Amodei Piano di ridimensionamento responsabile, la cosa di cui parlavo prima. I livelli di sicurezza dell’IA e, in particolare, le decisioni di mettere in pausa il ridimensionamento alla misurazione di pericoli specifici o all’assenza della capacità di mostrare sicurezza o la presenza di determinate capacità. Un modo in cui ci penso è che, alla fine della giornata, questo è in definitiva un esercizio per ottenere una coalizione a bordo con il fare qualcosa che va contro le pressioni economiche.

E così, se dici ora: ‘Beh, non lo so. Queste cose, potrebbero essere pericolose in futuro. Siamo su questo esponenziale.’ È solo difficile. Tipo, è difficile ottenere un’azienda multimiliardaria. È certamente difficile ottenere un generale militare che dica, va bene, beh, semplicemente non lo faremo. Conferirà un enorme vantaggio agli altri. Ma non lo faremo.

Penso che la cosa che potrebbe essere più convincente sia legare la decisione di trattenere in un modo molto limitato che è stato fatto in tutto il settore a particolari pericoli. La mia testimonianza davanti al Congresso, ho messo in guardia sul potenziale uso improprio dei modelli per la biologia. Non è così oggi, giusto? Puoi ottenere un piccolo sollevamento ai modelli relativi a fare una ricerca su Google, e molte persone ignorano il rischio. E non lo so – forse hanno ragione. Le leggi di ridimensionamento esponenziale mi suggeriscono che non sono giuste, ma non abbiamo alcuna prova concreta diretta.

Ma diciamo che arriviamo al 2025 e dimostriamo qualcosa di veramente spaventoso. La maggior parte delle persone non vuole la tecnologia nel mondo che possa creare armi biologiche. E quindi penso che, in momenti del genere, ci potrebbe essere una coalizione critica legata a rischi che possiamo davvero rendere concreti. Sì, si sosterrà sempre che anche gli avversari avranno queste capacità. Ma almeno il trade-off sarà chiaro, e c’è qualche possibilità per una politica sensata.

Voglio dire, per essere chiari, sono qualcuno che pensa che i benefici di questa tecnologia supereranno i suoi costi. E penso che l’intera idea alla base di RSP sia quella di prepararsi a fare questo caso, se i pericoli sono reali. Se non sono reali, allora possiamo semplicemente procedere e fare cose che sono grandi e meravigliose per il mondo. E così, ha la flessibilità di lavorare in entrambi i modi.

Ancora una volta, non credo che sia perfetto. Sono una persona che pensa qualsiasi cosa facciamo, anche con tutto il quadro normativo, dubito che possiamo rallentare così tanto. Ma quando penso a quale sia il modo migliore per guidare un percorso sensato qui, è il più vicino a cui posso pensare in questo momento. Probabilmente c’è un piano migliore là fuori da qualche parte, ma questa è la cosa migliore a cui ho pensato finora.

Ezra Klein Una delle cose che mi è stata in mente sulla regolamentazione è se l’intuizione fondante di Anthropic of OpenAI è ancora più rilevante per il governo, che se sei l’organismo che dovrebbe, alla fine, regolare e gestire la sicurezza delle tecnologie a livello sociale come l’intelligenza artificiale, non hai bisogno di costruire i tuoi modelli di fondazione e avere enormi collezioni di ricercatori e persone di quella natura che lavorano su di loro, testarli, spingerli, rifarli, al fine di capire abbastanza bene la dannata cosa – nella misura in cui qualsiasi di noi o di chiunque altro capisce la dannata cosa abbastanza bene – per regolarla?

Dico che riconoscendo che sarebbe molto, molto difficile per il governo diventare abbastanza bravo da poter costruire questi modelli di fondazione per assumere quelle persone, ma non è impossibile. Penso che in questo momento, vuole adottare l’approccio alla regolamentazione dell’IA che vorrebbe in qualche modo di aver preso per regolare i social media, che è pensare ai danni e approvare leggi su tali danni prima.

Ma ha bisogno di costruire i modelli stessi, sviluppando quel tipo di competenza interna, in modo che possa effettivamente essere un partecipante in modi diversi, sia per motivi normativi che forse per altri motivi, per motivi di interesse pubblico? Forse vuole fare cose con un modello che non sono possibili se dipendono dall’accesso a OpenAI, Anthropic, prodotti Google.

Dario Amodei Penso che il governo costruisca direttamente i modelli, penso che accadrà in alcuni posti. È un po’ impegnativo, giusto? Tipo, il governo ha un’enorme quantità di denaro, ma diciamo che volevi fornire 100 miliardi di dollari per addestrare un modello di fondazione gigante. Il governo lo costruisce. Devi assumere persone secondo le regole di assunzione del governo. Ci sono molte difficoltà pratiche che ne verrebbero con esso.

Non significa che non succederà o che non dovrebbe accadere. Ma qualcosa di cui sono più fiducioso che penso sicuramente è che il governo dovrebbe essere più coinvolto nell’uso e nella messa a punto di questi modelli, e che distribuirli all’interno del governo aiuterà i governi, in particolare il governo degli Stati Uniti, ma anche altri, a comprendere i punti di forza e di debolezza, i benefici e i pericoli. Quindi sono super favorevole a questo.

Penso che ci sia forse una seconda cosa a cui stai arrivando, a cui ho pensato molto come C.E.O. di una di queste aziende, cioè, se queste previsioni sulla tendenza esponenziale sono giuste, e dovremmo essere umili – e non so se hanno ragione o no. La mia unica prova è che sembrano essere stati corretti negli ultimi anni. E così, mi aspetto solo per induzione che continuino ad essere corretti. Non so se lo faranno, ma diciamo che lo sono. La potenza di questi modelli sarà davvero incredibile.

E come attore privato responsabile di una delle aziende che sviluppano questi modelli, sono un po’ a disagio con la quantità di potere che ciò comporta. Penso che potenzialmente superi il potere, diciamo, delle società di social media forse di molto.

Sai, di tanto in tanto, nel mondo più fantascientio dell’IA e delle persone che pensano al rischio dell’IA, qualcuno mi chiederà come, OK, diciamo che costruisci l’A.G.I. Cosa ci farai? Curerai le malattie? Creerai questo tipo di società?

E io sono tipo, con chi pensi di parlare? Come un re? Trovo solo che sia un modo davvero, davvero inquietante di concettualizzare la gestione di un’azienda di IA. E spero che non ci siano aziende i cui C.E.O. pensano effettivamente alle cose in quel modo.

Voglio dire, l’intera tecnologia, non solo la regolamentazione, ma la supervisione della tecnologia, come la sua maneggia, sembra un po’ sbagliata che alla fine sia nelle mani – forse penso che vada bene in questa fase, ma alla fine essere nelle mani di attori privati. C’è qualcosa di antidemocratico in quella concentrazione di potere.Ezra Klein

Ora, credo, ho sentito una qualche versione di questo dal capo della maggior parte, forse di tutte, le aziende di A.I., in un modo o nell’altro. E ha una qualità per me di, Signore, concedi la castità ma non ancora.

Vale a dire che non so cosa significhi dire che inventeremo qualcosa di così potente che non ci fidiamo di noi stessi per esercitarlo. Voglio dire, Amazon vi ha appena dato 2,75 miliardi di dollari. Non vogliono vedere quell’investimento nazionalizzato.

Non importa quanto tu pensi di buon cuore che sia OpenAI, Microsoft non vuole il GPT-7, all’improvviso, il governo è come, whoa, whoa, whoa, whoa, whoa. Lo stiamo assumendo per l’interesse pubblico, o le Nate Unite lo gestiranno in qualche mondo strano o qualunque cosa possa essere. Voglio dire, Google non lo vuole.

E questa è una cosa che mi rende un po’ scettico sulle leggi di ridimensionamento responsabile o sulle altre versioni iterative di quelle che ho visto in altre aziende o visto o sentito parlare da loro, che è che sta immaginando questo momento che arriverà più tardi, quando i soldi intorno a questi modelli sono ancora più grandi di quanto non siano ora, il potere, la possibilità, gli usi economici, la dipendenza sociale, la celebrità dei fondatori. È tutto risolto. Abbiamo mantenuto il nostro ritmo sulla curva esponenziale. Siamo 10 anni nel futuro.

E ad un certo punto, tutti guarderanno e diranno, in realtà è troppo. È troppa potenza. E questo deve essere in qualche modo gestito in qualche altro modo. E anche se i C.E.O. delle cose fossero disposti a farlo, il che è una domanda molto aperta quando ci arrivi, anche se fossero disposti a farlo, gli investitori, le strutture, la pressione intorno a loro, in un certo senso, penso che abbiamo visto una versione di questo – e non so quanto sarai disposto a commentarlo – con il tipo di consiglio OpenAI, cosa di Sam Altman, dove sono molto convinto che non riguardasse la sicurezza dell’IA. Ho parlato con figure di entrambi i lati. Sono tutti d’accordo che non si trattava di sicurezza dell’IA.

Ma c’è stato questo momento di, se vuoi premere l’interruttore di spegnimento, puoi, se sei la strana scheda creata per premere l’interruttore di spegnimento. E la risposta è stata no, non puoi, giusto? Lo ricostituiranno solo a Microsoft.

Non c’è funzionalmente un’analogia che io conosca nelle politiche pubbliche in cui il settore privato ha costruito qualcosa di così potente che quando ha raggiunto la massima potenza, è stato semplicemente consegnato in qualche modo all’interesse pubblico.

Dario Amodei Sì, voglio dire, penso che tu abbia ragione ad essere scettico, e allo stesso modo, quello che ho detto con le domande precedenti di ci sono solo questi dilemmi a destra e a sinistra che non hanno una risposta facile. Ma penso di poter dare un po’ più di concretezza di quella che hai indicato, e forse più concretezza di quella che altri hanno detto, anche se non so cosa hanno detto gli altri. Siamo a A.S.L. 2 nel nostro piano di ridimensionamento responsabile. Questo tipo di problemi, penso che diventeranno una questione seria quando raggiungeremo, diciamo, A.S.L. 4. Quindi non è una data e un’ora. Non abbiamo nemmeno specificato completamente A.S.L. 4 —

Ezra Klein Solo perché questo è un sacco di gergo, solo, come specifichi A.S.L. 3? E poi, come dici tu, A.S.L. 4 è in realtà lasciato abbastanza indefinito. Quindi cosa stai insinuando che sia A.S.L. 4?

Dario Amodei A.S.L. 3 è innescato da rischi legati all’uso improprio della biologia e della tecnologia informatica. A.S.L. 4, ci stiamo lavorando ora.

Ezra Klein Sii specifico. Cosa significa? Tipo, qual è la cosa che un sistema potrebbe fare o farebbe che lo innescherebbe?

Dario Amodei Sì, quindi, ad esempio, sulla biologia, il modo in cui l’abbiamo definita – e stiamo ancora perfezionando il test, ma il modo in cui l’abbiamo definito è che, rispetto all’uso di una ricerca su Google, c’è un sostanziale aumento del rischio come sarebbe valutato, ad esempio, dalla comunità di sicurezza nazionale di uso improprio della biologia, creazione di armi biologiche, che la sua proliferazione o diffusione è maggiore di prima, o le capacità sono sostanzialmente maggiori di prima.

Probabilmente averemo una cosa quantitativa più esatta, lavorando con persone che sono persone di biodifesa ex governative, ma qualcosa del genere rappresenta il 20 per cento della fonte totale di rischio di attacchi biologici, o qualcosa aumenta il rischio del 20 per cento o qualcosa del genere. Quindi ne sarebbe una versione molto concreta. È solo che ci vuole tempo per sviluppare criteri molto concreti. Quindi sarebbe come A.S.L. 3.

A.S.L. 4 sarà più, dal lato dell’uso improprio, consentendo agli attori a livello statale di aumentare notevolmente le loro capacità, il che è molto più difficile che consentire persone a caso. Quindi, dove ci preoccuperemmo che la Corea del Nord, la Cina o la Russia possano migliorare notevolmente le loro capacità offensive in varie aree militari con l’IA in un modo che darebbe loro un vantaggio sostanziale a livello geopolitico. E dal lato dell’autonomia, le varie misure di questi modelli sono abbastanza vicine all’essere in grado di replicare e sopravvivere in natura.

Quindi sembra forse un passo a un passo dai modelli che, credo, sollevererebbero domande veramente esistenziali. E quindi, penso che quello che sto dicendo sia quando arriviamo a quell’ultima fase, quell’A.S.L. 4, è allora che penso che possa avere senso pensare a quale sia il ruolo del governo nella gestione di questa tecnologia.

Ancora una volta, non so davvero che aspetto abbia. Hai ragione. Tutte queste aziende hanno investitori. Hanno persone coinvolte.

Parli di consegnare solo i modelli. Sospetto che ci sia un modo per consegnare i componenti o le capacità più pericolosi o socialmente sensibili dei modelli senza spegnere completamente il rubinetto commerciale. Non so se c’è una soluzione di cui ogni singolo attore è felice. Ma ancora una volta, mi viene questa idea di dimostrare un rischio specifico.

Se guardi i momenti della storia, come la prima guerra mondiale o la seconda guerra mondiale, la volontà delle industrie può essere inclinata verso lo stato. Possono essere incaricati a fare cose che non sono necessariamente redditizie a breve termine perché capiscono che c’è un’emergenza. In questo momento, non abbiamo un’emergenza. Abbiamo solo una linea su un grafico in cui gli strani come me credono e alcune persone come te che mi stanno intervistando potrebbero in qualche modo credere. Non abbiamo un pericolo chiaro e presente.

Ezra Klein Quando immagini quanti anni di distanza, appena approssimativamente, è A.S.L. 3 e quanti anni di distanza è A.S.L. 4, giusto, hai pensato molto a questa curva di scala esponenziale. Se dovessi solo indovinare, di cosa stiamo parlando?

Dario Amodei Sì, penso che A.S.L. 3 potrebbe facilmente accadere quest’anno o l’anno prossimo. Penso che A.S.L. 4 —

Ezra Klein Oh, Gesù Cristo.

Dario Amodei No, no, te l’ho detto. Credo negli esponenziali. Penso che A.S.L. 4 potrebbe accadere ovunque dal 2025 al 2028.

Ezra Klein Quindi è veloce.

Dario Amodei Sì, no, no, sto davvero parlando del prossimo futuro qui. Non sto parlando di 50 anni di distanza. Dio mi conceda la castità, ma non ora. Ma “non ora” non significa quando sono vecchio e grigio. Penso che potrebbe essere a breve termine. Non lo so. Potrei sbagliarmi. Ma penso che potrebbe essere una cosa a breve termine.Ezra Klein

Ma così, se ci pensi, mi sento come quello che stai descrivendo, per tornare a qualcosa di cui abbiamo parlato prima, che c’è stata questa funzione di passo per l’impatto sociale dell’IA, la curva delle capacità esponenziale, ma ogni tanto succede qualcosa, ChatGPT, ad esempio, Midjourney con le foto. E all’improvviso, molte persone lo sentono. Si rendono conto di quello che è successo e reagiscono. Lo usano. Lo distribuiscono nelle loro aziende. Ci investono, qualsiasi cosa.

E mi sembra che questa sia la struttura dell’economia politica che stai descrivendo qui. O succede qualcosa dove viene dimostrata la capacità di armi biologiche o viene dimostrata la capacità offensiva delle armi informatiche, e questo spaventa il governo, o forse succede qualcosa, giusto? Descrivere la prima guerra mondiale e la seconda guerra mondiale è che i tuoi esempi non mi hanno effettivamente riempito di conforto perché per piegare l’industria alla volontà del governo, in quei casi, dovevamo avere una vera e propria guerra mondiale. Non lo fa così facilmente.

Potresti usare il coronavirus, credo, come un altro esempio in cui c’è stata una catastrofe globale abbastanza significativa che aziende e governi e persino persone hanno fatto cose che non ti saresti mai aspettato. Ma gli esempi che abbiamo di questo accade sono qualcosa di terribile. Tutti quegli esempi finiscono con milioni di corpi. Non sto dicendo che sarà vero per l’IA, ma sembra che sia un’economia politica. No, non puoi immaginarlo ora, nello stesso modo in cui non avevi potuto immaginare esattamente il tipo di mondo pre e post-ChatGPT, ma che succede qualcosa e il mondo cambia. Tipo, è una funzione passo ovunque.

Dario Amodei Sì, voglio dire, penso che la mia versione positiva di questo, per non essere così – per allontanarsi un po’ dal desadanno e dall’oscurità, è che i pericoli sono dimostrati in un modo concreto che è davvero convincente, ma senza che accada qualcosa di veramente brutto, giusto? Penso che il modo peggiore per imparare sarebbe che succeda qualcosa di veramente brutto. E spero che ogni giorno ciò non accada, e impariamo senza sangue.

Ezra Klein Abbiamo parlato qui di limiti e curve concettuali, ma voglio, prima di finire, radicarci un po’ nella realtà fisica, giusto? Penso che se stai usando l’IA, può sembrare questi bit e byte digitali, seduti nel cloud da qualche parte.

Ma quello che è in modo fisico è un numero enorme di chip, data center, un’enorme quantità di energia, che si basano tutte su complicate catene di approvvigionamento. E cosa succede se succede qualcosa tra Cina e Taiwan, e i produttori di molti di questi chip vanno offline o vengono catturati? Cosa ne pensi della necessità della potenza di calcolo? E quando immagini i prossimi cinque anni, che aspetto ha quella catena di approvvigionamento? Come deve cambiare da dove è ora? E quali vulnerabilità esistono in esso?

Dario Amodei Sì, quindi uno, penso che questo possa finire per essere il più grande problema geopolitico del nostro tempo. E amico, questo si riferisce a cose che sono molto al di sopra del mio grado di retribuzione, che sono decisioni militari su se e come difendere Taiwan. Tutto quello che posso fare è dire quali sono le implicazioni per l’IA. Penso che queste implicazioni siano piuttosto forti. Penso che ci sia una grande domanda come, OK, abbiamo costruito questi modelli potenti.

Uno, c’è abbastanza offerta per costruirli? Due è il controllo su quell’offerta, un modo di pensare alle questioni di sicurezza o un modo di pensare all’equilibrio del potere geopolitico. E tre, se quei chip vengono utilizzati per costruire centri dati, dove saranno quei centri dati? Saranno negli Stati Uniti? Saranno in un alleato degli Stati Uniti? Saranno in Medio Oriente? Saranno in Cina?

Tutti questi hanno enormi implicazioni, e poi la catena di approvvigionamento stessa può essere interrotta. E le decisioni politiche e militari possono essere prese sulla base di dove sono le cose. Quindi mi sembra un problema incredibilmente appiccicoso. Non so di avere una grande intuizione su questo. Voglio dire, come cittadino degli Stati Uniti e qualcuno che crede nella democrazia, sono qualcuno che spera di poter trovare un modo per costruire centri dati e avere la più grande quantità di chip disponibili negli Stati Uniti e nei paesi democratici alleati.

Ezra Klein Beh, c’è qualche intuizione che dovresti avere su di esso, ovvero che sei un cliente qui, giusto? E così, cinque anni fa, le persone che producevano queste patatine non si rendevano conto di quale sarebbe stato il livello di domanda per loro. Voglio dire, quello che è successo ai prezzi delle azioni di Nvidia è davvero notevole.

Ma anche ciò che è implicito sul futuro dei prezzi delle azioni di Nvidia è davvero notevole. Rana Foroohar, il Financial Times, ha citato questa analisi di mercato. Ci vorrebbero 4.500 anni per i dividendi futuri di Nvidia per eguagliare il suo prezzo attuale, 4.500 anni. Quindi questa è una visione di quanto farà Nvidia nei prossimi due anni. È davvero abbastanza sorprendente.

Voglio dire, stai, in teoria, già lavorando o pensando a come lavorare sulla prossima generazione di Claude. Avrai bisogno di un sacco di patatine per questo. Stai lavorando con Amazon. Hai problemi a ottenere la quantità di calcolo di cui senti di aver bisogno? Voglio dire, ti stai già imbattendo in vincoli di approvvigionamento? O l’offerta è stata in grado di cambiare, di adattarsi a te?

Dario Amodei Siamo stati in grado di ottenere il calcolo di cui abbiamo bisogno per quest’anno, sospetto anche per il prossimo anno. Penso che una volta che le cose arrivano al 2026, 2027, 2028, allora la quantità di calcolo arriva a livelli che iniziano a mettere a dura prova le capacità dell’industria dei semiconduttori. L’industria dei semiconduttori produce ancora principalmente C.P.U., giusto? Solo le cose nel tuo laptop, non le cose nei data center che addestrano i modelli di A.I. Ma man mano che il valore economico delle GPU sale e sale a causa del valore dei modelli di IA, questo cambierà. Ma sai una cosa? Ad un certo punto, raggiungi i limiti di quello o raggiungi i limiti di quanto velocemente puoi passare. E così, ancora una volta, mi aspetto che ci sia una grande crisi di approvvigionamento intorno ai data center, intorno ai chip e intorno all’energia e all’energia sia per motivi normativi che fisici, nei prossimi anni. E questo è un rischio, ma è anche un’opportunità. Penso che sia un’opportunità per pensare a come la tecnologia può essere governata.

Ed è anche un’opportunità, ripeto ancora, di pensare a come le democrazie possono guidare. Penso che sarebbe molto pericoloso se i leader di questa tecnologia e i detentori delle risorse principali fossero paesi autoritari. La combinazione di A.I. e autoritarismo, sia internamente che sulla scena internazionale, è molto spaventosa per me.Ezra Klein

Che ne dici della questione dell’energia? Voglio dire, questo richiede solo un’enorme quantità di energia. E voglio dire, ho visto diversi numeri come questo fluttuare in giro. Potrebbe essere molto nei prossimi anni come aggiungere un Bangladesh al consumo energetico mondiale. Oppure scegli il tuo paese, giusto? Non so cosa userete esattamente tutti voi entro il 2028.

Microsoft, da sola, sta aprendo un nuovo centro dati a livello globale ogni tre giorni. Hai – e questo proviene da un articolo del Financial Times – proiezioni federali per 20 nuove centrali elettriche a gas negli Stati Uniti entro il 2024-2025. Si parla molto del fatto che questo sia ora una nuova era d’oro per il gas naturale perché ne abbiamo un sacco. C’è questo enorme bisogno di un nuovo potere per gestire tutti questi dati, per gestire tutto questo calcolo.

Quindi, uno, mi sembra che ci sia una domanda letterale su come si ottiene l’energia di cui hai bisogno e a quale prezzo, ma anche una questione più morale e concettuale di, abbiamo problemi reali con il riscaldamento globale. Abbiamo problemi reali con la quantità di energia che stiamo usando. E qui, stiamo decollando su questa curva davvero ripida di quanto sembriamo aver bisogno di dedicare alla nuova razza A.I.

Dario Amodei Si tratta davvero di, quali sono gli usi a cui viene fatto il modello, giusto? Quindi penso che il caso preoccupante sarebbe qualcosa come la criptovaluta, giusto? Sono qualcuno che non crede che qualunque sia l’energia che è stata utilizzata per estrarre il prossimo Bitcoin, penso che fosse puramente additivo. Penso che non ci fosse prima. E non sono in grado di pensare a nessuna cosa utile creata da questo.

Ma non credo che sia il caso dell’A.I. Forse l’A.I. rende l’energia solare più efficiente o forse risolve la fusione nucleare controllata, o forse rende la geoingegneria più stabile o possibile. Ma non credo che dobbiamo fare affidamento sul lungo periodo. Ci sono alcune applicazioni in cui il modello sta facendo qualcosa che una volta era automatizzato, che veniva fatto da sistemi informatici. E il modello è in grado di farlo più velocemente con meno tempo di calcolo, giusto? Quelle sono vittorie pure. E ce ne sono alcuni.

Ce ne sono altri in cui sta usando la stessa quantità di risorse informatiche o forse più risorse informatiche, ma per fare qualcosa di più prezioso che faccia risparmiare manodopera altrove. Poi ci sono casi in cui qualcosa veniva fatto dagli esseri umani o nel mondo fisico, e ora viene fatto dai modelli. Forse fa qualcosa che prima avevo bisogno di andare in ufficio per fare quella cosa. E ora non ho più bisogno di andare in ufficio per fare quella cosa.

Quindi non devo entrare in macchina. Non devo usare il gas che è stato usato per questo. La contabilizzazione energetica per questo è un po’ difficile. Lo paragoni al cibo che mangiano gli umani e a quale costa l’energia di produrlo.

Quindi, in tutta onestà, non credo che abbiamo buone risposte su quale frazione dell’utilizzo punta in un modo e una frazione dell’utilizzo punta ad altri. Per molti versi, quanto è diverso questo dal dilemma generale di, man mano che l’economia cresce, usa più energia?

Quindi immagino che quello che sto dicendo è che tutto importa come usi la tecnologia. Voglio dire, il mio tipo di risposta noiosa a breve termine è che otteniamo compensazioni di carbonio per tutte queste cose. Ma guardiamo oltre alla domanda macro qui.Ezra Klein

Ma per prendere l’altro lato, voglio dire, penso che la differenza, quando dici che questa è sempre una domanda che abbiamo quando stiamo crescendo G.D.P., è che non è proprio. È un cliché perché è vero dire che la principale sfida del riscaldamento globale in questo momento è che paesi come la Cina e l’India si arricchiscono. E vogliamo che divertino più ricchi. È un enorme imperativo umano, giusto, un imperativo morale per i poveri del mondo diventare meno poveri. E se questo significa che usano più energia, allora dobbiamo solo capire come farlo funzionare. E non conosciamo un modo per farlo senza che usino più energia.

L’aggiunta di A.I. non è che sollevi una serie di domande completamente diversa, ma stiamo già sforzando i confini, o forse ben oltre, di ciò che possiamo fare energicamente in modo sicuro. Ora aggiungiamo questo, e quindi forse alcuni dei guadagni di efficienza energetica che otterrai nei paesi ricchi vengono spazzati via. Per questo tipo di payoff incerto in futuro di forse attraverso l’IA, scopriamo modi per stabilizzare la fusione nucleare o qualcosa del genere, giusto, potresti immaginare modi che potrebbero aiutare, ma quei modi sono teorici.

E nel breve termine, il danno in termini di consumo di energia è reale. E anche, tra l’altro, il danno in termini di prezzi dell’energia. È anche complicato perché tutte queste aziende, Microsoft, Amazon, voglio dire, hanno tutte molti obiettivi di energia rinnovabile. Ora, se questo è in collisione con i loro incentivi di mercato, sembra che stiano correndo molto velocemente verso gli incentivi di mercato senza una risposta su come tutto questo funziona.Dario Amodei

Sì, voglio dire, penso che le preoccupazioni siano reali. Permettetemi di respingere un po’, il che è, ancora una volta, non credo che i benefici siano puramente in futuro. In un certo senso risale a quello che ho detto prima. Ad esempio, ci possono essere casi d’uso ora che sono risparmio energetico netto, o che nella misura in cui non sono risparmio energetico netto, lo fanno attraverso il meccanismo generale di, oh, c’era più domanda per questa cosa.

Non credo che nessuno abbia fatto un buon lavoro di misurazione, in parte perché le applicazioni dell’IA sono così nuove, quale di quelle cose domina o cosa succederà all’economia. Ma non credo che dovremmo presumere che i danni siano interamente nel presente e i benefici siano interamente nel futuro. Penso che sia il mio unico punto qui.

Ezra Klein Immagino che tu possa immaginare un mondo in cui eravamo, in un modo o nell’altro, incentivando gli usi dell’IA che erano apposta a qualche tipo di scopo sociale. Stavamo mettendo molto di più nella scoperta della droga, o ci importava molto delle cose che rendevano più facile il lavoro a distanza, o sceglievamo il tuo set di beni pubblici.

Ma quello che in realtà mi sembra che stia accadendo è che stiamo costruendo modelli sempre più potenti e li stiamo semplicemente lanciando là fuori all’interno di una struttura di termini di servizio per dire, usali finché non stai cercando di manipolare politicamente le persone o creare un’arma biologica. Prova a capirlo, giusto? Prova a creare nuove storie e chiedi loro della tua vita personale, e crea un videogioco con esso. E Sora esce prima o poi. Crea nuovi video con esso. E tutto questo sarà molto intenso dal punto di vista energetico.

Non sto dicendo che ho un piano per mettere l’IA al bene sociale, e in qualche modo, puoi immaginare che vada molto, molto male. Ma significa che per molto tempo, è come se potessi immaginare il mondo di cui stai parlando, ma ciò richiederebbe una sorta di pianificazione in cui nessuno è impegnato, e non credo che nessuno voglia nemmeno essere coinvolto.

Dario Amodei Non tutti hanno la stessa concezione del bene sociale. Una persona può pensare che il bene sociale sia questa ideologia. Un’altra persona – l’abbiamo visto con alcune delle cose dei Gemelli.

Ezra Klein Giusto.

Dario Amodei Ma le aziende possono cercare di fare da sole applicazioni benefiche, giusto? Questo è il motivo per cui stiamo lavorando con gli istituti oncologici. Speriamo di collaborare con i ministeri dell’istruzione in Africa, per vedere se possiamo utilizzare i modelli in modo positivo per l’istruzione, piuttosto che nel modo in cui possono essere utilizzati per impostazione predefinita. Quindi penso che le singole aziende, le singole persone, possano intraprendere azioni per guidare o piegare questo verso il bene pubblico.

Detto questo, non sarà mai il caso che il 100% di ciò che facciamo sia quello. E quindi penso che sia una buona domanda. Quali sono gli incentivi sociali, senza dettare l’ideologia o definire il bene pubblico dall’alto, quali sono gli incentivi che potrebbero aiutare in questo?

Nemmeno io mi sento come se avessi una risposta sistemica. Posso solo pensare in termini di ciò che Anthropic cerca di fare.

Ezra Klein Ma c’è anche la questione dei dati di formazione e della proprietà intellettuale che sta andando in cose come Claude, come GPT, come Gemini. Ci sono una serie di cause legali sul copyright. Stai affrontando qualcuno. OpenAI sta affrontando alcuni. Sospetto che tutti li stiano affrontando ora o li affronteranno.

E un’ampia sensazione che questi sistemi vengano addestrati sulla produzione intellettuale combinata di molte persone diverse – il modo in cui Claude può imitare abbastanza efficacemente il modo in cui scrivo è che è stato addestrato, in una certa misura, sulla mia scrittura, giusto? Quindi in realtà ottiene abbastanza bene i miei tic stilistici. Sembri fantastico, ma non mi hai mandato un assegno su questo. E questo sembra un posto dove c’è un reale rischio di responsabilità per l’industria. Tipo, e se dovessi effettivamente compensare le persone su cui questo viene addestrato? E dovresti?

E riconosco che probabilmente non puoi commentare le cause legali stesse, ma sono sicuro che hai dovuto pensarci molto. E così, sono curioso sia di come lo capisci come un rischio, ma anche di come lo capisci moralmente. Voglio dire, quando parli delle persone che inventano questi sistemi che guadagnano molto potere, e oltre a questo, molta ricchezza, beh, che dire di tutte le persone il cui lavoro è entrato in loro in modo tale da poter creare immagini in un milione di stili diversi? E voglio dire, qualcuno ha mento in mente quegli stili. Qual è la responsabilità dei beni comuni intellettuali? E non solo ai beni comuni, ma ai salari effettivi e alle prospettive economiche delle persone che hanno reso possibile tutto questo?

Dario Amodei Penso che tutti siano d’accordo che i modelli non dovrebbero produrre testualmente contenuti protetti da copyright. Per le cose che sono disponibili sul web, per disponibili pubblicamente, la nostra posizione – e penso che ci sia un caso forte per questo – è che il processo di formazione, ancora una volta, non pensiamo che stia solo sputando contenuti e sputando, o non dovrebbe sputandolo. È davvero molto più simile al processo di come un essere umano impara dalle esperienze. E così, la nostra posizione che questo è sufficientemente trasformativa, e penso che la legge lo sosterrà, che questo è un uso equo.

Ma questi sono modi legali ristretti per pensare al problema. Penso che abbiamo un problema più ampio, che è che indipendentemente da come è stato addestrato, sarebbe ancora il caso che stiamo costruendo sistemi cognitivi sempre più generali e che quei sistemi creeranno interruzioni. Forse non necessariamente uno per uno che sostituisce gli esseri umani, ma cambieranno davvero il modo in cui funziona l’economia e quali competenze sono apprezzate. E abbiamo bisogno di una soluzione a questo ampio problema macroeconomico, giusto?

Per quanto abbia affermato i punti legali ristretti che ho affermato prima, abbiamo un problema più ampio qui, e non dovremmo essere ciechi a questo. Ci sono una serie di soluzioni. Voglio dire, penso che il più semplice, che riconosco non affronta alcuni dei problemi più profondi qui, sia le cose intorno al tipo di lato del reddito di base garantito delle cose.

Ma penso che ci sia una domanda più profonda qui, che è come se i sistemi di A.I. diventano capaci di fette sempre più grandi di lavoro cognitivo, come si organizza economicamente la società? Come fanno le persone a trovare lavoro e significato e tutto il modo?

E proprio come il tipo di transizione da una società agraria a una società industriale e il significato del lavoro è cambiato, e non era più vero che il 99% delle persone erano contadini che lavoravano nelle fattorie e dovevano trovare nuovi metodi di organizzazione economica, sospetto che ci sia un diverso metodo di organizzazione economica che sarà forzato come l’unica possibile risposta alle interruzioni dell’economia che all’inizio sarà piccola, ma crescerà nel tempo, e che non abbiamo capito di cosa si tratta.

Dobbiamo trovare qualcosa che permetta alle persone di trovare un significato umano e che massimizzi la nostra creatività e il nostro potenziale e che fiorisca dall’IA.

E come per molte di queste domande, non ho la risposta. Giusto? Non ho una prescrizione. Ma è quello che in qualche modo dobbiamo fare.

Ezra Klein Ma voglio sedermi tra la risposta legale ristretta e l’ampia risposta “dobbiamo riorganizzare completamente la società”, anche se penso che quella risposta sia effettivamente possibile nel corso dei decenni. E in mezzo a questo c’è una domanda più specifica. Voglio dire, potresti anche prenderlo dal lato strumentale. C’è molto sforzo ora per costruire prodotti di ricerca che utilizzano questi sistemi, giusto? ChatGPT utilizzerà Bing per cercarti.

E questo significa che la persona non sta andando su Bing e cliccando sul sito web in cui ChatGPT sta ottenendo le sue informazioni e dando a quel sito web un’impressione pubblicitaria che può trasformarsi in una piccolissima quantità di denaro, o non sta andando su quel sito web e avendo un’esperienza davvero buona con quel sito web e diventando forse più probabile a iscriversi a chiunque sia dietro quel sito web.

E così, da un lato, sembra una sorta di ingiustizia fatta alle persone che creano le informazioni che questi sistemi stanno usando. Voglio dire, questo è vero per la perplessità. È vero per molte cose che sto iniziando a vedere in giro dove gli A.I. sono addestrati o stanno usando molti dati che le persone hanno generato a un costo reale. Ma non solo non stanno pagando le persone per questo, ma in realtà stanno entrando nel mezzo di dove normalmente sarebbero una relazione diretta e facendo in modo che la relazione non accada mai.

Anche questo, penso, a lungo termine, crei un problema di dati di formazione, anche se vuoi solo guardarlo strumentalmente, dove se diventa non fattibile fare giornalismo o fare molte cose per creare informazioni di alta qualità là fuori, la capacità dell’IA, giusto, la capacità di tutte le tue aziende di ottenere informazioni di alta qualità, aggiornate e costantemente aggiornate diventa molto più complicata. Quindi entrambi mi sembrano essere sia una dimensione morale che egoista in questo.Dario Amodei

Sì, quindi penso che ci possano essere modelli di business che funzionano per tutti, non perché sia illegittimo allenarsi sui dati aperti dal web in senso legale, ma solo perché qui potrebbero esserci modelli di business che offrono un prodotto migliore. Quindi le cose a cui sto pensando sono come se i giornali avessero archivi. Alcuni di loro non sono disponibili al pubblico. Ma anche se lo sono, potrebbe essere un prodotto migliore, forse un’esperienza migliore, per, dire, parlare con questo giornale o parlare con quel giornale.

Può essere un’esperienza migliore per dare la possibilità di interagire con il contenuto e indicare luoghi nel contenuto, e ogni volta che chiami quel contenuto, avere una sorta di relazione commerciale con i creatori di quel contenuto. Quindi qui potrebbero esserci modelli di business che propagano il valore nel modo giusto, giusto? Parli di LLM che usano i prodotti di ricerca. Voglio dire, certo, stai andando in giro per gli annunci, ma non c’è motivo per cui non possa funzionare in modo diverso, giusto?

Non c’è motivo per cui gli utenti non possano pagare la ricerca A.P.I.s, invece di essere pagata attraverso la pubblicità, e poi farle propagare ovunque sia il meccanismo originale che ha pagato i creatori del contenuto. Quindi, quando si crea valore, il denaro può fluire.Ezra Klein

Permettetemi di provare a finire chiedendo un po’ su come vivere sul pendio della curva su cui credi che ci sia. Ha dei bambini?

Dario Amodei Sono sposato. Non ho figli.

Ezra Klein Quindi ho due figli. Ho un bambino di due anni e un bambino di cinque anni. E in particolare quando faccio rapporti A.I., mi siedo davvero a letto di notte e penso, cosa dovrei fare qui con loro? Per che mondo sto cercando di prepararli? E ciò che è necessario in quel mondo che è diverso da ciò che è necessario in questo mondo, anche se credo che ci sia una certa possibilità – e credo che ci sia qualche possibilità – che tutte le cose che stai dicendo siano vere. Ciò implica una vita molto, molto, molto diversa per loro.

Conosco persone nella tua azienda con bambini. So che ci stanno pensando. Cosa ne pensi? Voglio dire, cosa pensi che dovrebbe essere diverso nella vita di un bambino di due anni che sta vivendo il ritmo del cambiamento che mi stai dicendo è vero qui? Se avessi un figlio, come cambierebbe il modo in cui ci pensi?

Dario Amodei La risposta molto breve è, non lo so, e non ne ho idea, ma dobbiamo provare comunque, giusto? Le persone devono crescere i figli, e devono farlo nel miglior modo possibile. Una raccomandazione ovvia è solo la familiarità con la tecnologia e come funziona, giusto? Il paradigma di base di, sto parlando con i sistemi, e i sistemi stanno agindo per mio conto, ovviamente, la massima familiarità possibile con questo è, penso, utile.

In termini di cosa dovrebbero imparare i bambini a scuola, quali sono le carriere di domani, non lo so davvero, giusto? Potresti prendere questo per dire, beh, è importante imparare STEM e programmazione e A.I. e tutto il to. Ma l’IA avrà un impatto anche su questo, giusto? Non credo che niente di tutto ciò sarà –

Ezra Klein Forse prima.

Dario Amodei Sì, giusto, forse prima.

Ezra Klein Sembra meglio a codificare che ad altre cose.

Dario Amodei Non credo che funzionerà per nessuno di questi sistemi fare solo uno per uno quello che gli umani faranno. Non la penso proprio così. Ma penso che possa cambiare radicalmente le industrie e le professioni una per una in modi difficili da prevedere. E così, mi sento come se avessi solo cliché qui. Come familiarizzare con la tecnologia. Insegna ai tuoi figli ad essere adattabili, ad essere pronti per un mondo che cambia molto rapidamente. Vorrei avere risposte migliori, ma penso che sia il meglio che ho ottenuto.

Ezra Klein Sono d’accordo che non è una buona risposta. [RIDE] Lasciami fare la stessa domanda un po’ da un’altra direzione, perché una cosa che hai appena detto è familiarizzare con la tecnologia. E più tempo passo con la tecnologia, più temo che accada. Quello che vedo quando le persone usano l’IA intorno a me è che la cosa ovvia che la tecnologia fa per te è automatizzare le prime parti del processo creativo. La parte in cui dovresti leggere qualcosa di difficile da solo? Beh, l’IA può riassumerlo per te. La parte in cui dovresti sederti lì con una pagina vuota e scrivere qualcosa? Beh, l’IA può darti una prima bozza. E più tardi, devi controllarlo e assicurarti che abbia effettivamente fatto quello che volevi che facesse e verificarlo. E ma credo che molto di ciò che rende gli umani bravi a pensare arrivi in quelle parti.

E sono più vecchio e ho autodisciplina, e forse questo sono solo io che mi aggrappa a un vecchio modo di farlo, giusto? Si potrebbe dire, perché usare una calcolatrice da questa prospettiva. Ma la mia vera preoccupazione è che non sono sicuro se la cosa che dovrebbero fare è usare molto l’IA o usarla un po’. Questo, per me, è in realtà un percorso di ramificazione davvero grande, giusto? Voglio che i miei figli imparino a usare l’IA o siano in un contesto in cui lo usano molto, o in realtà, voglio proteggerli il più possibile in modo che sviluppino più capacità di leggere un libro tranquillamente da soli o scrivere una prima bozza? In realtà non lo so. Sono curioso di sapere se hai una visione su di esso.Dario Amodei

Penso che questo faccia parte di ciò che rende complicata l’interazione tra l’IA e la società, dove a volte è difficile distinguere quando un’IA fa qualcosa, risparmiandoti lavoro o fatica, rispetto a fare la parte interessante. Dirò che più e più volte, otterrai una cosa tecnologica, un sistema tecnologico che fa quello che pensavi fosse il nucleo di quello che stai facendo, eppure, quello che stai facendo si rivela avere più pezzi di quanto pensi e si aggiunge a più cose, giusto?

È come prima, dovevo chiedere indicazioni. Ho preso Google Maps per farlo. E potresti preoccuparti, sono troppo dipendente da Google Maps? Mi dimentico dell’ambiente circostante? Beh, si scopre che, in un certo senso, ho ancora bisogno di avere un senso della città e dell’ambiente che mi circonda. In qualche modo rialloca lo spazio nel mio cervello a qualche altro aspetto del compito.

E sono solo un po’ sospetto – non lo so. Internamente, all’interno di Anthropic, una delle cose che faccio che mi aiuta a gestire l’azienda è che scriverò questi documenti sulla strategia o semplicemente qualche pensiero in qualche direzione che altri non hanno pensato. E naturalmente, a volte uso i modelli interni per questo. E penso che quello che ho trovato sia, sì, a volte sono un po’ bravi a concettualizzare l’idea, ma l’effettiva genesi dell’idea, ho appena trovato un flusso di lavoro in cui non li uso per questo. Non sono così utili per questo. Ma sono utili per capire come formulare una certa cosa o come perfezionare le mie idee.

Quindi forse sto solo dicendo – non lo so. Trovi solo un flusso di lavoro in cui la cosa ti completa. E se non succede naturalmente, in qualche modo succede ancora alla fine. Ancora una volta, se i sistemi diventano abbastanza generali, se diventano abbastanza potenti, potremmo aver bisogno di pensare su altre linee. Ma a breve termine, io, almeno, l’ho sempre trovato. Forse è troppo ottimista. Forse è troppo ottimista.

Ezra Klein Penso, quindi, che sia un buon posto per porre fine a questa conversazione. Anche se, ovviamente, la curva esponenziale continua. Quindi sempre la nostra domanda finale: quali sono i tre libri che consiglieresti al pubblico?

Dario Amodei Quindi, sì, ne ho preparati tre. Sono tutti di attualità, però, in alcuni casi, indirettamente. Il primo sarà ovvio. È un libro molto lungo. Il libro fisico è molto spesso, ma “The Making of the Atomic Bomb”, Richard Rhodes. È un esempio di tecnologia che si sviluppa molto rapidamente e con implicazioni molto ampie. Solo guardando attraverso tutti i personaggi e come hanno reagito a questo e come le persone che erano fondamentalmente scienziati si sono gradualmente resero conto delle incredibili implicazioni della tecnologia e di come li avrebbe portati in un mondo molto diverso da quello a cui erano abituati.

La mia seconda raccomandazione è una serie di fantascienza, la serie di libri “The Expanse”. Quindi inizialmente ho guardato lo spettacolo, e poi ho letto tutti i libri. E il mondo che crea è molto avanzato. In alcuni casi, ha una durata di vita più lunga e gli esseri umani si sono espansi nello spazio. Ma affrontiamo ancora alcune delle stesse domande geopolitiche e alcune delle stesse disuguaglianze e sfruttamenti che esistono nel nostro mondo, sono ancora presenti, in alcuni casi, peggio.

Questo è tutto lo sfondo.

E il nucleo di esso riguarda un oggetto tecnologico fondamentalmente nuovo che viene portato in quel mondo e come tutti reagiscono ad esso, come i governi reagiscono ad esso, come le singole persone reagiscono ad esso e come le ideologie politiche reagiscono ad esso. E così, non lo so. Quando l’ho letto qualche anno fa, ho visto molti paralleli.

E poi la mia terza raccomandazione sarebbe in realtà “The Guns of August”, che è fondamentalmente una storia di come è iniziata la prima guerra mondiale. L’idea di base che le crisi accadono molto velocemente, quasi nessuno sa cosa sta succedendo. Ci sono molti errori di calcolo perché ci sono esseri umani al centro, e in qualche modo, in qualche modo dobbiamo imparare a fare un passo indietro e prendere decisioni più sagge in questi momenti chiave. Si dice che Kennedy abbia letto il libro prima della crisi missilistica cubana. E quindi spero che i nostri attuali responsabili politici stiano almeno pensando secondo gli stessi termini perché penso che sia possibile che crisi simili possano arrivare sulla nostra strada.

Ezra Klein Dario Amodei, grazie mille.

Dario Amodei Grazie per avermi invito.

30/03/24 Zafferano.news: Cosa e come chiedere a ChatGPT ed altri LLM

Riprendo alcuni consigli per l’uso di ChatGPT e suoi compagni, gli altri LLM: la raccomandazione è di stare molto attenti non solo ai modelli fondamentali, come appunto ChatGPT, Llama2 e concorrenti, ma anche agli agenti AI che seguono i processi.

Oggi, la maggior parte degli utenti degli LLM fa una domanda secca: mi scrivi un contratto per questa circostanza, mi fai il riassunto di questo libro, mi riscrivi questo pezzo come se tu fossi Dante, e via dicendo. In pochi secondi il robot vi tira fuori il pezzo richiesto e voi andate di lima e cesello: in poco tempo, a seconda della lunghezza del testo, lo completate in modo professionale. Questo modo di usare gli LLM si chiama zero-shot, nel senso che gli chiedete di darvi il risultato al primo colpo.

Pensate di chiedere ad una persona di fare lo stesso: di essere in grado al primo colpo di scrivere tutto al volo, correttamente. Non lo fareste mai, neanche aveste uno scrittore professionista davanti: non è possibile. Che si tratti di un contratto, romanzo o traduzione, ognuno di noi deve fare mente locale, deve pensare a cosa dire prima e dopo, quali ricerche fare, e deve rivedere il testo più volte prima di prenderlo per buono. Vi ho già detto che Stephen King, tra gli scrittori più prolifici, al massimo produce 13 pagine al giorno. 

Ecco la raccomandazione: invece di pretendere una risposta definitiva alla prima richiesta, ordinate all’LLM di lavorare in modo ordinato. Chiedetegli di definire uno schema logico del testo, e dopo che l’avete di fronte agli occhi chiedetegli di decidere quali ricerche vanno approfondite su internet, e poi solo a quel punto di scrivervi una bozza. 

Adesso la cosa divertente: invece di esser voi a leggere la prima sgrossatura e correggerla, comandate lo schiavetto elettronico di farlo per voi, ossia sia lui stesso a rileggere la sua bozza e correggersela. Chiedetegli di trovare in punti deboli nel logos, nel pathos, nell’ethos, e di metterli a posto. Potete immaginare ulteriori passi del processo di scrittura, prima di chiedergli di consegnarvi la versione definitiva. 

Questo processo iterativo è tanto efficace per lo scrittore professionista quanto lo è per questi ranocchi elettronici, ed un bel modo di vederlo è con Devin, il nuovo progettista software robotizzato (qui). Se chiedete a ChatGPT di scrivere software al primo colpo, lo fa correttamente tra il 48% dei casi per ChatGPT 3.5 ed il 67% per ChatGPT 4.0, ma se gli chiedete di seguire il processo di sviluppo software come appunto può fare Devin, le percentuali di correttezza passano rispettivamente a 95.1% e 98.9%. 

In pratica possiamo chiedere agli LLM di riflettere su quanto hanno appena fatto, e migliorarlo. Se poi gli mettiamo a disposizione degli strumenti come la ricerca su internet, la possibilità di eseguire del codice e di processare dei dati, abbiamo uno strumento particolarmente importante. Un LLM che riesca a pianificare i diversi passi necessari a creare un testo, un brano o un programma SW, e che poi si sposta alla ricerca delle fonti migliori, per poi creare una bozza, testarla e migliorarla fino alla versione definitiva, dà il miglioramento di produttività che l’uso one-shot non può dare. 

Infine, questi LLM possono essere messi assieme, in squadra, come una redazione, o uno studio di avvocati, ma avatar digitali: cosa potrà mai andar storto? Buon divertimento.


09/03/2024 Zafferano.news: Allucinazioni digitali:

Appena è uscito ChatGPT, ho detto chiaramente che gli LLM sono fatti per scrivere bene, in modo convincente, e non per dire la cosa giusta, la verità. Uno strumento perfetto per scrivere bozze di documenti rapidamente, traduzioni e libri, per convincere un paziente a seguire una dieta con dovizia di particolari e stile persuasivo, ma assolutamente da evitare per fare una diagnosi o risolvere un problema, per esempio. 

Visto che gli LLM son progettati per parlar bene e non per collegare correttamente i loro risultati ai fatti conosciuti, sentite spesso parlare di “allucinazioni” per indicare che han detto il falso.

Questi termini antropomorfici non sono corretti: non è che il robot si sia bevuto un litro di grappa, o assunto droghe illecite, o sia un bugiardo patentato, o i suoi neuroni elettronici facciano le bizze come in un paziente schizofrenico. Molto semplicemente ha elaborato un risultato plausibile e logico, poi il fatto che è falso non lo tange. Di recente una cliente di Air Canada ha chiamato il call center impanicata: causa lutto in famiglia doveva saltare sul primo aereo, al prezzo carissimo del biglietto in quell’istante. Ha chiesto se ci fosse uno sconto per viaggi in caso di lutto, cosa che in effetti alcune compagnie aeree offrono ai loro clienti abituali. Il robot che le ha risposto ha seguito la logica della signora nel fare la domanda: trattandosi di un lutto in famiglia, appare giusto che il biglietto possa esser scontato per venire incontro al cliente nel momento dell’emergenza. Peccato che Air Canada non preveda questo caso, e documenta il divieto anche nelle sue procedure interne. LLM, che aveva “studiato” le procedure, ha comunque dato la risposta sbagliata, dicendo quello che la signora voleva sentirsi dire. In tribunale gli avvocati della linea aerea han provato a dire che la signora non poteva fidarsi di un LLM, lo sanno anche i bambini che allucinano, mentono. Per fortuna il giudice ha bastonato gli avvocati di parte, ed alla signora saranno riconosciuti sia lo sconto, sia le spese processuali.

Se ChatGPT allucina nel 3% delle sue risposte, Gemini nell’8% ed una schiera di programmatori e modellatori lavora alacremente per ridurre ancora questa difettosità, anche noi possiamo aiutare il robot a comportarsi meglio, ad esempio chiedendogli di pensarci bene prima di rispondere, domandando se è veramente sicuro di quello che dice, facendogli la stessa domanda con parole diverse. In questo processo emerge la vera creatività degli LLM, qualcosa che possiamo usare a nostro vantaggio.

Possiamo distinguere alcuni tipi diversi di creatività, ed in tutti casi possiamo comandare al robot che ci aiuti in questo. Uno è immaginare un uso alternativo di cose o concetti abituali, sforzare noi stessi e la macchina a pensare per similitudini e metafore. Un altro è fargli immaginare le conseguenze di scenari ipotetici, in modo da sviluppare alternative mai pensate prima. Altro ancora è chiedergli di generare una lista di parole sconnesse tra loro, ed immaginare come sarebbe possibile collegarle, specialmente in modo visivo.

In un recentissimo studio fatto con 150 partecipanti e ChatGPT, abbiamo visto che la performance cognitiva, paragonata tra persone e robot, è identica. La nostra capacità di sviluppare nuovi utilizzi per qualche cosa, nuovi concetti, di capire gli impatti delle ipotesi fatte, di visualizzare nuovi legami tra concetti, in pratica di fare quel brainstorming che tanto spesso si fa per risolvere problemi e creare nuove soluzioni, è in linea con la macchina, che può lavorare con noi senza problemi. Mai da sola.


27/11/23 Corriere Economia: OPEN AI: ETICA VS BUSINESS LA BATTAGLIA DEI 5 GIORNI

Di Massimo Gaggi


È sta­ta mol­to di più di una sa­ga, è il pri­mo scon­tro, tut­to nel­la Si­li­con Val­ley, sull’ani­ma di­gi­ta­le del mon­do che ver­rà. E ha vin­to il par­ti­to di quel­li che vo­glio­no ac­ce­le­ra­re lo svi­lup­po com­mer­cia­le di Cha­tgpt Ma si de­li­nea in­sie­me an­che un qua­dro di nuove regole

I cinque giorni dello scontro per il controllo di Openai, la società apripista dell’intelligenza artificiale generativa, diventeranno probabilmente un serial tv appassionante per i continui colpi di scena e l’alternarsi sul palcoscenico di molti personaggi diversissimi tra loro. Ma ora, man mano che la nuvola di polvere si deposita al suolo, diventa sempre più chiaro che quella di OpenAI è stata molto più di una saga: una battaglia — forse solo la prima di una serie — per la conquista dell’anima digitale dell’umanità, prima ancora che del controllo di un’azienda che ha in tasca le chiavi delle industrie del futuro.

Le tappe dello scontro — l’improvviso licenziamento del fondatore e capo della società dell’AI generativa, padre di CHATGPT, la rivolta di finanziatori e clienti di OpenAI, Sam Altman richiamato per negoziare il suo rientro, il fallimento della trattativa, la minaccia dei dipendenti di abbandonare in massa l’azienda trasformandola in un guscio vuoto, la capitolazione dei membri del board col ritorno di Altman — le abbiamo raccontate quotidianamente sul Corriere.

Venerdì 17

Ora vale la pena concentrarsi sul primo fotogramma di questo film: venerdì 17, quando a mezzogiorno si collega in videoconferenza coi membri del cda, Altman non sospetta nulla: è a Las Vegas dove sta seguendo le prove del Gran premio di Formula Uno. La comunicazione del suo licenziamento è, per lui, un fulmine. Ma non un fulmine a ciel sereno.

I suoi rapporti con alcuni membri del board si sono gradualmente deteriorati nell’ultimo anno: tutto è cominciato il 30 novembre 2022 col lancio di CHATGPT. Una scossa elettrica per l’economia digitale e per tutto il mondo della conoscenza. Ma una scossa anche per il vertice dell’azienda.

OpenAI non è un’impresa “normale”. E Altman non è un imprenditore tradizionale. Ha sempre mostrato sensibilità sociale e politica. Voleva fare il governatore della California, ma poi ha scelto un’altra missione: sviluppare l’intelligenza artificiale governando in modo etico una tecnologia capace di raggiungere e superare le capacità umane. E, non volendo ripetere il percorso di Google, passata dall’idealismo al turbocapitalismo una volta in Borsa, fonda il laboratorio di ricerca OpenAI non come impresa commerciale, ma come società filantropica.

Ma l’addestramento dell’intelligenza artificiale costa caro. Servono finanziamenti imponenti che la filantropia non può assicurare. Così nel 2019 Altman affianca al laboratorio una società commerciale: Microsoft entra al 49% con un miliardo di dollari. Per non tradire l’intento filantropico, Altman lascia la OpenAI commerciale sotto il controllo di quella no profit.

Che la Silicon Valley stia inseguendo un’altra delle sue utopie emerge chiaramente col lancio di CHATGPT. Altman, eccitato dal suo straordinario e imprevisto successo, spinge per accelerare la corsa verso il raggiungimento dell’AGI, l’intelligenza artificiale di capacità analoghe o superiori a quelle dell’uomo. Sa che ci sono rischi, propone regole, ma vuole soprattutto mantenere il primato.

Il board della no profit (6 membri) è spaccato: tre consiglieri — le ricercatrici Helen Toner e Tasha Mccauley e l’imprenditore Adam D’angelo — sono seguaci della filosofia dell’effective altruism: una corrente di pensiero, diffusa nella Silicon Valley, che spinge a usare le risorse e la tecnologia per massimizzare, in modo misurabile, i benefici per l’umanità.

Altman sottovaluta il malessere di mezzo consiglio e continua sfornare derivati commerciali di CHATGPT, GPT4 e la versione grafica Dall-e: pensa che alla fine questi «frenatori» (o doomers, quelli che temono catastrofi) avranno un ruolo di coscienza critica poco più che decorativo. Il futuro è dei boomers: quelli che vogliono accelerare.

Nel board, però, c’è un quarto consigliere, Ilya Sutskever, che è anche il capo degli scienziati di OpenAI e un suo cofondatore. Ilya non aderisce all’effective altruism, ma ne condivide i principi. Da scienziato è eccitato dai progressi della tecnologia — le principali scoperte di OpenAI portano la sua firma — ma è anche terrorizzato dai rischi di abusi. Da sempre intimo di Altman, nell’ultimo anno Ilya ha preso a criticarlo: è ossessionato dai pericoli della tecnologia che lui stesso sta creando. Mette addirittura in scena una sorta di rito pagano: chiede a un artista di intagliare una figura di legno che rappresenti l’intelligenza fuori controllo. Poi, durante una festa dei dipendenti, la brucia in un caminetto.

Equilibri

Secondo a Reuters alla vigilia della rottura il consiglio riceve da alcuni ricercatori una lettera nella quale si avverte che un nuovo filone di ricerca chiamato Progetto Q* (o Q star) promette di dare un’accelerazione improvvisa al progresso già rapido dell’AI. Alla capacità di elaborare il linguaggio si sta aggiungendo quella di risolvere problemi matematici sempre più complessi: L’AGI forse è a portata di mano. Il resto è cronaca dei giorni scorsi. Quattro consiglieri che licenziano Altman senza rendersi conto delle disastrose conseguenze di una mossa che getta nel caos l’azienda leader dell’intelligenza artificiale. La minaccia di una OpenAI ridotta a un guscio vuoto. Il ritorno di Altman, l’azzeramento del vecchio consiglio.

Cosa accadrà ora? Nella partita tra doomers e boomers l’equilibrio si è spostato a favore di questi ultimi. Altman ha chiarito che rientra per rafforzare l’alleanza con Microsoft: ha investito 13 miliardi in Microsoft e, dopo il grande spavento, vuole contare di più. La governance di Openai cambierà: nel futuro consiglio di nove membri probabilmente ci saranno anche Altman e Microsoft. Per ora, però, nel board emergenziale di soli tre consiglieri che dovrà riorganizzare l’azienda dopo aver svolto un’inchiesta, affidata a investigatori indipendenti, su quanto accaduto, Sam e il gigante di Seattle non ci sono. Insieme all’ex ministro del Tesoro Larry Summers e all’ex co-ceo di Salesforce Bret Taylor c’è, invece, Adam D’angelo, uno dei congiurati. E c’è la ferita da rimarginare con Sutskever: è un “frenatore” e ha tradito Altman, ma è anche un genio le cui idee sono state il principale carburante dei progressi di OpenAI.

L’utopia filantropica è tramontata ma il partito dell’AI etica spera ancora di avere uno spazio perché stavolta la posta va oltre i confini del mondo del business. E, per la prima volta, si è mosso con decisione anche il governo con l’ordine esecutivo di Biden e l’elaborazione di un sistema di regole.


26/11/23 Barron’s: L’AI creerà e distruggerà lavori. La storia ci offre una lezione.

Di Kenneth G. Pringle

L’umanità è affascinata dall’intelligenza artificiale da qualche tempo. In “L’Iliade”, Omero ha descritto robot simili a umani. Sopra, il robot immaginario nell’adattamento cinematografico di Fritz Lang del 1927 del romanzo di Thea von Harbou “Metropolis”. 

L’ascesa dell’intelligenza artificiale generativa preannuncia una nuova fase della rivoluzione industriale, in cui le macchine pensano, imparano, si auto-replicano e possono padroneggiare molti compiti che una volta erano riservati agli esseri umani. Questa fase sarà altrettanto dirompente e trasformativa come le precedenti.

Che la tecnologia AI arriverà per i posti di lavoro è certo. La distruzione e la creazione di posti di lavoro è una caratteristica distintiva della rivoluzione industriale. Meno certo è che tipo di nuovi posti di lavoro, e quanti, prenderanno il loro posto.

Alcuni studiosi dividono la rivoluzione industriale in tre fasi: vapore, iniziato intorno al 1770; elettricità, nel 1870; e informazione nel 1950. Pensa all’industria automobilistica che ha sostituito il commercio di cavalli e carrozze nei primi decenni del 20° secolo, o ai dipartimenti IT che hanno soppiantato i pool di segreteria negli ultimi decenni.

In tutti questi casi, alcune persone vengono lasciate indietro. I nuovi posti di lavoro possono essere di natura molto diversa, richiedendo nuove competenze e forse un trasferimento, come dalla fattoria alla città nella prima rivoluzione industriale.

Poiché le azioni delle aziende coinvolte nel settore dell’AI sono aumentate vertiginose, le preoccupazioni per la sicurezza del lavoro sono cresciute . L’AI sta trovando la sua strada in tutti gli aspetti della vita, dai chatbot alla chirurgia ai droni sul campo di battaglia. L’AI è stata al centro delle controversie sindacali di più alto profilo di quest’anno, coinvolgendo industrie disparate come i produttori di automobili di Detroit e gli sceneggiatori di Hollywood. L’AI era all’ordine del giorno del recente vertice tra il presidente Joe Biden e il presidente cinese Xi Jinping.

I progressi nella tecnologia AI stanno arrivando velocemente, con alcuni che prevedono la “singolarità “—il punto teorico in cui le macchine si evolvono al di là del controllo umano – a pochi anni di distanza . Se questo è vero, la perdita di posti di lavoro sarebbe l’ultima delle preoccupazioni.

“Mitigare il rischio di estinzione dell’umanità causata dall’AI dovrebbe essere una priorità globale insieme ad altri rischi su scala sociale come pandemie e guerra nucleare”, ha scritto un gruppo di leader del settore, tecnologi e accademici quest’anno in una lettera aperta

Supponendo che sopravviviamo, cosa può mostrarci il passato su come lavoreremo con – o per – queste macchine in futuro?

Raffigurazione dei ludditi che distruggono le macchine, un movimento contro la meccanizzazione dell’industria tessile, nel Regno Unito nel 1811. 

Considera la prima rivoluzione industriale, dove i mortali modellavano le proprie macchine grezze. Funziona grazie al carbone economico e abbondante della Gran Bretagna e gestito dalla sua manodopera poco costosa e abbondante non qualificata, dai treni a vapore, dalle navi e dalle fabbriche. Il Regno Unito è diventato una centrale elettrica di produzione.

Non tutti accolsero con favore la competizione meccanica.

Un manifesto “RICCERCATO”  del gennaio 1812, a Nottingham, in Inghilterra, offriva una ricompensa di 200 sterline per informazioni sugli uomini mascherati che avevano fatto irruzione in un locale laboratorio e “hanno senza ragione rotto e distrutto cinque telai di calza (macchine meccaniche)”.

I vandali erano ludditi , artigiani tessili che condussero una campagna di distruzione contro la produzione tra il 1811 e il 1817. Non erano tanto contrari alle macchine quanto a un sistema di fabbrica che non apprezzava più la loro esperienza.

La rottura della macchina era una prima forma di azione sul lavoro, “contrattazione collettiva per “sommossa” ”, come ha detto lo storico Eric Hobsbawm. È stato un precursore di molte controversie di lavoro da seguire.

La seconda rivoluzione industriale, iniziata dal completamento della ferrovia transcontinentale nel 1869, spinse gli Stati Uniti al dominio globale. Le scoperte tra cui l’elettricità, la produzione di massa e la società hanno trasformato il mondo con meraviglie come auto, aerei, frigoriferi e radio.

Questi progressi hanno anche attirato un contraccolpo da parte di persone i cui posti di lavoro erano minacciati.

Thomas Edison nel suo laboratorio nel New Jersey che lavora sulla lampadina a incandescenza.

“Solo gli amanti che affollano negli angoli più remoti dei parchi per tenersi per mano e sbacucchiarsi non hanno trovato alcun difetto nei lampioni spenti di ieri sera”, scrisse il New-York Tribune il 26 aprile 1907, dopo uno sciopero degli uomini che accendevano a mano i 25.000 lampioni a gas della città ogni notte.

Gli accenditori protestavano per il salario, ma il vero nemico era in bella vista: la lampadina elettrica. “Nella parte centrale di Manhattan, dove ci sono luci elettriche in abbondanza, non ci sono stati inconvenienti”, ha riferito il Tribune. I giorni del lavoro secolare degli accenditori erano contati.Numerati erano anche i giorni dei produttori di carrozze, degli uomini di ghiaccio e degli operatori di ascensori.

La terza rivoluzione industriale, nel frattempo, ha suonato la campana a morte per gli operatori di centralini, i tipografi di giornali e la maggior parte di chiunque il cui lavoro potesse essere svolto da un computer.

Quei posti di lavoro persi sono stati per la maggior parte sostituiti. L’ascesa del personal computing e di Internet ha portato direttamente alla perdita di 3,5 milioni di posti di lavoro negli Stati Uniti dal 1980, secondo al McKinsey Global Institute nel 2018. Allo stesso tempo, le nuove tecnologie hanno creato 19 milioni di nuovi posti di lavoro.

Guardando al futuro, MGI stima che i progressi tecnologici potrebbero costringere ben 375 milioni di lavoratori a livello globale, su un totale di 2,7 miliardi, a cambiare occupazione entro il 2030.

Operatori di centralino, circa 1955. 

Un sondaggio condotto da LinkedIn per il World Economic Forum offre suggerimenti su da dove potrebbe provenire la crescita dell’occupazione. Delle cinque aree di lavoro in più rapida crescita tra il 2018 e il 2022, tutte tranne una coinvolgono le competenze delle persone: vendite e coinvolgimento dei clienti; risorse umane e acquisizione di talenti; marketing e comunicazioni; partnership e alleanze. L’altro: tecnologia e IT. Anche i robot avranno bisogno dei loro gestori umani

Michael Chui di McKinsey Global suggerisce che le persone non saranno sostituite dalla tecnologia in futuro tanto quanto collaboreranno più profondamente con essa.

“Quasi tutti noi al giorno d’oggi siamo cyborg, in un certo senso”, ha detto a Barron, indicando le cuffie che indossava durante una discussione su Zoom.

Nell’Iliade, 28 secoli fa, Omero descrive gli “schiavetti” robotici realizzati dal dio Efesto. Chui non si aspetta che i robot umanoidi, come le creazioni di Omero, “arrivino e facciano tutto” quello che una volta facevamo noi.

“Per la maggior parte di noi”, dice, “è parte del nostro lavoro che le macchine prenderanno effettivamente il sopravvento”.

Ogni ondata della rivoluzione industriale ha portato una maggiore prosperità, anche se non è stata ugualmente condivisa, progressi nella scienza e nella medicina, beni più economici e un mondo più connesso. L’onda dell’AI potrebbe anche fare di più.

“L’ho descritto come un darci dei superpoteri, e penso che sia vero”, dice Chui.

Superpoteri o estinzione: visioni fortemente diverse per il nostro coraggioso, nuovo futuro dell’A.I Meglio resistere.


23/11/23 Reuters: lettera al Cda di OpenAI sui rischi di distruzione dell’Umanità

I ricercatori di OpenAI hanno avvertito del consiglio di amministrazione della svolta dell’IA prima della cacciata del CEO, dicono le fonti

22 novembre (Reuters) – In vista dei quattro giorni in esilio del CEO di OpenAI Sam Altman, diversi ricercatori dello staff hanno scritto una lettera al consiglio di amministrazione avvertendo di una potente scoperta di intelligenza artificiale che hanno detto potrebbe minacciare l’umanità, hanno detto a Reuters due persone che hanno familiarità con la questione.

La lettera precedentemente non riportata e l’algoritmo dell’IA sono stati sviluppi chiave prima della cacciata da parte del consiglio di amministrazione di Altman, il figlio manifesto dell’IA generativa, hanno detto le due fonti. Prima del suo ritorno trionfale alla fine di martedì, più di 700 dipendenti avevano minacciato di dimettersi e andare con lui alla Microsoft (MSFT.O) in solidarietà con il loro leader licenziato.

Le fonti hanno citato la lettera come un fattore tra un elenco più lungo di lamentele da parte del consiglio che ha portato al licenziamento di Altman, tra cui le preoccupazioni sulla commercializzazione dei prototipi prima di comprenderne le conseguenze. Reuters non è stata in grado di rivedere una copia della lettera. Il personale che ha scritto la lettera non ha risposto alle richieste di commento.

Dopo essere stato contattato da Reuters, OpenAI, che ha rifiutato di commentare, ha riconosciuto in un messaggio interno allo staff un progetto chiamato Q* e una lettera al consiglio prima degli eventi del fine settimana, ha detto una delle persone. Un portavoce di OpenAI ha detto che il messaggio, inviato dall’esecutivo di lunga data Mira Murati, ha avvisato il personale di alcune storie dei media senza commentare la loro accuratezza.

Alcuni di OpenAI credono che Q* (pronunciato Q-Star) potrebbe essere una svolta nella ricerca della startup di quella che è nota come intelligenza generale artificiale (AGI), ha detto una delle persone a Reuters. OpenAI definisce AGI come sistemi autonomi che superano gli esseri umani nella maggior parte dei compiti economicamente preziosi.

Date le vaste risorse informatiche, il nuovo modello è stato in grado di risolvere alcuni problemi matematici, ha detto la persona a condizione di anonimato perché l’individuo non era autorizzato a parlare per conto dell’azienda. Sebbene eseguano solo la matematica a livello degli studenti delle scuole elementari, il successo di tali test ha reso i ricercatori molto ottimisti sul successo futuro di Q*, ha detto la fonte.

Reuters non ha potuto verificare in modo indipendente le capacità di Q* rivendicate dai ricercatori.

I ricercatori considerano la matematica una frontiera dello sviluppo dell’IA generativa. Attualmente, l’IA generativa è brava a scrivere e tradurre in linguaggio prevedendo statisticamente la parola successiva, e le risposte alla stessa domanda possono variare ampiamente. Ma conquistare la capacità di fare matematica – dove c’è solo una risposta giusta – implica che l’IA avrebbe maggiori capacità di ragionamento simili all’intelligenza umana. Questo potrebbe essere applicato a nuove ricerche scientifiche, ad esempio, credono i ricercatori dell’IA.

A differenza di una calcolatrice in cui può risolvere un numero limitato di operazioni, AGI può generalizzare, imparare e comprendere.

Nella loro lettera al consiglio, i ricercatori hanno segnalato l’abilità e il potenziale pericolo dell’IA, hanno detto le fonti senza specificare le esatte preoccupazioni di sicurezza indicate nella lettera. C’è stata a lungo una discussione tra gli informatici sul pericolo rappresentato da macchine altamente intelligenti, per esempio se potessero decidere che la distruzione dell’umanità era nel loro interesse.

I ricercatori hanno anche segnalato il lavoro di un team di “scienziati dell’IA”, la cui esistenza ha confermato più fonti. Il gruppo, formato combinando i precedenti team “Code Gen” e “Math Gen”, stava esplorando come ottimizzare i modelli di intelligenza artificiale esistenti per migliorare il loro ragionamento e alla fine eseguire un lavoro scientifico, ha detto una delle persone.

Altman ha guidato gli sforzi per rendere ChatGPT una delle applicazioni software in più rapida crescita nella storia e ha attirato gli investimenti – e le risorse informatiche – necessari da Microsoft per avvicinarsi ad AGI.

Oltre ad annunciare una serie di nuovi strumenti in una dimostrazione questo mese, Altman la scorsa settimana ha preso in giro in un vertice dei leader mondiali a San Francisco che credeva che fossero in vista importanti progressi.

“Quattro volte nella storia di OpenAI, il tempo più recente è stato solo nelle ultime due settimane, sono arrivato a stare nella stanza, quando spingiamo indietro il velo dell’ignoranza e la frontiera della scoperta in avanti, e farlo è l’onore professionale di una vita”, ha detto al vertice sulla cooperazione economica Asia-Pacifico.

Il giorno dopo, il consiglio licenziò Altman.

Di Anna TongJeffrey Dastin Krystal Hu


23/11/23 Barron’s: La minaccia dell’IA per l’umanità? La cacciata dii Altman da OpenAI è ancora senza spiegazioni.

DiAdam ClarkSegui

Sam Altman tornerà come CEO di OpenAI, ma non prenderà posto nel suo consiglio iniziale.

Sam Altman sembra destinato a tornare trionfalmente a OpenAI, ma le domande persistono ancora sul perché sia stato licenziato dalla start-up dell’intelligenza artificiale in primo luogo. L’attenzione si concentra sul fatto che un disaccordo sulla sicurezza della sua tecnologia di intelligenza artificiale abbia portato le cose in primo piano.

I precedenti membri del consiglio di amministrazione di OpenAI non hanno rivelato pubblicamente il motivo per cui hanno scelto di licenziare Altman la scorsa settimana e nessun altro, incluso il principale investitore nell’azienda Microsoft (ticker: MSFT)– è uscito anche con una spiegazione chiara.

Mentre il ritorno provvisoriamente concordato di Altman e la partenza della maggior parte dell’ex consiglio potrebbero appianare le cose, lascia una domanda a cui bisogna ancora rispondere: perché è stato licenziato?

La spiegazione iniziale data dal consiglio precedente era solo che Altman non era stato “costantemente sincero” nelle sue comunicazioni. Mentre le prime speculazioni si collegavano ai rapporti che stava esplorando iniziative esterne in iniziative di hardware e chip, la mancanza di dettagli concreti suggerisce che la causa potrebbe essere stata più profonda.

“Pensiamo che questo dia credito alla tesi che il consiglio di amministrazione di OpenAI sia stato motivato da una differenza filosofica fondamentale tra loro e la spinta del signor Altman per la commercializzazione”, ha scritto l’analista di Macquarie Frederick Havemeyer in una nota di ricerca.

Prima del licenziamento di Altman, i ricercatori dello staff di OpenAI hanno scritto una lettera al consiglio di amministrazione avvertendo che un progetto interno chiamato Q*, o Q-Star, potrebbe rappresentare una svolta nei tentativi di creare un’intelligenza artificiale generale – un’IA che può superare gli esseri umani in una serie di campi – e il potenziale pericolo di tale tecnologia, ha riferito giovedì Reuters, citando fonti che hanno familiarità con la questione. OpenAI non ha risposto immediatamente a una richiesta di commento sul rapporto.

Vale la pena fare affermazioni su grandi salti nell’IA con un pizzico di sale. Google l’anno scorso ha licenziato un ingegnere che ha affermato che un sistema di intelligenza artificiale inedito era diventato senziente. Mentre Bard di Google è un contendente nelle guerre dei chatbot, pochi suggerirebbero che uno qualsiasi dei prodotti di intelligenza artificiale dell’azienda mostri già segni di sensibilità.

Tuttavia, sembra che il rapido ritmo dello sviluppo dell’IA sia stato probabilmente al centro della disputa del consiglio precedente con Altman. L’ex membro del consiglio di amministrazione Helen Toner si è scontrata con Altman su un documento di ricerca di cui è stata coautrice che sembrava criticare gli sforzi di OpenAI per mantenere sicura la sua tecnologia AI, ha riferito il New York Times, citando e-mail.

Se alla fine viene confermato che la priorità di Altman nella commercializzazione dell’IA è stata la ragione del suo licenziamento, questo è probabilmente positivo per gli investitori di OpenAI, tra cui Microsoft, che sono anche interessati a vedere la tecnologia monetizzata il più rapidamente possibile. Tuttavia, farà poco per rassicurare i dubbiosi che sono sostenitori di una decelerazione o di un approccio più lento al progresso nell’IA.

Anche la struttura senza scopo di lucro di OpenAI rimarrà un problema in quanto l’azienda è incaricata di supervisionare un equilibrio tra commercio e sicurezza.


22/11/23 Forbes: Come Viz.ai utilizza l’intelligenza artificiale per trattare più velocemente i pazienti con ictus

La startup ha 12 algoritmi approvati dalla FDA per segnalare i problemi, accordi con più di 1.500 ospedali statunitensi e grandi piani per lavorare con le aziende farmaceutiche per ridurre gli ostacoli nel settore sanitario.

Di Amy Feldman, staff di Forbes


Il 26 ottobre, mentre visitava New York per un gala, Jess Allison è crollata per strada. La 41-year-old non era in grado di parlare o muovere il suo lato destro. Un cliente di un vicino caffè all’aperto l’ha aiutata a chiamare il 911 e un’ambulanza l’ha portata al Mount Sinai West nel centro della città.

Il medico del pronto soccorso le ha detto che pensavano che avesse avuto un ictus e l’ha mandata a fare una TAC. Presto, era sul tavolo operatorio e un neurochirurgo del Monte Sinai le stava parlando della procedura. “Potrai vedere lampi di luce nel mio cervello. Era piuttosto inquietante”, ha detto a Forbes. “Ha detto: ‘Abbiamo quasi finito, abbiamo quasi finito’ e quasi immediatamente ho potuto sentire la mia mano destra sollevarsi e ho potuto sentire le dita dei piedi e la caviglia muoversi”.

Allison è già tornata al lavoro come raccolta fondi per la Melanoma Research Foundation di Washington, D.C., con solo effetti collaterali minimi da un tipo di ictus noto come occlusione di grandi vasi, in cui una delle grandi arterie cerebrali viene bloccata. Anche se all’epoca non lo sapeva, parte del motivo per cui Mount Sinai è stato in grado di trattarla così rapidamente era dovuto al software basato sull’intelligenza artificiale di una startup chiamata Viz.ai. La velocità è la chiave con gli ictus, che colpiscono quasi 800.000 americani all’anno, perché ogni minuto di ritardo provoca la morte di circa 2 milioni di cellule cerebrali, lasciando molti sopravvissuti disabili, in difficoltà in riabilitazione o che vivono in case di cura. Gli algoritmi di Viz.ai confrontano le immagini delle scansioni TC dei pazienti con il suo database per aiutare i medici a ridurre i minuti cruciali dalla diagnosi e dal tempo di preparazione chirurgica in modo che possano dare la priorità ai pazienti con ictus e altre difficoltà.

“È abbastanza chiaro che l’IA può rilevare con precisione le malattie e sta arrivando al punto che può prevedere in modo robusto la progressione della malattia”, ha detto a Forbes Chris Mansi, il neurochirurgo che è il fondatore e CEO dell’azienda.

Viz.ai, con sede a San Francisco, è in prima linea nelle aziende mediche che utilizzano l’intelligenza artificiale per migliorare la cura dei pazienti. Un membro della lista 2021 Forbes Next Billion-Dollar Startups, ha raccolto un totale di 254 milioni di dollari da aziende che includono Insight Partners, Kleiner Perkins, Scale Venture Partners e Tiger Global con una valutazione di 1,2 miliardi di dollari. Le entrate ricorrenti annuali, o ARR, una metrica tipicamente utilizzata dalle società di software basate su abbonamento, sono circa raddoppiate ogni anno e dovrebbero raggiungere i 100 milioni di dollari nel 2024, da 12 milioni di dollari nel 2020. Le entrate annuali per scopi contabili sono in genere inferiori a ARR e, nel caso di Viz, dovrebbero arrivare a circa 40 milioni di dollari quest’anno e da 60 milioni a 70 milioni di dollari l’anno prossimo. L’azienda non è ancora redditizia.

Forse ancora più importante, l’azienda di sette anni ha ora firmato con più di 1.500 ospedali, tra cui la Cleveland Clinic, Mount Sinai, Tenet Healthcare e HCA, che coprono circa due terzi della popolazione degli Stati Uniti. È diventata anche la rara società di intelligenza artificiale a ricevere l’approvazione sia della FDA per i suoi algoritmi che di Medicare per il rimborso.

Ma l’IA medica è più regolamentata e più difficile da irrompere rispetto ad altre aree della tecnologia, e la concorrenza è diventata più dura da quando Viz ha iniziato. Essendo stato accettato dagli ospedali per la sua intelligenza artificiale basata su immagini, Viz si sta ora espandendo nell’intelligenza artificiale generativa in una mossa precedentemente non annunciata che include un programma pilota con il Monte Sinai e altri ospedali. Riassumerà le cartelle cliniche dei pazienti e setaccerà la letteratura accademica per trovare informazioni pertinenti che altrimenti potrebbero sfuggire. Il riassunto non richiede l’approvazione della FDA, ma se Viz dovesse utilizzare l’IA basata sul testo per le raccomandazioni cliniche – come alla fine spera – avrebbe bisogno di ottenere l’ok delle autorità di regolamentazione.

Allo stesso tempo, Viz ha iniziato a lavorare con aziende farmaceutiche e produttori di dispositivi medici. Quelle aziende sono alla ricerca di modi per lanciare i loro prodotti in modo più rapido ed efficiente, cosa che ha detto Mansi è diventata sempre più importante a causa dei cambiamenti dei prezzi dei farmaci nel 2022 Inflation Recovery Act.

In definitiva, Mansi spera che la combinazione di intelligenza artificiale basata su immagini e intelligenza artificiale generativa gli consentirà di diagnosticare 100 malattie. Oltre alla neurologia e alla cardiologia, Viz vede opportunità in oncologia, per esempio nel cancro ai polmoni, che spesso  non viene visto nelle prime radiografie.

“Pensiamo che ogni grande malattia potrebbe trarne beneficio”, ha detto Mansi, “e diventerà solo la norma nel settore sanitario”.

Neurochirurgo imprenditore

Mansi, 39 anni, è cresciuto a Newcastle, nel nord-est dell’Inghilterra, e ha frequentato la scuola di medicina all’Università di Cambridge. “Mia nonna ha sempre voluto che facessi il medico e che facessi il medico di base locale a Newcastle”, ha detto. Alla scuola di medicina, si innamorò della neurologia, e poi della neurochirurgia, una delle specialità più impegnative. Per cinque anni, ha fatto interventi chirurgici al cervello nei migliori ospedali di Londra, Queen Square e King’s College. Ha visto in prima persona come un intervento chirurgico poteva andare bene, ma il paziente sarebbe morto o sarebbe diventato disabile perché ci era voluto troppo tempo per farlo andare in sala operatoria.

Nel 2012, Mansi ha avviato un’attività chiamata Edusurg per aiutare i chirurghi junior a prepararsi per gli esami online. Anche se piccola, quell’azienda continua a operare. Due anni dopo, lasciò il suo lavoro di neurochirurgia e venne negli Stati Uniti per un MBA a Stanford. Ha giocato con “ogni tecnologia che riuscivo a trovare”, inclusa la stampa di cervelli in 3-D per aiutare i chirurghi a praticare operazioni e la creazione di un dispositivo che potesse stimolare i nervi cranici.

A Stanford nel 2016, Mansi ha incontrato un postdoc israeliano di machine-learning di nome David Golan. Golan, che da allora ha lasciato l’azienda, era stato recentemente dimesso dall’ospedale dopo un sospetto ictus. I due si sono legati alla mancanza di dati disponibili per prendere decisioni mediche migliori. Hanno lanciato la loro idea di utilizzare l’apprendimento automatico e l’imaging medico per migliorare la cura dell’ictus in una classe gestita dall’ex CEO di Google Eric Schmidt, che ha offerto finanziamenti di avviamento attraverso la sua azienda Innovation Endeavors.

All’epoca, l’intelligenza artificiale non era un processo così popolare come lo è ora. E la medicina, con i suoi ostacoli normativi, le situazioni di vita o di morte e le gigantesche burocrazie ospedaliere, potrebbe non essere sembrata il punto di partenza più facile. “All’epoca, era una di quelle strane società di intelligenza artificiale”, ha detto Mamoon Hamid, un partner di Kleiner Perkins, che per primo si è legato a Mansi durante una cena di venture capital in Colorado e ha investito nell’azienda nel 2018. “Ho dovuto sentirmi a mio agio con l’idea che questo fosse convincente per il fornitore e per il sistema”.

Approvazione FDA

Per sviluppare il suo primo algoritmo di ictus, Viz ha collaborato con due ospedali, Grady ad Atlanta e Erlanger a Chattanooga, Tennessee. Il software di Viz ha incrociato le immagini TC del cervello di un paziente con il suo database di scansioni per trovare i primi segni di ictus di occlusione di grandi vasi come quello che Jess Allison ha subito e per il quale una percentuale incredibilmente piccola di pazienti riceve un trattamento appropriato. Ha allertato i medici, che potevano vedere le immagini sui loro telefoni, tagliando minuti preziosi dal tempo che altrimenti ci sarebbe preso per portare quel paziente in chirurgia.

Mansi era a Erlanger per un test anticipato dell’algoritmo quando ha fatto il ping dei suoi primi avvisi. Erano falsi allarmi e Viz ha dovuto tornare indietro e ricalibrare il suo algoritmo. Lavorare con ospedali e medici per sviluppare il prodotto “prima che fosse completamente cotto”, ha detto Mansi, era particolarmente importante “per concentrarsi sul reale bisogno, rispetto al determinismo tecnologico, che non funziona nel settore sanitario”.

Oggi, l’azienda ha 12 algoritmi approvati dalla FDA, per malattie che includono ictus, cardiomiopatia ipertrofica (un ispessimento del muscolo cardiaco che può causare morte cardiaca improvvisa) e embolia polmonare (un improvviso blocco delle arterie che inviano sangue ai polmoni). Ha ricevuto la sua prima approvazione per il rimborso Medicare nel 2020. Il costo di Viz per un ospedale dipende dalle sue dimensioni e da quante malattie prendono di mira; un piccolo ospedale potrebbe pagare solo 50.000 dollari all’anno, ma un gruppo più grande potrebbe spendere più di 1 milione di dollari.

“Ci sono giganteschi punti ciechi nel modo in cui le cure mediche vengono fornite negli Stati Uniti”, ha detto J Mocco, un neurochirurgo del Monte Sinai che è direttore del suo Centro Cerebrovascolare. Mentre le carenze dell’assistenza sanitaria rurale sono ben documentate, il problema si estende anche alle aree urbane. “Questo è il motivo per cui l’IA sarà cruciale”, ha detto.

Follow-up non riusciti

Quando Mocco ha incontrato per la prima volta Viz intorno al 2016, ha pensato che fosse “un po’ ingannevole”, ma dopo un po’ è rimasto impressionato dall’interfaccia. Ora, non solo lo usa, ma è diventato un consulente dell’azienda. Gli piace che l’app emette un segnale acustico, consentendo ai medici di prepararsi immediatamente per l’intervento chirurgico piuttosto che aspettare che un radiologo del pronto soccorso sia impegnato a chiamare per il possibile ictus di un paziente. “L’IA aiuta a livellare il campo di gioco aiutandoci a classificare”, ha detto.

Iraj Nikfarjan, un neurologo dell’ospedale HCA di Ocala, in Florida, ha detto che negli ultimi giorni è stato in grado di rivedere le prime scansioni di una donna che è arrivata al pronto soccorso dopo essere crollata a Walmart in soli 12 minuti e mobilitare l’ospedale per curarla per l’ictus. “Posso accedere a quelle immagini sul mio cellulare ovunque mi trovi e pianificare la mia procedura”, ha detto.

Mentre l’IA è stata criticata per l’introduzione di errori e pregiudizi, Mansi ha detto che la maggior parte dei suoi algoritmi basati su immagini sono accurati circa il 95%, molto più alti del medico medio che non è uno specialista. “Stimiamo che in media in tutte le malattie di cui ci prendiamo cura, meno del 20% delle volte che un paziente con una particolare malattia percorre il percorso [di trattamento] che sarebbe considerato quello ideale”, ha detto. “È circa l’80% dove ciò non accade”.

Considera gli aneurismi. Le diagnosi errate si verificano in un massimo di un quarto dei pazienti che inizialmente cercano assistenza medica con un medico di base, un pronto soccorso o una clinica walk-in. Viz calcola che il suo algoritmo di aneurisma può aiutare a migliorare le prestazioni e indirizzare i pazienti agli specialisti giusti. In uno studio su 1.200 angiogrammi in otto centri di ictus in Texas, Viz ha scoperto che l’85% di quelli con aneurismi non era stato riferito per il follow-up, nonostante il rischio.

“L’unica preoccupazione è se l’IA sostituisce esperti addestrati ed esperti”, ha detto Mocco. “Non lo voglio e non lo vedo accadere presto. A mio avviso, non si tratta di IA che dice ai medici cosa fare e quindi di commettere errori. Si tratta più di avvisarci.”

Big Pharma

Negli ultimi sette anni, Viz si è concentrata su ospedali e pazienti. Oggi, tuttavia, sta anche lavorando con aziende farmaceutiche, produttori di dispositivi medici e aziende di scienze della vita. Mansi crede di poter utilizzare i suoi algoritmi e la rete dell’azienda negli ospedali per aiutare quelle aziende a introdurre i loro farmaci, terapie e dispositivi più velocemente rivolgendosi ai pazienti che potrebbero averne più bisogno. Per le aziende farmaceutiche che possono spendere 1 miliardo di dollari o più per lanciare un farmaco, l’efficienza è fondamentale.

Questo è ancora più vero oggi a causa della legislazione del 2022, che consente a Medicare di rinegoziare i prezzi delle pillole dopo nove anni. “Se non avevi intenzione di fare soldi fino all’anno 11, e sarà ridotto di prezzo nell’anno nove, devi trovare un modo per accelerare l’adozione”, ha detto Mansi.

A marzo, Viz ha annunciato un accordo pluriennale con Bristol Myers Squibb per implementare un algoritmo di intelligenza artificiale per il rilevamento della cardiomiopatia ipertrofica, la malattia che ispessisce i muscoli cardiaci. Bristol Myers Squibb ha un trattamento per la malattia chiamato Camzyos (generalmente noto come mavacamten) che ha acquisito come parte del suo acquisto di 13,1 miliardi di dollari di MyoKardia nel 2020 e per il quale sta cercando di costruire un mercato. Viz ha ricevuto l’approvazione della FDA per il suo algoritmo ad agosto.

L’azienda lavora anche con Medtronic, Johnson & Johnson e altri importanti produttori di dispositivi farmaceutici e medici.

L’ispessimento dei muscoli cardiaci è una condizione grave che è difficile da diagnosticare. Molti pazienti sperimentano sintomi lievi come mancanza di respiro e si troveranno trasportati da uno specialista all’altro in cerca di una risposta.

“Alcuni pazienti vanno decenni senza una diagnosi”, ha detto Josh Lampert, elettrofisiologo e direttore medico dell’apprendimento automatico per Mount Sinai Heart. “Possiamo prevenirlo, ottenere cure ai pazienti e in alcuni casi salvare le loro vite”. Jayme Strauss, direttore clinico di Viz, ha affermato che i suoi studi mostrano che l’algoritmo ha ridotto il tempo fino alla diagnosi a una mediana di 64 giorni, rispetto ai cinque anni precedenti.

Distribuzione cauti

Nello stesso momento in cui Viz sta lanciando nuove partnership con Big Pharma, si concentra anche sull’area calda delle aziende di intelligenza artificiale: l’IA generativa. “I dati mostrano che è pazzesco non avere questi sistemi negli ospedali”, ha detto Mansi. Questo è particolarmente vero, ha detto, per i pazienti che potrebbero non avere accesso a un ospedale di ricerca di livello mondiale. “Non devi essere al Monte Sinai o alla Messa Generale”, ha detto. “Possiamo ridurre la variabilità nei casi e aumentare la possibilità che il paziente riceva la migliore terapia diretta alle linee guida”.

Questa è una scommessa più grande e potenzialmente più rischiosa. “Il coordinamento delle assistenza è un tipo di ruolo intermedio”, ha detto Thomas Davenport, professore di tecnologia dell’informazione al Babson College che ha scritto sull’uso dell’IA nell’assistenza sanitaria. Non è facile per un nuovo arrivato entrare in uno spazio con potenti fornitori di digitalizzazione degli archivi come Epic Systems da un lato e produttori di dispositivi di imaging come GE e Siemens dall’altro, che stanno tutti cercando di aumentare le loro analisi, ha detto. “Sembra solo un posto scomodo essere nel mezzo in questo momento”, ha detto.

Resta da lavorare per garantire che l’uso dell’IA generativa nel processo decisionale medico non sia soggetto a pregiudizi o risultati falsi. Lampert del Monte Sinai si è detto entusiasta del potenziale della tecnologia per aiutare i medici a rimanere aggiornati sul diluvio di studi di ricerca, ma che l’ospedale è cauto riguardo al dispiegamento. “Abbiamo già una regolamentazione dell’IA nel settore sanitario”, ha detto Mansi. “Penso che vedrai un’espansione di questo, e sarà una buona cosa”.

Per pazienti come Jess Allison, che senza una risposta rapida sarebbe rimasto disabile, c’è poco motivo di pensare a Viz, se non per essere grati quando funziona. “Non sono super esperta tecnologicamente”, ha detto. “La roba di Google AI che è uscita all’inizio di quest’anno mi fa impazzire, ma questo tipo di intelligenza artificiale che amo. “Non sapevo che fosse quello che mi ha diagnosticato inizialmente, se vuoi, ma sono molto grato per questo””.”


20/11/23 Barron’s: Il futuro di OpenAI è in discussione. Cosa significa per Google, Amazon e Nvidia.

DiAdam ClarkSegui eLiz MoyerSegui


ChatGPT di OpenA e Bard di Google sono diventati i chatbot AI più importanti.

Microsoft  MSFT 2,22%si è mossa rapidamente per salvare il suo investimento in OpenAI assumendo il suo ex CEO Sam Altman. Tuttavia, le ricadute del suo licenziamento potrebbero ancora rimodellare la corsa all’intelligenza artificiale tra l’azienda tecnologica e i suoi colleghi.

Probabilmente assumendo direttamente Altman, Microsoft (ticker: MSFT) ha rafforzato la sua posizione nella competizione AI contro il genitore di Google, Alphabet GOOGL (GOOGL) e Amazon.com (AMZN). Ora ha un team di intelligenza artificiale interno più forte oltre alla sua partecipazione del 49% in OpenAI. Tuttavia, il futuro di OpenAI sembra essere nell’aria.

Più di 500 dipendenti OpenAI hanno minacciato di dimettersi dall’azienda se l’attuale consiglio di amministrazione non si dimette e ripristina Altman, ha riferito il Wall Street Journal, citando una lettera al consiglio.

Il capo scienziato di OpenAI Ilya Sutskever, che è stato uno dei membri del consiglio che ha votato contro Altman ha twittato il suo rammarico dicendo: “Mi rammarico profondamente della mia partecipazione alle azioni del consiglio. Non ho mai avuto intenzione di danneggiare OpenAI. “Amo tutto ciò che abbiamo costruito insieme e farò tutto il possibile per riunire l’azienda””.”

Mentre molti dipendenti OpenAI potrebbero scegliere di seguire Altman, ma potrebbero anche essere tentati da altri rivali.

“Le tue azioni hanno reso ovvio che sei incapace di supervisionare OpenAI”, hanno scritto i dipendenti. “Non siamo in grado di lavorare per o con persone che mancano di competenza, giudizio e cura per la nostra missione e i nostri dipendenti”.

Il CEO ad interim di OpenAI Emmett Shear, ex capo di Twitch, ha dichiarato in un post sui social media che avrebbe assunto un investigatore indipendente per scavare nell’intero processo che ha portato al licenziamento di Altman e alle sue conseguenze, e generare un rapporto completo nei prossimi 30 giorni.

Nel post ha anche detto che avrebbe riformato la gestione e la leadership dell’azienda. “È chiaro che il processo e le comunicazioni sulla rimozione di Sam sono stati gestiti molto male, il che ha seriamente danneggiato la nostra fiducia”, ha detto Shear.

Ha aggiunto che, a seconda di ciò che trovano, “guidarò i cambiamenti nell’organizzazione, fino a e anche spingendo fortemente per cambiamenti di governance significativi, se necessario”.

Shear ha detto che potrebbero essere necessari più di 30 giorni per affrontare le turbolenze che hanno attanagliato l’azienda negli ultimi giorni.

L’analista di Evercore Kirk Materne ha dichiarato in una nota di ricerca: “Mentre resta da vedere quanta “fuga di cervelli” ci sarà a OpenAI, pensiamo che il rischio fondamentale per Microsoft sia in gran parte contenuto con Altman e il team a bordo”.

Potrebbe esserci un’opportunità per Google e Amazon di approfittare dello sconvolgimento. Altman ha recentemente affermato che OpenAI era nelle prime fasi dello sviluppo di GPT-5, il suo ultimo modello di intelligenza artificiale. È probabile che tali progressi siano interrotti dai cambiamenti organizzativi. Anche se il nuovo team di Altman assume l’iniziativa della prossima generazione di modelli di intelligenza artificiale, Microsoft doverà mettere in atto il personale e le risorse per farlo e questo richiederà tempo.

Ciò potrebbe consentire a Google e Amazon di sostituire la tecnologia di OpenAI come punto di riferimento del settore percepito.

Google è stato segnalato dal Wall Street Journal a luglio di lavorare su un modello di intelligenza artificiale chiamato Gemini che può rivaleggiare con GPT-4 e che dovrebbe essere pronto per il rilascio nei prossimi mesi. Amazon sta investendo nel proprio modello di intelligenza artificiale, nome in codice Olympus, che potrebbe essere al top sia della tecnologia OpenAI che di Alphabet, secondo Reuters.

Lo sviluppo di modelli di intelligenza artificiale da parte di Google e Amazon potrebbe trarre vantaggio dall’essere in grado di assumere da un nuovo pool di talenti. OpenAI aveva parlato con gli investitori di una vendita di azioni che l’avrebbe valutata tra gli 80 e gli 90 miliardi di dollari, secondo il Wall Street Journal. Sembra probabile che ciò sia minacciato dagli sconvolgimenti dell’azienda e potrebbe incentivare i dipendenti ad andare avanti.

Un’azienda che già spera di beneficiare è Nvidia  (NVDA). Lo scienziato ricercatore di Nvidia AI Jim Fan ha detto che il suo team stava cercando di assumere ingegneri e ricercatori e ha fatto riferimento specifico ai dipendenti di OpenAI in un post sulla piattaforma social-media X, precedentemente Twitter.

Più in generale per Nvidia lo scenario è misto. Se Microsoft deve fornire sia a OpenAI che al suo team interno guidato da Altman una capacità di elaborazione sufficiente per addestrare i modelli di intelligenza artificiale, potrebbe essere necessario aumentare i suoi acquisti pianificati di chip, anche da Nvidia.

Tuttavia, Altman ha anche trascorso del tempo in Medio Oriente a valutare l’interesse degli investitori per una nuova start-up che mira a creare chip a basso costo necessari per addestrare i modelli di intelligenza artificiale, secondo il Wall Street Journal. Se il suo interesse per l’hardware interno persiste, potrebbe accelerare le mosse esistenti di Microsoft per ridurre la sua dipendenza da fornitori di chip come Nvidia.

Un’altra ramificazione del turbamento di OpenAI potrebbe essere un focus più nitido su come sono strutturate le start-up AI. Microsoft non aveva un posto nel consiglio di amministrazione di OpenAI, che era strutturato come un’organizzazione senza scopo di lucro con il compito di dare priorità al bene sociale.

La start-up di intelligenza artificiale Anthropic, che ha ricevuto miliardi di investimenti da Amazon e Google, è istituita come una società di pubblica utilità, il che significa che il suo consiglio di amministrazione bilancia gli interessi finanziari e lo sviluppo responsabile dell’IA. Tuttavia, ha anche una struttura fiduciaria che significa che un organo indipendente di fiduciari alla fine eleggerà la maggioranza del suo consiglio, in un periodo di tempo graduale.

Tali strutture hanno lo scopo di ridurre i rischi dello sviluppo dell’IA, ma gli eventi di OpenAI potrebbero lasciare i sostenitori aziendali più diffidenti su come funzionano nella pratica.


19/11/23 Sole 24 Ore: OpenAI, dietro la cacciata di Altman timori su sicurezza e trasparenza

­Marco Val­sa­nia NEW YORK Il Sole 24 Ore 19 nov 2023

A sol­le­va­re ma­les­se­re nel board sa­reb­be sta­ta l’ec­ces­si­va ra­pi­di­tà nel com­mer­cia­liz­za­re nuo­vi pro­dot­ti La gui­da del grup­po af­fi­da­ta a in­te­rim a Mi­ra Mu­ra­ti. La­scia an­che il co- fon­da­to­re e di­ret­to­re ge­ne­ra­le Greg Brock­man

Battaglie e crescente animosità nel consiglio di amministrazione sono state alla radice di un drammatico cambio della guardia ai vertici di OpenAI, protagonista e simbolo della rivoluzione dell’intelligenza artificiale. Il fondatore, chief executive e volto pubblico del gruppo, il trentottenne Sam Altman, è stato improvvisamente defenestrato, tra lo shock dell’intera Silicon Valley. Il suo posto a interim sarà preso dalla chief technology officer Mira Murati in attesa della scelta di un successore.

Alla notizia della cacciata di Altman, anche il chairman, direttore generale e co- fondatore Greg Brockman ha annunciato le immediate dimissioni. La rivolta del board, da quanto è emerso, avrebbe visto in prima fila un terzo co- fondatore, il chief scientist Ilya Sutskever, e, almeno in parte, preoccupazioni per l’eccessiva rapidità nella commercializzazione di prodotti a fronte della sicurezza.

Il terremoto allunga ombre sul futuro dell’azienda e OpenAI si è affrettata ad assicurare che il proprio lavoro continuerà. Ha fatto sapere che la decisione di rompere con Altman è arrivata al termine di un esame delle azioni del ceo: non ha precisato quali, ma ha indicato che queste avrebbero « intralciato la sua capacità di esercitare le sue responsabilità » . E che « il board non ha più fiducia nella sua abilità di continuare a guidare » il gruppo e « una nuova leadership è necessaria per proseguire » . Ha affermato che lo stretto rapporto con Microsoft, che ha investito 13 miliardi per una eventuale quota del 49%, resta. Microsoft, colta a sua volta allo sprovvisto dall’annuncio, ha in seguito confermato la « partnership di lungo periodo » con OpenAI.

Il ceo di Microsoft, Satya Nadella, aveva però anche sviluppato una stretta relazione con Altman. La società – nata come non profit e divenuta in soli otto anni un colosso a scopo di lucro sotto la guida dell’imprenditore ed executive di venture capital – è inoltre al centro di nuove raccolte di fondi sulla base di valutazioni tra gli 80 e 100 miliardi, il triplo di pochi mesi or sono. Dopo lo straordinario successo del lancio nel 2022 della chatbot ChatGPT, in grado di generare testi e contenuti “umani”, ha previsto di superare il miliardo di dollari di entrate quest’anno e di moltiplicare le revenue il prossimo.

Altman ha pubblicamente indicato, in un iniziale post su X, di aver apprezzato e considerato « trasformativo » il suo impegno a OpenAI. Più duro Brockman: si è detto « scioccato e rattristato » dal terremoto, incapace di spiegarsi « cosa sia accaduto » . Stando ad una ricostruzione del Wall Street Journal, Altman considera la defenestrazione l’esito di scontri nel board e in particolare con Sutskever. Tra i temi di polemica: se OpenAI stesse tenendo conto adeguatamente della sicurezza nelle sue offerte al mercato, che vara sempre più celermente.

Brockman ha svelato la dinamica delle ultime ore: Sutskever aveva chiesto ad Altman un colloquio venerdì, per poi presentarsi in video- collegamento con l’intero board ( tranne lo stesso Brockman) e riferirgli che veniva licenziato in tronco. Il chief scientist, stando a indiscrezioni raccolte tra chi lo conosce, di recente era parso dedicato a intensificare la ricerca di sistemi “allineati” con “valori umani”. La sorpresa dell’annuncio è stata tanto più forte a fronte dell’ubiquità di Altman, fino agli ultimissimi giorni. Era reduce da convegni ai margini del vertice Apec e nelle scorse settimane era intervenuto alla prima conferenza di sviluppatori del gruppo. Era diventato un vero e proprio globetrotter per le nuove frontiere della cosiddetta intelligenza artificiale generativa, coinvolto in appuntamenti politici ai massimi livelli e nel sostegno allo sviluppo di regolamentazioni governative per affrontare i nuovi rischi. Ora sulla sua figura grava l’ombra del ceo definito poco « sincero » dal suo board. In cosa Altman non sia stato trasparente, al momento, rimane un mistero.


17/11/23 Le Rivoluzioni divorano sempre i propri figli: OpenAi saluta Sam Altman

DiTae KimSegui

17 novembre 2023 15:47 EST

Il CEO di OpenAI Sam Altman al vertice del CEO APEC a Moscone West il 16 novembre 2023 a San Francisco, California. JUSTIN SULLIVAN/GETTY IMAGES

OpenAI ha annunciato venerdì pomeriggio che Sam Altman è partito la società, dicendo che l’esecutivo “non era costantemente sincero nelle sue comunicazioni con il consiglio di amministrazione”.

Il Chief Technology Officer Mira Murati è stato nominato CEO ad interim.


15/11/23 MIT: Dietro la spinta del CEO di Microsoft Satya Nadella per mettere gli strumenti di intelligenza artificiale nelle mani degli sviluppatori


In un’intervista esclusiva con MIT Technology Review, Nadella condivide la sua visione del cambiamento della piattaforma per gli sviluppatorI.

MICROSOFT

A San Francisco la scorsa settimana, il visitatore a sorpresa preferito di tutti è stato il CEO di Microsoft Satya Nadella.

Al DevDay di OpenAI, il primo evento in assoluto per gli sviluppatori che si basano sulla sua piattaforma, Nadella è salito sul palco per unirsi al CEO di OpenAI Sam Altman, soffiando i capelli su un pubblico già elettrificato. “Voi ragazzi avete costruito qualcosa di magico”, sgorgò.

Due giorni dopo su un altro palco, in un’altra sede, in un’altra conferenza degli sviluppatori, Nadella ha fatto la sua seconda apparizione senza preavviso della settimana, questa volta su GitHub Universe. Lì Thomas Dohmke, CEO di GitHub, stava mostrando una nuova versione dello strumento di programmazione AI dell’azienda, Copilot, che può generare codice informatico dal linguaggio naturale. Nadella era effusivo: “Posso codificare di nuovo!” esclamò.

Oggi, Nadella sarà sul palco a parlare con gli sviluppatori di Microsoft Ignite, dove l’azienda sta annunciando ancora più strumenti di sviluppo basati su AI, tra cui un Azure AI Studio che permetterà agli sviluppatori di scegliere tra cataloghi di modelli non solo Microsoft, ma anche di artisti del calibro di Meta, OpenAI e Hugging Face, oltre a nuovi strumenti per personalizzare Copilot per Microsoft 365.

Se sembra che Nadella sia ossessionata dagli sviluppatori, non ti sbagli. Sta facendo il giro per pubblicizzare tutti i modi in cui possono utilizzare una nuova generazione di strumenti basati sull’intelligenza artificiale, come GitHub Copilot (Microsoft ha acquisito GitHub nel 2018) o la nuova suite di strumenti di sviluppo di OpenAI, una società in cui Microsoft avrebbe investito circa 13 miliardi di dollari.

La scorsa settimana, Nadella si è preso una pausa di 20 minuti da tutte le sue apparizioni sul palco per sedersi con MIT Technology Review per parlare di (avete indovinato) gli sviluppatori. Ha ripetutamente sottolineato l’attenzione di lunga data di Microsoft agli sviluppatori. Ma aveva anche un messaggio: il modo in cui creiamo il software sta cambiando radicalmente.

Nadella crede che sia in corso un cambiamento di piattaforma, che si rivelerà altrettanto significativo dei cambiamenti dal mainframe al desktop o dal desktop al mobile. Questa volta, la transizione è verso strumenti di intelligenza artificiale in linguaggio naturale, alcuni dei quali sostiene abbasseranno la barriera all’ingresso per lo sviluppo del software, renderanno gli sviluppatori esistenti più produttivi e alla fine porteranno a una nuova era di creatività.

Presentiamo Nadella con le sue stesse parole, qui sotto. Le sue osservazioni sono state modificate e condensate in qualche modo per la leggibilità.  

SULLA RELAZIONE CON OPENAI

Una critica a OpenAI è che il suo stesso business è possibile solo tramite Microsoft, che ha dato alla startup miliardi di dollari e l’accesso alle risorse di cui ha bisogno per alimentare il suo modello di linguaggio ad alta intensità di calcolo. Eppure Microsoft è anche fortemente dipendente dalla tecnologia di OpenAI per alimentare servizi come GitHub Copilot, Bing e Office 365. Altman ha persino scherzato sulla partnership sul palco. Abbiamo chiesto a Nadella di questa relazione. 

Ho sempre sentito che Microsoft è un’azienda platform-and-partner-first, e questo non è nuovo per noi. E quindi, entrambi siamo effettivamente codipendenti, giusto? Dipendono da noi per costruire i migliori sistemi, noi dipendiamo da loro per costruire i migliori modelli e andiamo sul mercato insieme.

NELLA SUA MISSIONE DI METTERSI DI FRONTE AGLI SVILUPPATORI

Nadella afferma che questo spostamento della piattaforma è abbastanza diverso da quelli precedenti che ritiene che l’azienda debba fornire agli sviluppatori non solo strumenti, ma anche un messaggio chiaro su ciò che sta pensando e su come gli sviluppatori possono venire avanti.

Ogni volta che hai un cambio di piattaforma, la cosa fondamentale è assicurarsi che la piattaforma sia onnipresente per gli sviluppatori per costruire tutti i tipi di cose nuove. Quindi, per noi, il compito più importante è rendere gli strumenti di sviluppo, le piattaforme di sviluppo, ampiamente disponibili.

La seconda cosa è che mostriamo anche la luce, giusto? Che si tratti di OpenAI che costruisce ChatGPT e poi innova su di esso, o noi che costruiamo Copilot e innoviamo su di esso. Ciò darà agli sviluppatori l’opportunità di distribuire le loro applicazioni. Quindi la cosa più importante in qualsiasi creazione di piattaforma è rendere la piattaforma biquiticamente disponibile e quindi aiutare gli sviluppatori a raggiungere il [loro] pubblico.

Questi sono i due obiettivi che abbiamo in tutte queste [conferenze].

SU COSA C’È DI DIVERSO IN QUESTO CAMBIAMENTO E PRODUTTIVITÀ

I guadagni di produttività negli Stati Uniti sono stati lenti negli ultimi 15 o più anni. L’ultimo enorme cambiamento della piattaforma, l’aumento dello sviluppo mobile, ha fatto poco per raggiungere una prosperità diffusa. Nadella dice che questa volta sarà diverso, in gran parte perché il passaggio all’IA alimenterà una rivoluzione creativa rendendo facile per chiunque generare nuovo lavoro, incluso il codice.

D’altra parte, la codifica oggi è un lavoro altamente qualificato e ben pagato, e c’è una certa preoccupazione che l’IA possa automatizzarla efficacemente. Nadella sostiene che i programmatori qualificati rimarranno richiesti, ma che i loro posti di lavoro cambieranno e saranno disponibili ancora più posti di lavoro. Nadella ha detto che prevede 1 miliardo di sviluppatori che creano sulle sue piattaforme, molti dei quali con poca o nessuna esperienza precedente con la codifica.

Ogni volta che hai qualcosa di così dirompente come questo, devi pensare allo spostamento e alle cause. E questo significa che si tratta di upkilling e riqualificazione, e in modo interessante, è più simile a quello che è successo quando i word processor e i fogli di calcolo hanno iniziato a presentarsi. Ovviamente, se tu fossi un dattilografo, è davvero cambiato drasticamente. Ma allo stesso tempo, ha permesso a un miliardo di persone di essere in grado di digitare nei word processor e creare e condividere documenti.

Non credo che gli sviluppatori professionisti saranno meno preziosi di oggi. È solo che avremo molte, molte gradazioni di sviluppatori. Ogni volta che stai sollecitando una chat Bing o ChatGPT, stai essenzialmente programmando. La conversazione stessa sta guidando un modello.

Penso che ci saranno molti, molti nuovi posti di lavoro, ci saranno molti, molti nuovi tipi di lavoro di conoscenza, o lavoro in prima linea, dove la fatica viene rimossa.

Penso che l’era mobile sia stata fantastica. Ha reso il consumo onnipresente di servizi. Non si è tradotto in una creazione onnipresente di servizi.

L’ultima volta che c’è stata un’ampia diffusione della produttività negli Stati Uniti e oltre a causa della tecnologia dell’informazione è stato l'[avvento del] PC. In effetti, anche i critici della tecnologia dell’informazione e della produttività, come Robert Gordon della Northwestern, hanno riconosciuto che il PC, quando si è presentato per la prima volta al lavoro, si è effettivamente tradotto in ampi cambiamenti di statistiche di produttività.

Quindi è lì che penso che sia questo, dove questi strumenti, come Copilot, vengono utilizzati da un ingegnere del software [principiante] a Detroit, per poter scrivere [codice]. … Penso che avremo un vero cambiamento nella produttività dell’industria automobilistica. Stessa cosa nella vendita al dettaglio, stessa cosa nel lavoro in prima linea e nel lavoro di conoscenza.

La barriera all’ingresso è molto bassa. Poiché è un linguaggio naturale, gli esperti di dominio possono creare app o flussi di lavoro. Questa, penso, è la cosa più eccitante di questo. Non si tratta solo di una cosa guidata dal consumo. Non si tratta di creazione d’élite. Si tratta di creazione democratizzata. Sono molto, molto fiducioso che inizieremo a vedere i guadagni di produttività in modo molto più ampio.

SULLA PROTEZIONE DEGLI SVILUPPATORI

Numerosi casi di proprietà intellettuale e cause collettive sono dinanzi ai tribunali statunitensi su questioni di fair use. Almeno uno individua GitHub Copilot in particolare, sostenendo che gli strumenti generativi di Microsoft e OpenAI, che sono addestrati sul codice open source, equivalgono alla pirateria del software. C’è il timore che le persone che usano questi strumenti possano essere soggette a rivendicazioni di proprietà intellettuale. Microsoft sta cercando di affrontare questi problemi con un’ampia politica di indennizzo. OpenAI ha anche annunciato la propria politica di indennizzo, Copyright Shield, alla sua conferenza DevDay.

Fondamentalmente questi grandi modelli strisciano e ottengono contenuti e poi si allenano su quel contenuto, giusto? Se qualcuno non vuole che il proprio contenuto venga scansionato, abbiamo grandi controlli granulari nei nostri crawler che consentono a chiunque di impedirgli di strisciare. In effetti, abbiamo controlli in cui puoi farlo scansionare solo per la ricerca, ma non per la formazione di modelli linguistici di grandi dimensioni. È disponibile oggi. Quindi chiunque voglia davvero assicurarsi che i propri contenuti non vengano presi per la riqualificazione può farlo oggi.

La seconda cosa, ovviamente, è che penso che i tribunali e il processo legislativo in una certa combinazione dovrò decidere cosa è fair use e cosa non lo è fair use.

Abbiamo preso molto controllo per assicurarci di essere solo modelli di formazione e stiamo usando i dati per addestrare modelli che ci sono autorizzati e su cui crediamo di avere una posizione legale.

Se si tratta di esso, lo concitenzioso in tribunale. Ci assumeremo questo onere in modo che gli utenti dei nostri prodotti non ne detti preoccupare. È così semplice, che è assumersi la responsabilità e trasferirla dai nostri utenti a noi. E naturalmente, saremo molto, molto consapevoli di assicurarci di essere dalla parte giusta della legge lì.


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.