Ultime tendenze e sfide nell'Ecosistema delle Intelligenze Artificiali - vol. 8
Ultime tendenze e sfide nell'Ecosistema delle Intelligenze Artificiali - vol. 8

Ultime tendenze e sfide nell'Ecosistema delle Intelligenze Artificiali - vol. 8

Autore: Daniele Grandini

Ben ritrovati per il nostro appuntamento mensile su quanto muove il mercato dell’AI. Anche questo mese abbiamo diversi temi da toccare. Buona lettura.

Top of the month

Nel mese di luglio sono stati introdotti nuovi modelli, con una cadenza di rilascio in aumento dovuta agli avanzamenti nella capacità di elaborazione, come dimostra l'arrivo del supercomputer X. META ha presentato Llama 3.1, il suo modello OpenSource più capiente finora, mentre Mistral ha rivelato Large 2, più contenuto nelle dimensioni rispetto a Llama 3.1 ma ugualmente performante nei test comparativi. Google, per la sua parte, ha migliorato la funzione chat Gemini.

Questo insieme al momentum dei Small Language Models è di gran lunga il Top of The Month per luglio. Oggi tutti, da Microsoft, Google, Mistral, Anthropic a Cohere, stanno fornendo le loro versioni mini, infatti durante questo mese abbiamo assistito al debutto di OpenAI GPT-4o mini e, in misura minore e di minor importanza Mistral insieme a Nvidia, hanno rilasciato NeMo.

Con l’introduzione di numerosi modelli da parte dei principali attori del settore, ci resta da vedere solo Anthropic, che in realtà era stata pioniera con il lancio di Cloude 3.5 a giugno.

Meta ha effettuato un importante passo avanti nell'ambito dell'intelligenza artificiale open source rivelando Llama 3.1, ad oggi uno dei modelli più estesi disponibili in open source.

Le caratteristiche principali includono:

  • Una famiglia di tre modelli, con il più grande che vanta 405 miliardi di parametri
  • Capacità di eseguire compiti di codifica, rispondere a domande matematiche e riassumere documenti in 8 lingue
  • Ottime prestazioni in matematica e ragionamento
  • Una finestra di contesto di 128K token (circa 200 pagine di testo)
  • Disponibilità per il download da Hugging Face, GitHub o Meta

Sebbene Llama 3.1 non sia multimodale e gestisca solo testo, rappresenta un significativo passo avanti nelle capacità dell'IA open-source. Il CEO di Meta, Mark Zuckerberg, ha sottolineato la sua competitività con i principali modelli chiusi, affermando:

Questo è decisamente il sistema open-source più avanzato che sia mai stato distribuito.

La natura open-source di Llama 3.1 consente un accesso e una personalizzazione senza precedenti, che innesca potenzialmente una nuova ondata di applicazioni e innovazioni nell'IA.

Al contempo Mistral ha introdotto Large 2, un modello che compete con controparti molto più grandi offrendo significativi guadagni di efficienza:

  • 123 miliardi di parametri, meno di un terzo dei 405B di Llama 3.1
  • Supera i modelli più grandi nella generazione di codice e matematica
  • Finestra di contesto di 128.000 token
  • Supporto multilingue migliorato per 12 lingue e 80 linguaggi di codifica
  • Afferma di ridurre al minimo le allucinazioni e di produrre risposte più concise

Le prestazioni di Large 2, nonostante le sue dimensioni ridotte, evidenziano il potenziale di modelli di IA più efficienti che non compromettono le capacità.

Per tenere il passo con i concorrenti, Google ha aggiornato il suo chatbot Gemini AI:

  • Disponibilità estesa a 40 lingue in 230 paesi
  • Capacità di elaborazione migliorata, gestendo fino a 24.000 parole da un singolo prompt
  • Capacità di ragionamento e comprensione delle immagini migliorate
  • Estensione delle funzionalità di analisi dei file agli utenti non paganti

Sull’altro versante, gli SLM stanno guadagnando l’attenzione di chi voglia sviluppare soluzioni personalizzate. La tendenza verso modelli più piccoli e più efficienti sta guadagnando slancio, con i principali attori come Microsoft, Google, Mistral, Anthropic e Cohere che sviluppano le loro versioni mini. Questo cambiamento è guidato da diversi fattori:

  1. Convenienza: i modelli più piccoli riducono significativamente i costi operativi
  2. Scalabilità: gli SLM consentono l'implementazione dell'IA su larga scala per le grandi aziende
  3. Applicazioni specializzate: più facile la messa a punto per esigenze specifiche del settore

Il GPT-4o mini di OpenAI esemplifica questa tendenza:

  • Il 60% più economico da eseguire rispetto a GPT-3.5 Turbo
  • Supera i modelli precedenti in efficienza e capacità
  • Prezzo a $0.15/$0.60 per 1 milione di token di input/output
  • Punteggio dell'82% nel benchmark MMLU, superando i concorrenti

L'introduzione di GPT-4o mini, insieme a modelli come Mistral NeMo e la famiglia SmolLM di Hugging Face, mostra la spinta del settore verso soluzioni di IA più accessibili ed efficienti.

Lo sviluppo simultaneo di potenti modelli open-source e SLM efficienti presenta significative opportunità per le aziende:

  • I modelli open-source come Llama 3.1 consentono una maggiore flessibilità e personalizzazione in diversi settori, rappresentando un'alternativa ai modelli closed source. In effetti, non si tratta di optare esclusivamente per un approccio in contrapposizione all'altro, ma di selezionare il modello più adeguato da un ampio ventaglio di strumenti disponibili per i nostri progetti di intelligenza artificiale.
  • Scalabilità economica: gli SLM consentono alle aziende di implementare soluzioni di IA su larga scala senza costi proibitivi
  • Applicazioni specializzate: la possibilità di mettere a punto modelli più piccoli consente lo sviluppo di soluzioni di IA specifiche per il settore
  • Bilanciamento tra prestazioni ed efficienza: le aziende devono valutare attentamente i compromessi tra dimensioni del modello, prestazioni e costi per i loro casi d'uso specifici.

Microsoft

Nel panorama in rapida evoluzione dell'intelligenza artificiale, Microsoft si è posizionata in prima linea con i suoi assistenti IA innovativi, noti come Copilots. Mentre l'introduzione dei Copilots da parte di Microsoft rappresenta un cambiamento significativo nel modo in cui le aziende approcciano il software di produttività, i risultati secondo una ricerca di Bloomberg non sono sempre completamente allineati con le aspettative.

I primi adottanti dei Copilots hanno riportato esperienze contrastanti:

  • Punti di forza: i Copilots eccellono nel riassumere informazioni, fornendo rapidi insight da grandi set di dati.
  • Sfide: a volte faticano a comprendere il contesto e a eseguire comandi complessi e multi-applicazione.
  • Timeline di adozione: l'integrazione diffusa è prevista gradualmente, con significativi benefici finanziari attesi entro il 2025.

L'efficace implementazione dei Copilots dipende da due fattori critici:

  1. Gestione dei dati:
    • Le aziende devono controllare attentamente i dati a cui i Copilots possono accedere per mitigare i rischi di sicurezza.
    • Assicurare che dati pertinenti e di alta qualità siano disponibili per l'IA è cruciale per generare output accurati e utili.
  2. Formazione dei dipendenti:
    • Una formazione adeguata è essenziale affinché i dipendenti sfruttino efficacemente le capacità dei Copilots.
    • Gli utenti devono comprendere come sollecitare l'IA, interpretare i suoi output e integrare i suoi suggerimenti nel loro flusso di lavoro.

Grandi aziende come Ernst & Young stanno guidando la strada nell'implementazione dei Copilots:

  • Implementazione graduale: il rollout è condotto in fasi per garantire una integrazione fluida.
  • Giustificazione dei costi: il sostanziale investimento nella tecnologia dei Copilots è giustificato dai guadagni di produttività e dagli aumenti di reddito previsti.

Per le aziende che cercano di adottare la tecnologia Copilot, considerare le seguenti strategie:

  1. Rollout graduale: implementare i Copilots gradualmente, partendo con programmi pilota in dipartimenti specifici.
  2. Formazione completa: sviluppare programmi di formazione robusti che coprano sia gli aspetti tecnici che le considerazioni etiche dell'uso dell'IA.
  3. Governance dei dati: stabilire protocolli chiari per l'accesso e la gestione dei dati per garantire che i Copilots dispongano di informazioni accurate, pertinenti e sicure.
  4. Valutazione continua: valutare regolarmente l'impatto dei Copilots sulla produttività e adeguare di conseguenza le strategie di implementazione.
  5. Integrazione culturale: promuovere una cultura che abbracci l'IA come strumento di supporto piuttosto che di sostituzione delle competenze umane.

Per sostenere la rivoluzione dell'IA (sia per i Copilots commerciali sia per la piattaforma Azure AI) Microsoft sta facendo investimenti senza precedenti nelle infrastrutture:

  • Spese in conto capitale: le spese per nuovi edifici e miglioramenti dei data center sono più che raddoppiate a $35,4 miliardi nell'ultimo anno fiscale.
  • Proiezioni future: la CFO Amy Hood prevede ulteriori aumenti negli investimenti in data center e chip nel prossimo anno fiscale. Sebbene le iniziative AI di Microsoft siano promettenti, l'azienda affronta sfide a breve termine nella gestione delle aspettative degli investitori:
    • Crescita di Azure: la crescita dell'unità di cloud computing è rallentata al 30%, con proiezioni di ulteriore decelerazione al 28-29% nel trimestre in corso.
    • Reazione degli investitori: la reazione iniziale negativa a queste cifre evidenzia l'equilibrio delicato che Microsoft deve mantenere tra investimento a lungo termine e performance a breve termine.

New trends

A luglio, sono emersi due importanti movimenti nel campo dell'intelligenza artificiale. L'avvento dei motori di ricerca alimentati dall'IA (in particolare SearchGPT di OpenAI) è destinato a sfidare il dominio di Google. Contemporaneamente, i progressi nella robotica umanoide stanno accelerando, promettendo di rivoluzionare le industrie e la vita quotidiana.

Un nuovo modo di cercare

OpenAI ha introdotto SearchGPT, un motore di ricerca guidato dall'IA progettato per competere direttamente con Google. Questo lancio potrebbe implicare un cambiamento epocale nel mercato dei motori di ricerca. Ecco cosa rende SearchGPT degno di nota:

  • Interfaccia utente e funzionalità: SearchGPT presenta un'interfaccia veloce e pulita simile a Perplexity. Fornisce risultati multimodali, inclusi grafici di borsa, immagini meteorologiche e video, migliorando l'esperienza utente.
  • Citazione delle fonti: un elemento distintivo è il suo impegno a citare le fonti delle sue risposte, affrontando le preoccupazioni di plagio e garantendo la credibilità.
  • Collaborazione con editori: OpenAI ha collaborato con numerosi editori per integrare i feed di contenuti e migliorare l'accuratezza dei risultati di ricerca. Questa collaborazione mira a creare un ecosistema fiorente di editori e creatori.

Le azioni di Google hanno subito un lieve calo dopo l'annuncio, sottolineando il riconoscimento del mercato di SearchGPT come un concorrente legittimo. Con funzionalità simili a ChatGPT, SearchGPT consente agli utenti di inserire query, ricevere informazioni in tempo reale e fare domande di follow-up, rendendo le ricerche web più intuitive ed efficienti.

L'introduzione di SearchGPT e altri strumenti di ricerca AI, come la funzione di ricerca generativa di Bing di Microsoft e il Pro Search di Perplexity AI, segna un'evoluzione significativa nella tecnologia di ricerca. Questi strumenti offrono sommari dinamici generati dall'IA che soddisfano le query degli utenti in modo più efficace rispetto ai motori di ricerca tradizionali. Tuttavia, questo cambiamento solleva anche preoccupazioni sull'impatto sul traffico web e sul potenziale di cannibalizzazione dei contenuti.

Gli strumenti di ricerca AI affrontano sfide come garantire l'accuratezza, evitare il plagio e mantenere un ecosistema web sano. Microsoft, ad esempio, ha affermato che la sua ricerca AI mantiene il numero di clic sui siti web, un fattore cruciale per sostenere gli editori. Nel frattempo, i recenti aggiornamenti di Perplexity alla sua funzione Pro Search migliorano la sua capacità di affrontare query complesse e risolvere problemi matematici avanzati, posizionandolo come un formidabile contendente nel mercato della ricerca AI.

Per le aziende, l'ascesa dei motori di ricerca alimentati dall'IA presenta sia opportunità che sfide. Le aziende devono adattare le loro strategie SEO per tenere conto dei contenuti generati dall'IA e garantire che la loro presenza online rimanga forte. Inoltre, le partnership con le aziende di IA potrebbero fornire nuove fonti di reddito attraverso la condivisione dei ricavi pubblicitari e altre iniziative collaborative.

Robotica umanoide: la prossima frontiera

La robotica umanoide sta avanzando rapidamente, con sviluppi significativi da parte di aziende come Figure AI, Skild AI e Mantee Robotics. Questi progressi promettono di trasformare varie industrie integrando capacità di IA nei robot fisici.

  • Figure AI: questa azienda ha raccolto $675 milioni per sviluppare robot umanoidi capaci di eseguire compiti complessi autonomamente. Questi robot stanno già assistendo nei processi di produzione di BMW, mostrando il loro potenziale nelle applicazioni industriali.
  • Skild AI: con un investimento di $300 milioni, Skild AI mira a creare un 'cervello a uso generale' per i robot, permettendo loro di gestire compiti diversificati in contesti domestici e industriali. Questo modello di base è addestrato su un ampio dataset, consentendo un'avanzata adattabilità.
  • Mantee Robotics: il loro robot umanoide, Menteebot, può navigare in nuovi ambienti seguendo gli esseri umani, evidenziando potenziali applicazioni in vari scenari reali.

Il progresso della robotica umanoide è destinato a seguire una traiettoria che va dall'automazione di magazzini e negozi a compiti più complessi come l'antincendio, la chirurgia e l'assistenza domiciliare. Sebbene la tecnologia potrebbe non avere un "momento ChatGPT" a causa delle limitazioni fisiche e degli alti costi, l'adozione graduale porterà probabilmente a trasformazioni profonde in molti settori.

Per i leader aziendali, l'ascesa della robotica umanoide presenta numerose opportunità strategiche. I primi adottanti nella produzione, nella sanità e in altri settori potrebbero ottenere un vantaggio competitivo sfruttando questi robot avanzati per migliorare l'efficienza e ridurre i costi del lavoro. Tuttavia, le aziende devono anche affrontare sfide come i costi di integrazione, la formazione della forza lavoro e la potenziale resistenza all'automazione.

Market News

Rilancio della modalità vocale avanzata di OpenAI

OpenAI ha rilanciato la sua modalità vocale avanzata alimentata da GPT-4o a un gruppo selezionato di utenti ChatGPT Plus, dopo averla inizialmente ritirata a causa di preoccupazioni sull'utilizzo della voce di Scarlett Johansson senza permesso.

Questa funzione aggiornata vanta capacità di conversazione più naturali e in tempo reale, consentendo agli utenti di interrompere e interagire in modo dinamico.

La funzione include quattro nuove voci preimpostate—Juniper, Breeze, Cove e Ember—realizzate con attori pagati per garantire la conformità etica. OpenAI sta gradualmente rilasciando questa funzione per garantirne la sicurezza e migliorare l'esperienza utente, pianificando la piena disponibilità entro l'autunno.

Assistente AI di Amazon, Rufus

L'assistente per lo shopping alimentato dall'IA di Amazon, Rufus, è ora disponibile per tutti i clienti statunitensi tramite l'app Amazon.

Rufus, addestrato sul vasto catalogo di prodotti di Amazon, recensioni dei clienti e domande e risposte della comunità, aiuta gli utenti a trovare e confrontare prodotti, fornendo anche raccomandazioni di acquisto guidate dall'IA. Inizialmente testato da un gruppo limitato di clienti, Rufus mira ora a offrire suggerimenti accurati e pertinenti. Nonostante le sue promesse, i test beta hanno rivelato che Rufus a volte ha avuto difficoltà con query non legate allo shopping e occasionalmente ha fornito raccomandazioni di qualità inferiore, evidenziando aree di miglioramento futuro. In ogni caso, questo è un importante caso d'uso per GenAI per ogni marketplace.

Supercluster di Memphis

Il supercluster di Memphis, soprannominato la "Gigafactory of Compute", rappresenta un salto senza precedenti nella potenza di calcolo. Con 100.000 GPU Nvidia H100 raffreddate a liquido, questa struttura supera i supercomputer precedenti come Frontier e Aurora in capacità. Consuma fino a 150 megawatt all'ora e utilizza oltre un milione di galloni d'acqua al giorno per il raffreddamento. Questa massiccia infrastruttura sottolinea la convinzione dell'industria tecnologica che i modelli di IA migliori richiedano supercomputer più grandi e potenti, capaci di addestramenti più rapidi ed efficienti dei modelli, come dimostrato dalle tempistiche teoriche di addestramento per sistemi come xAI.

Con questo investimento, Elon Musk promette di costruire entro la fine dell'anno il modello Gen AI più potente: Grok 3.

Ritardo nelle funzionalità di IA di Apple

Le tanto attese funzionalità di IA di Apple (collettivamente note come Apple Intelligence) non saranno parte del rilascio iniziale di iOS 18 a settembre.

D'altra parte, in Europa non le avremo comunque grazie alle nostre normative. Invece, queste funzionalità sono programmate per un rilascio graduale a partire da ottobre, con alcune funzionalità avanzate di Siri rinviate fino al 2025. Gli sviluppatori avranno accesso anticipato tramite le beta di iOS 18.1. Questo approccio cauto è in linea con la strategia di Apple di garantire rilasci di funzionalità stabili e ben rifiniti, anche se potrebbe deludere i fan impazienti. Il ritardo coincide anche con l'impegno di Apple nelle iniziative di sicurezza e fiducia nell'IA della Casa Bianca.

Segment Anything Model 2 (SAM 2) di Meta

Meta ha svelato il Segment Anything Model 2 (SAM 2), un'IA avanzata capace di identificare e tracciare oggetti attraverso fotogrammi video in tempo reale.

Questo modello estende le precedenti tecnologie di segmentazione delle immagini di Meta per affrontare sfide video come il movimento rapido e l'occultamento. SAM 2 può segmentare qualsiasi oggetto con pochi clic e Meta sta fornendo una demo gratuita e open-sourcing del modello insieme a un grande database video annotato per l'addestramento. Questa innovazione promette significativi avanzamenti nel video editing, nella realtà mista e nella ricerca scientifica.

 Rilascio di AI Studio di Meta

Meta ha lanciato AI Studio negli Stati Uniti, consentendo ai creatori di sviluppare i propri chatbot IA. Questa iniziativa mira ad aiutare i creatori ad estendere la loro portata e coinvolgere più fan.

Alimentati dai modelli Llama 3.1, questi chatbot fanno parte della strategia di Meta di open-sourcing dei suoi modelli linguistici, favorendo una più ampia creazione di contenuti.

Questa mossa è in linea con il modello di business di Meta di monetizzare l'attenzione tramite annunci piuttosto che abbonamenti o accesso API, incoraggiando applicazioni diverse e innovative della loro tecnologia IA.

Assistente vocale Chat AI di SoundHound AI

SoundHound AI ha integrato ChatGPT nel suo assistente vocale, ora disponibile nei veicoli Alfa Romeo e Citroën in tutta Europa. Questa integrazione espande la presenza di SoundHound nei marchi Stellantis e migliora le capacità di conversazione offerte ai conducenti, fornendo un'esperienza di guida più intuitiva e interattiva.

Aggiornamento V6.1 di Midjourney

Midjourney ha rilasciato la versione 6.1, che presenta significativi miglioramenti nella qualità dell'immagine, nella coerenza e nel rendering del testo. L'aggiornamento include anche nuovi modelli di upscaling e personalizzazione, offrendo un'elaborazione più veloce e un'estetica complessiva migliorata, permettendo agli utenti di creare immagini più raffinate e visivamente attraenti.

Gen 3 Alpha di Runway ML

Runway ML ha annunciato Gen 3 Alpha, un importante aggiornamento del suo modello di generazione di testo in video, ora capace di trasformare immagini statiche in clip video di alta qualità. Questo strumento, simile a Luma Dream Machine, migliora il controllo artistico e la coerenza nella generazione video.

Gli utenti possono creare video dalle immagini utilizzando crediti all'interno dei livelli di abbonamento di Runway. Nonostante i suoi alti costi, questa funzione apre nuove possibilità creative, permettendo agli utenti di dare vita alle immagini statiche con un controllo e una coerenza migliorati. 

Legal e Compliance

In questo appuntamento, analizziamo nuovamente le ripercussioni che le decisioni politiche dell'Unione Europea hanno sul nostro contesto.

Meta ha recentemente annunciato che non lancerà il suo prossimo modello di IA multimodale Llama nell'Unione Europea, citando preoccupazioni riguardo all'ambiente normativo della regione. Questo modello, capace di elaborare video, audio, immagini e testo, sarà disponibile con una licenza open altrove ma non nell'UE.

Un portavoce di Meta ha evidenziato la natura imprevedibile delle regolamentazioni dell'UE come principale motivo di questa decisione. Questa mossa impedirà alle aziende europee di sfruttare le capacità avanzate del modello multimodale Llama, potenzialmente mettendole in svantaggio competitivo rispetto alle aziende di altre regioni.

Le rigide regolamentazioni dell'IA dell'UE, inclusi il recentemente finalizzato AI Act e il Digital Markets Act, hanno spinto grandi aziende tecnologiche come Meta e Apple a riconsiderare i loro lanci di prodotti nella regione. Queste leggi impongono misure di conformità complete riguardanti il copyright, la trasparenza e le applicazioni di IA, come il predictive policing. Di conseguenza, Meta ha anche bloccato i suoi piani di rilascio di un assistente IA nell'UE e ha sospeso i suoi strumenti di IA generativa in Brasile per preoccupazioni simili legate alla protezione dei dati. La decisione di trattenere queste tecnologie avanzate dal mercato dell'UE sottolinea la frizione tra innovazione e conformità normativa, ma soprattutto tra innovazione e aleatorietà delle norme e loro indeterminatezza.

Le aziende dell'UE stanno ora affrontando barriere significative per l'accesso e lo sviluppo di applicazioni basate su modelli di IA avanzati. L'esclusione dei modelli multimodali di Meta significa che le aziende europee non possono partecipare pienamente agli ultimi progressi dell'IA. Questo ambiente normativo influisce anche sulle aziende fuori dall'UE che sviluppano prodotti per il mercato europeo. La decisione di Meta di ritardare la raccolta dei dati dagli utenti dell'UE complica ulteriormente la situazione, poiché limita l'ambito di addestramento dell'IA sui dati europei. L'approccio normativo più trasparente del Regno Unito serve come netto contrasto, indicando che linee guida più chiare potrebbero mitigare alcune di queste sfide.

La natura restrittiva delle regolamentazioni dell'UE non sta solo impattando Meta. Apple e OpenAI hanno incontrato ostacoli, con Apple che ha rinunciato alle funzionalità di IA generativa per dispositivi iOS nell'UE e OpenAI che affronta l'attenzione a più riprese del Garante Italiano.

L'approccio dell'UE, pur mirando a proteggere la privacy degli utenti e a promuovere un uso etico dell'IA, rischia di soffocare l'innovazione e spingere le aziende tecnologiche a de-prioritizzare il mercato europeo. Questo panorama normativo potrebbe ostacolare la capacità dell'UE di rimanere competitiva nella corsa globale all'IA, poiché le aziende potrebbero preferire regioni con politiche più favorevoli.

Paradossalmente, le voci che indicano la classificazione dei componenti di cybersecurity basati sull'IA come ad alto rischio secondo l'AI Act pongono ulteriori sfide. Questa classificazione, che richiede valutazioni da terze parti e ha requirements per la compliance almeno a 6 zeri, potrebbe scoraggiare lo sviluppo e la distribuzione di soluzioni di cybersecurity alimentate dall'IA. Dato che gli attori malintenzionati sfrutteranno l'IA indipendentemente dalle regolamentazioni, imporre tali oneri agli avanzamenti nella cybersecurity potrebbe risultare controproducente. I criteri stringenti della Commissione Europea per i prodotti di IA ad alto rischio potrebbero involontariamente indebolire la difesa della regione contro le minacce informatiche.

Anche il Financial Times ha riportato preoccupazioni tra le startup tecnologiche riguardo agli oneri finanziari e operativi imposti dalla legislazione sull'IA dell'UE. I costi di conformità potrebbero essere proibitivi per le piccole imprese, potenzialmente soffocando l'innovazione e l'imprenditorialità. La mancanza di chiarezza sui diritti di proprietà intellettuale e la necessità di numerose legislazioni secondarie complicano ulteriormente il panorama normativo. Si teme che potenti gruppi di affari possano influenzare le regole a loro vantaggio, lasciando le piccole aziende in difficoltà nel mantenere il passo.

Altro esempio dell'approccio della Commissione Europea è la recente azione contro Meta secondo il Digital Markets Act. Questo illustra la crescente attenzione normativa che le aziende tecnologiche affrontano nell'UE. La decisione di Meta di offrire un modello basato su abbonamento o pubblicità mirata è stata criticata per non fornire un'opzione equivalente di annunci non personalizzati. Questa insistenza su versioni di servizio aggiuntive per gli utenti dell'UE esemplifica le sfide normative che potrebbero scoraggiare le aziende dall'innovare all'interno della regione. L'inchiesta della Commissione sulla gestione da parte di Meta dello strumento CrowdTangle evidenzia ulteriormente la complessa e spesso controversa relazione tra le aziende tecnologiche e i regolatori dell'UE. I risultati dell'approccio della Commissione Europea sono chiari, stiamo affrontando battute d'arresto in vari settori, tra cui quello economico, tecnologico e dell'influenza geopolitica.

La recente indagine antitrust della Competition and Markets Authority (CMA) del Regno Unito sulla partnership di Microsoft con la startup di IA Inflection evidenzia un'altra dimensione delle sfide normative. L'inchiesta sulle politiche di reclutamento di Microsoft e sulla loro potenziale natura di "quasi-acquisizione" evidenzia il delicato equilibrio tra il promuovere l'innovazione e impedire pratiche contrarie alla libera concorrenza. Ma in questo caso, per lo scrivente il dubbio è lecito, dal momento che Microsoft ha praticamente svuotato Inflection dalle persone chiave. L'esito di questa indagine, insieme a indagini simili della Federal Trade Commission (FTC) degli Stati Uniti, plasmerà i futuri quadri normativi e il loro impatto sullo sviluppo dell'IA.

Dall'altra parte dell'Oceano Atlantico, il dibattito sui modelli di IA riflette anche tensioni normative più ampie. Mentre i modelli aperti promuovono l'innovazione e la concorrenza, comportano rischi maggiori a causa della loro natura aperta. La National Telecommunications and Information Administration (NTIA) negli Stati Uniti supporta l'uso di questi modelli, enfatizzando il loro ruolo nel favorire i progressi tecnologici. Tuttavia, la richiesta di nuove capacità di monitoraggio indica la necessità di regolamentazioni equilibrate che proteggano l'innovazione senza soffocarla.

Military and Defense

L’AI è entrata di prepotenza anche in Ucraina nella progettazione e sviluppo delle armi, in particolare mi preme sottolineare l’utilizzo dell’AI nei droni.

L'Ucraina si è posizionata in prima linea nell'integrazione dell'IA nelle sue operazioni militari per contrastare le capacità tecnologiche delle forze russe. Un sviluppo chiave è il dispiegamento di droni abilitati all'IA, progettati per operare in sciami, coordinare attacchi e identificare bersagli autonomamente. Questi droni affrontano sfide critiche sul campo di battaglia come il disturbo del segnale, che può interrompere i collegamenti di comunicazione tra droni e operatori umani. Gli algoritmi di IA garantiscono che questi droni possano continuare le loro missioni anche se le comunicazioni vengono interrotte, migliorandone la resilienza e l'efficacia.

Il governo ucraino ha avviato diversi programmi per accelerare l'adozione delle tecnologie IA nelle applicazioni militari. Una iniziativa notevole è il programma Brave1, uno sforzo guidato dal governo per promuovere l'innovazione nella tecnologia militare attraverso la collaborazione con aziende tecnologiche locali e occidentali. Questo programma ha già approvato numerose invenzioni per l'uso da parte delle Forze Armate Ucraine, concentrandosi principalmente su sistemi senza pilota e soluzioni guidate dall'IA.

Nonostante questi progressi, la supervisione umana rimane cruciale nel dispiegamento delle armi IA. Mentre l'IA può assistere nell'identificazione dei bersagli e nella navigazione, la decisione finale di ingaggiare un bersaglio viene ancora presa da un operatore umano. Tuttavia, c'è una spinta continua verso lo sviluppo di sistemi completamente autonomi che potrebbero potenzialmente operare senza supervisione umana diretta, sollevando considerazioni etiche e operative.

Il Ministero della Difesa giapponese ha recentemente rilasciato la sua prima politica di base sull'uso dell'intelligenza artificiale nelle applicazioni militari. Questa politica mira ad affrontare le sfide di reclutamento e garantire che il Giappone tenga il passo con i progressi globali nella tecnologia della difesa. La politica delinea sette aree prioritarie per il dispiegamento dell'IA, tra cui il rilevamento dei bersagli, l'analisi dell'intelligence e i sistemi senza pilota.

Il Giappone vede l'IA come una soluzione potenziale alle sue sfide demografiche, in particolare la sua popolazione in rapido invecchiamento e riduzione, che attualmente influisce sul reclutamento militare. La strategia enfatizza il mantenimento del controllo umano sui sistemi IA, escludendo esplicitamente lo sviluppo di armi letali completamente autonome. Questa posizione è significativa in quanto stabilisce un precedente per l'uso responsabile dell'IA in contesti militari, potenzialmente influenzando gli approcci di altre nazioni nella corsa agli armamenti IA.

Il Ministero della Difesa giapponese ha evidenziato l'uso militare dell'IA da parte di Stati Uniti e Cina come parte della necessità urgente di sfruttare la tecnologia per aumentare l'efficienza. La politica riflette un approccio equilibrato, mirando a sfruttare i benefici dell'IA mentre si mitigano i rischi, stabilendo così un modello potenziale per altri paesi da seguire.

Scientifics

La svolta di Google DeepMind all'Olimpiade Matematica Internazionale

Due dei più recenti sistemi di IA di Google DeepMind, AlphaProof e AlphaGeometry 2, hanno ottenuto una notevole medaglia d'argento all'Olimpiade Matematica Internazionale (IMO). L'IMO è rinomata per i suoi problemi impegnativi che mettono alla prova i matematici pre-college ai loro limiti durante due intense sessioni di 4,5 ore. L'IA di DeepMind ha risolto con successo quattro su sei problemi, totalizzando 28 su 42 punti, solo un punto in meno rispetto alla medaglia d'oro.

In particolare, questi sistemi di IA hanno risolto il problema più difficile, un'impresa che solo cinque concorrenti umani sono riusciti a realizzare.

Il contesto di questo risultato è cruciale. Mentre i concorrenti umani avevano circa nove ore per risolvere i problemi, l'IA è riuscita a risolvere un problema in meno di 19 secondi ma ha impiegato fino a tre giorni per risolvere gli altri. Questa prestazione, inizialmente prevista come raggiungibile dall'IA in 5-7 anni, dimostra i rapidi progressi nelle capacità di problem-solving dell'IA. Attualmente, l'IA di DeepMind può risolvere l'83% dei problemi di geometria storici dell'IMO degli ultimi 25 anni, rispetto al 53% della sua iterazione precedente.

Questo progresso dimostra la crescente capacità dell'IA di affrontare problemi che richiedono creatività, ragionamento e problem-solving complesso, competenze tradizionalmente considerate unicamente umane. Man mano che l'IA continua a progredire, alcuni ricercatori prevedono una vittoria con medaglia d'oro alla competizione IMO del 2025, indicando il potenziale per l'arrivo di un'IA super-potente prima del previsto.

Eureka Labs: la piattaforma educativa integrata con l'IA di Andrej Karpathy

Il membro fondatore di OpenAI e ex Direttore dell'IA di Tesla, Andrej Karpathy, ha lanciato Eureka Labs, una nuova piattaforma educativa integrata con l'IA. Eureka Labs mira a sfruttare l'IA avanzata per migliorare l'esperienza di apprendimento. La sua prima offerta, LLM101n, è un corso di livello universitario progettato per insegnare agli studenti come addestrare i propri modelli di IA. La piattaforma combina l'expertise umana con assistenti didattici IA, fornendo opzioni di coorte sia digitali che fisiche. Karpathy, che ha lasciato OpenAI a febbraio per perseguire progetti personali, ha condiviso attivamente contenuti educativi sull'IA su YouTube. Eureka Labs rappresenta un grande cambiamento verso l'istruzione personalizzata e guidata dall'IA, con il potenziale di rimodellare significativamente i paradigmi di apprendimento.

SpreadsheetLLM: migliorare la capacità dell'IA di elaborare fogli di calcolo

I ricercatori di Microsoft hanno introdotto SpreadsheetLLM, un nuovo metodo per migliorare la capacità dei modelli linguistici di grandi dimensioni di elaborare i fogli di calcolo. SpreadsheetLLM incorpora un metodo di serializzazione di base, integrando indirizzi di cella, valori e formati. Per superare i vincoli di token, i ricercatori hanno sviluppato SheetCompressor, un framework di codifica efficiente che migliora le prestazioni nei compiti sui fogli di calcolo. Raggiungendo un rapporto di compressione di 25 volte e un punteggio F1 del 78,9%, SpreadsheetLLM supera i modelli esistenti. Questa innovazione consente all'IA di gestire meglio le complessità dei fogli di calcolo, riducendo le allucinazioni e migliorando l'affidabilità degli output dell'IA. Questo progresso ha significative implicazioni per l'analisi aziendale, l'analisi finanziaria e la scienza dei dati, potenzialmente integrando capacità di IA più potenti direttamente in strumenti come Excel.

Definire i risultati dell'IA: comprendere i livelli di AGI

OpenAI e Google DeepMind hanno entrambi sviluppato sistemi di classificazione per definire la progressione verso l'Artificial General Intelligence (AGI). Il sistema di classificazione interno di OpenAI include:

  • Livello 1: Chatbots - IA di base per compiti specifici.
  • Livello 2: Reasoners - Risolutori di problemi a livello di dottorato.
  • Livello 3: Agents - Sistemi di IA capaci di azioni autonome per lunghi periodi.
  • Livello 4: Innovators - IA simile a Thomas Edison, che guida significative innovazioni.
  • Livello 5: Organizations - Un'unica IA che svolge i ruoli di un'intera azienda.

Attualmente, OpenAI è sulla soglia del Livello 2, dimostrando un'IA che si avvicina al ragionamento umano.

La scala di AGI di Google DeepMind, d'altra parte, è su 6 livelli:

  • Livello 1: AGI di base - Capacità limitate con minima generalizzazione.
  • Livello 2: AGI intermedio - Capacità moderate con generalizzazione più ampia.
  • Livello 3: AGI avanzato - Capacità elevate con significativa generalizzazione e autonomia.
  • Livello 4: AGI superiore - Capacità eccezionali vicine alle prestazioni umane.
  • Livello 5: AGI definitivo - Capacità simili a quelle umane con piena generalizzazione e autonomia.
  • Livello 6: AGI super intelligente - Supera di gran lunga l'intelligenza umana con straordinaria generalizzazione e autonomia.

Queste classificazioni forniscono un quadro per comprendere la progressione e il potenziale impatto dell'AGI, evidenziando le possibilità trasformative man mano che la tecnologia dell'IA continua a evolversi.

AI in Healthcare

DrugGPT: Migliorare le prescrizioni mediche in Inghilterra

Un nuovo strumento di IA chiamato DrugGPT, sviluppato presso l'Università di Oxford, è destinato a rivoluzionare le prescrizioni mediche in Inghilterra, fornendo una 'rete di sicurezza' per i medici. Questo strumento mira a ridurre i 237 milioni di errori di prescrizione annuali offrendo informazioni complete ai medici, garantendo che prescrivano correttamente i farmaci e aiutando i pazienti a comprendere meglio le loro prescrizioni. L'integrazione di DrugGPT nel sistema sanitario promette di migliorare la sicurezza dei pazienti e l'aderenza ai regimi terapeutici, potenzialmente salvando innumerevoli vite e migliorando i risultati complessivi della salute. 

Predire la progressione dell'Alzheimer con l'IA

I ricercatori dell'Università di Cambridge hanno sviluppato uno strumento di IA capace di prevedere se i pazienti con lieve compromissione cognitiva progrediranno verso la malattia di Alzheimer con oltre l'80% di accuratezza.

Questo modello di IA analizza i dati delle valutazioni cognitive e delle scansioni MRI, eliminando la necessità di procedure costose e invasive come le scansioni PET e le punture lombari. Lo strumento classifica i pazienti in tre gruppi: quelli che probabilmente rimarranno stabili, quelli che potrebbero progredire lentamente e quelli a rischio di rapido declino. Validato con sei anni di dati di follow-up e testato in cliniche della memoria in tutto il mondo, questo strumento riduce significativamente i tassi di diagnosi errate e potrebbe svolgere un ruolo cruciale nella diagnosi precoce e nel trattamento proattivo dell'Alzheimer, soprattutto con i casi di demenza che si prevede triplicheranno nei prossimi 50 anni.

Thrive AI Health: Coaching della salute personalizzato

Il fondo per startup di OpenAI, insieme a Ariana Huffington, fondatrice di Huffington Post e Thrive Global, ha lanciato un coach per la salute alimentato dall'IA chiamato Thrive AI Health. Questa IA generativa offrirà consigli e raccomandazioni personalizzati su sonno, dieta, fitness, gestione dello stress e connessioni sociali. Addestrato su un robusto dataset che include scienza, biometria e dati di laboratorio, Thrive AI Health mira a fornire coaching esperto accessibile per la salute. Nonostante il significativo supporto da investitori strategici come la cofondatrice di Walmart, Helen Walton, e la leadership di DeCarlos Love, l'iniziativa affronta sfide. Le precedenti app di salute hanno avuto difficoltà con problemi aziendali, tecnici e normativi, in particolare riguardo alla privacy degli utenti. Thrive AI Health dovrà affrontare queste sfide per avere successo nella democratizzazione della tecnologia per la salute.

Ricostruzione dell'attività cerebrale alimentata dall'IA

I ricercatori dell'Università Radboud hanno sviluppato un sistema di IA capace di ricostruire immagini sorprendentemente accurate di ciò che qualcuno sta guardando, basandosi sulle registrazioni dell'attività cerebrale. Il team ha utilizzato scansioni fMRI di umani e registrazioni dirette degli elettrodi dai macachi per catturare l'attività cerebrale. Il sistema di IA, potenziato per concentrarsi su specifiche aree del cervello, ha migliorato significativamente l'accuratezza della ricostruzione. Le ricostruzioni sono le più vicine e accurate mai ottenute, come affermato dal ricercatore principale Umut Güçlü. Sebbene lo studio presenti limitazioni, come l'uso di immagini già presenti nel dataset, questa ricerca è rivoluzionaria. Apre possibilità per aiutare le vittime di ictus a comunicare, ricreare sogni e altre applicazioni significative man mano che la tecnologia continua a progredire.

Various

La visione di Sam Altman per la leadership nell'IA

Sam Altman, CEO di OpenAI, ha recentemente scritto un editoriale enfatizzando l'urgente necessità per gli Stati Uniti di guidare una coalizione globale nello sviluppo dell'IA per contrastare i regimi autoritari. Egli delinea quattro azioni chiave: misure di sicurezza robuste, investimenti in infrastrutture, diplomazia commerciale coerente e nuovi modelli per la governance globale dell'IA. Altman propone la creazione di un organismo di supervisione internazionale per l'IA, simile all'AIEA o all'ICANN. Il suo tono urgente sottolinea le poste in gioco elevate nella corsa all'IA, sostenendo che o le nazioni democratiche guidano lo sviluppo dell'IA, o lo faranno i regimi autoritari, rendendo questa una chiamata critica all'azione per mantenere la dominanza dell'IA.

Il nuovo modello di IA open-source di Apple: DCLM-7B

Apple ha svelato un nuovo modello di IA open-source con 7 miliardi di parametri, DCLM-7B, che supera Mistral 7B e compete da vicino con i principali modelli come Llama 3 e Gemma. Il modello DCLM-7B raggiunge un'accuratezza del 63,7% a 5-shot sul MMLU. Apple ha open-sourced non solo i pesi del modello e il codice di addestramento, ma anche l'intero dataset di pretraining. Questo approccio completo fornisce agli sviluppatori e ai ricercatori di tutto il mondo un accesso senza precedenti al modello e ai suoi processi sottostanti, potenzialmente accelerando lo sviluppo e l'innovazione dell'IA.

Restrizioni di addestramento dell'IA sui principali siti web

Secondo recenti rapporti, circa il 25% dei principali siti web ha implementato restrizioni di addestramento dell'IA tramite file robots.txt. Questo sviluppo limita i dati disponibili per l'addestramento dei modelli di IA, ponendo sfide per gli sviluppatori di IA che si affidano a fonti di dati diversificate per migliorare l'accuratezza e le prestazioni del modello.

Project Strawberry di OpenAI

Documenti interni trapelati rivelano che OpenAI sta sviluppando un nuovo modello chiamato Project Strawberry, progettato per navigare autonomamente su Internet e svolgere ricerche approfondite in modo indipendente. Project Strawberry mira a ridurre le allucinazioni dell'IA migliorando la capacità del modello di accedere e processare informazioni. Utilizza un metodo Self-Taught Reasoner (STaR), permettendo all'IA di apprendere e migliorare dai suoi processi di ragionamento. Sebbene la data di lancio e l'integrazione con GPT-5 siano incerte, questo sviluppo evidenzia il focus di OpenAI sul potenziamento delle capacità dell'IA affrontando al contempo le preoccupazioni sulla sicurezza.

App Studio di Amazon

Amazon ha annunciato App Studio, un nuovo strumento che crea applicazioni software aziendali da prompt scritti, utilizzando modelli di IA multipli, tra cui Amazon Titan e Anthropic. App Studio è progettato per utenti tecnici che non hanno competenze di codifica ma comprendono le loro esigenze software.

Genera codice basato su descrizioni degli utenti e fonti di dati, fornendo un'esperienza user-friendly senza curva di apprendimento. Questo strumento mira a democratizzare lo sviluppo software, consentendo a più individui di creare applicazioni personalizzate senza una conoscenza approfondita della codifica.

Il ritiro di Microsoft dal cda di OpenAI

Microsoft ha ritirato il suo seggio di osservatore nel cda di OpenAI dopo otto mesi. In una lettera a OpenAI, Microsoft ha citato i significativi progressi compiuti dal nuovo consiglio come motivo del loro ritiro, affermando che il loro ruolo di osservatore non è più necessario. Tuttavia, ci sono rapporti che suggeriscono che la pressione normativa sulla partnership di Microsoft con OpenAI abbia avuto un ruolo in questa decisione. La Federal Trade Commission (FTC) e la Competition and Markets Authority (CMA) del Regno Unito stanno esaminando le relazioni di Microsoft con altre aziende di IA, sollevando interrogativi sulla concorrenza leale.

Il nuovo strumento di Anthropic per la prompt engineering

Anthropic, concorrente di OpenAI, ha introdotto nuove funzionalità al suo Large Language Model (LLM) Claude, mirate a migliorare la prompt engineering. Lo strumento genera, testa e valuta prompt, fornendo agli sviluppatori feedback perspicaci per migliorare l'efficacia dei loro prompt. Gli sviluppatori possono confrontare le prestazioni dei prompt affiancati utilizzando esempi reali o casi di test generati dall'IA. Questa funzione, trovata nella scheda 'Evaluate' della Console di Claude, è progettata per risparmiare tempo agli ingegneri di prompt e migliorare i risultati complessivi delle applicazioni IA. Il CEO di Anthropic, Dario Amodei, sottolinea che la prompt engineering raffinata è cruciale per una più ampia adozione e impatto della tecnologia IA.

 

Daniele Grandini

Daniele Grandini

Ha più di 30 anni di esperienza nel campo delle applicazioni e dei sistemi distribuiti, con competenze in sviluppo software, architetture di monitoring, progettazione di servizi gestiti e soluzioni cloud ibride.
È Microsoft MVP dal 2009 e speaker in diverse conferenze nazionali.
In qualità di Chief Innovation Officer, coordina le iniziative per i servizi gestiti e data analytics e AI in Impresoft 4ward.