Benvenuti alla nostra rubrica mensile dedicata alle ultime novità nel campo dell'intelligenza artificiale. Anche questo mese esploriamo un panorama molto complesso, con notizie che si sovrappongono e spingono l'intelligenza artificiale verso nuovi orizzonti. Iniziamo subito dai tops of the month.
Tops of the month
Sono due le notizie più importanti, per me, questo mese. La prima è l'uscita da parte di Anthropic di Cloude 3, il primo LLM (Large Language Model) closed source che è in grado di superare GPT-4 di OpenAI. Infatti, secondo tutti i benchmark, anche se di poco, Cloude 3 è più performante di GPT-4. Inoltre, nella classifica fatta dagli utenti su Chatbot Arena, riguardo ai Large Language Models, Cloude 3 si è posizionato al primo posto, davanti a GPT-4.
Mi riferisco a Cloude 3 Opus, il modello più evoluto lanciato da Anthropic. A titolo informativo, Chatbot Arena è gestita da Large Model Systems Organization (LMSYS ORG), un'organizzazione di ricerca che consiste in una cooperazione tra studenti e professori dell'Università della California, Berkeley, UC San Diego e Carnegie Mellon University.
La notizia dimostra come i Large Language Models stiano arrivando al livello di GPT-4, ma anche che (poiché GPT-4 è uscito circa un anno fa) OpenAI ha accumulato un vantaggio di quasi 12 mesi.
Il mese è stato segnato anche dal rilascio del testo (che si può considerare definitivo) delle AI Act da parte del Parlamento Europeo. Il Parlamento Europeo ha approvato il testo e ora resta solo il via libera finale del Consiglio dell’UE. Il testo è molto complesso, lo abbiamo già analizzato precedentemente, perché conta quasi 500 pagine.
News from Microsoft
Microsoft mantiene il suo ruolo di leader tra i principali attori dell'intelligenza artificiale sia per il settore business sia per quello consumer.
Questo meso segnalo, dal lato della ricerca, grandi investimenti nei Small Language Model, con il lancio di Orca Math, è uno Small Language Model dedicato alla risoluzione di problemi matematici e algebrici. Microsoft prosegue questa tendenza dopo il lancio di Phi-2 nei mesi precedenti. Gli Small Language Model sono molto interessanti anche per la loro possibilità di essere eseguiti su hardware ridotti, fino a ipotizzare la loro esecuzione sui nostri cellulari. La chiave è nella qualità dei dati usati per allenare questi modelli, si veda “textbooks are all you need”.
Da inizio Aprile, Microsoft ha reso disponibile Copilot for Security. L'utilizzo dell'AI per la cybersecurity è, a mio avviso, una delle applicazioni più promettenti dell'intelligenza artificiale, che potrebbe portare a migliori prestazioni in termini di tempestività di rilevamento, efficienza, capacità di individuare le minacce, ricostruire la catena di attacco, aiutare le operazioni di protezione. Copilot for Security opera, in prima battuta, con tutto l'ecosistema di sicurezza di Microsoft (Defender e Sentinel), ma può anche essere integrato con sistemi di terze parti. Sulla pagina dedicata a Copilot for Security si possono vedere quali sono i plugin già disponibili. Copilot for Security è incluso all'interno dei prodotti di sicurezza di Microsoft, ma offre anche la possibilità di poter essere usato in pay as you go, così si può sperimentare lo strumento pagando solo per le ore di uso del chatbot con i propri dati di sicurezza.
Parlando di novità, probabilmente il Copilot per la produttività individuale più avanzato è quello per Microsoft Teams: lo uso regolarmente ed è diventato uno strumento insostituibile nella mia giornata lavorativa.
Microsoft sta per rilasciare un major upgrade per questo assistente digitale per Teams con innovazioni davvero sorprendenti:
- Riassunti delle Riunioni: Copilot è in grado di combinare trascrizioni vocali e chat scritte in una singola vista, facilitando il recupero sarà elle riunioni perse.
- Composizione dei Messaggi: Copilot in Teams riceverà miglioramenti per la composizione dei messaggi in chat, consentendo agli utenti di riformulare un messaggio in modi nuovi.
- Riconoscimento del Parlante: Copilot avrà il riconoscimento del parlante in Teams, permettendo di identificare correttamente chi parla nei riassunti delle riunioni.
A testimonianza dell'investimento continuo che Microsoft sta conducendo sull’AI, è necessario segnalare l’assunzione di Mustafa Suleyman, CEO e founder di Inflection AI e, prima ancora, di Google Deepmind. Guiderà la divisione dedicata all'intelligenza artificiale per i prodotti consumer.
Il mese è stato anche segnato dal lancio del Copilot Pro per Android e iOS. Questa è la versione a pagamento che offre funzionalità esclusive per l’uso di GPT-4, la creazione di propri GPTs, l’integrazione di Copilot nelle applicazioni M365 per la produttività e un limite più alto nella generazione delle immagini con Dall-e 3. Il costo è di 22€/mese.
Inoltre, Microsoft ha introdotto la possibilità di modificare le immagini generate tramite richieste su aree specifiche. Si tratta della versione ora accessibile di una funzione che OpenAI aveva in anteprima.
Come ultima notizia riguardante Microsoft, è stato annunciato il progetto, in collaborazione con OpenAI, di realizzare un super computer da 100 miliardi di dollari, chiamato "Stargate", che dovrebbe essere pronto nel 2028. Il super computer sarà 100 volte più grande rispetto a qualsiasi altro super computer conosciuto (e anche 100 volte più costoso, aggiungo).
New Trends
Rispetto ai nuovi trend nell'industria AI, questo mese voglio portarne all'attenzione tre.
Uno dei trend emergenti è la crescita di attacchi sempre più mirati, che colpiscono l'AI generativa. In particolare, le architetture basate su agenti autonomi o semi-autonomi sono vulnerabili allo sviluppo di worm che, sfruttando queste architetture, possono creare nuovi tipi di attacchi che generano spam, phishing, information disclosure e altro. Un caso interessante è lo studio [2403.02817] Here Comes The AI Worm: Unleashing Zero-click Worms that Target GenAI-Powered Applications (arxiv.org).
Un altro trend importante è quello dei coding agents, cioè degli strumenti di intelligenza artificiale che aiutano a scrivere codice. Si potrebbe menzionare Devin di Cognition, ma da quando c'è GitHub Copilot il mercato si è fatto più vario e con diverse soluzioni (ad esempio con o senza prompting).
La robotica umanoide è il terzo trend da evidenziare. In questo settore, NVidia non si ferma: i grandi risultati ottenuti nell'anno passato e che si stanno confermando anche nel 2024, inducono il gigante a fare investimenti. Il gigante dei chip ha instaurato collaborazioni con diverse imprese di robotica (Figure, Apptronik, Agility Robotics, Sanctuary AI, and Unitree) per realizzare sistemi che grazie alla GenAI possano non solo interagire in modo naturale con l'umano, ma anche apprendere nuove abilità dall'esperienza.
Market News
Inflection, orfana di Suleyman, ha rilasciato Inflection-2.5 a supporto del suo “Pi personal AI assistant”. Assistente estremamente interessante che uso per programmare visite ed attività ricreative.
NVidia continua a puntare sul suo core business, con il suo nuovo chip B200 Blackwell che è 30 volte più veloce e 25 volte più efficiente del precedente H100. Con questo tipo di processore, NVidia afferma di poter allenare modelli fino a 10 Trilioni di parametri. Il CEO di NVidia, Huang, ha anche svelato in un'intervista che GPT-4 ha oggi 1.8 trilioni di parametri e che questo modello richiede 2000 chip Blackwell per essere addestrato in 90 giorni.
NVidia ha anche lanciato 24 soluzioni specifiche per l’healthcare e il pharma. Questo è un settore che sta investendo molto sull’AI e mostra ancora una volta come NVidia non si stia accontentando, ma stia usando i suoi grandi profitti per innovare con i propri chip. Tra gli annunci degni di nota quelli con Johnson e Johnson per l'utilizzo della generative AI in chirurgia e con GE Health per il miglioramento del riconoscimento delle immagini mediche.
Riguardo ai trend del mercato, segnalo la conferma di Amazon nell'apportare un investimento in Anthropic. Amazon sembra proprio aver scelto Anthropic come partner per le proprie iniziative sui modelli di LLM generativi, investendo altri 2,75 miliardi di dollari, portando l'investimento totale a 4 miliardi. Pertanto, i modelli prodotti da AWS (come Titan) sono al momento abbandonati.
Il fatto più rilevante del mese nell'ambito dei modelli open source riguarda il lancio di DBRX, il modello sviluppato da Databricks. Da tutti i test, risulta essere il modello open source attualmente con le performance migliori, battendo Grok, Llama, Mistral e gli altri. Il modello mostra performance simili o leggermente superiori a GPT-3.5.
Legal & Compliance
L'Europa è all'avanguardia nella regolamentazione dell'intelligenza artificiale con la propria legge sull'AI Act, come lo è stata per le leggi sulla privacy con il GDPR. L’AI Act ha l’ambizioso obiettivo di bilanciare la sicurezza e la privacy dei propri cittadini di fronte a questa nuova tecnologia rivoluzionaria e la necessità di innovare. Abbiamo, infatti, spesso affermato che l'intelligenza artificiale non è una tendenza temporanea, ma è qualcosa che segnerà i prossimi decenni in termini di evoluzione tecnologica, economica e sociale.
Contemporaneamente, negli Stati Uniti, mentre si aspetta ancora l'Executive Order del presidente Biden, il governo federale ha stabilito una policy che obbliga tutte le agenzie federali a avere un Chief AI Officer per regolamentare e coordinare gli investimenti e l'utilizzo dell'intelligenza artificiale.