Meta lancia il suo modello linguistico gratuito. Si chiama Llama 2 e vuole sfidare OpenAI
di Sergio Donato - 19/07/2023 11:057
Meta lancia il suo modello linguistico gratuito. Si chiama Llama 2 e vuole sfidare OpenAI
Llama 2 ha un massimo di 70 miliardi di parametri ed è offerto gratuitamente anche per scopi commerciali e di ricerca. In italiano potrebbe non cavarsela benissimo.
Meta ha annunciato e reso disponibile a chiunque il suo nuovo modello linguistico di grandi dimensioni Llama 2, che potrà essere usato anche per scopi commerciali e di ricerca. Il modello lancia indirettamente una sfida a GPT-4 di OpenAI sul quale si basano il chatbot ChatGPT e Bing Chat.
ChatGPT tutorial: i trucchi e i comandi per avere risposte migliori e più precise
Il palcoscenico per il lancio è stato l’evento Microsoft Inspire di ieri con il quale l’azienda di Redmond ha presentato le novità per i suoi partner, soprattutto nel settore business. Meta è uno di questi. Durante l’evento, Meta ha sottolineato anche la crescente collaborazione con Microsoft e il supporto ad Azure e Windows.
Il nuovo modello linguistico di grandi dimensioni Llama 2, ha spiegato Meta, è nato per dare alle aziende, alle startup e ai ricercatori l'accesso a un maggior numero di strumenti di IA. Rispetto a Llama 1 è stato addestrato su un numero di dati superiore del 40%.
In modo molto generico, Meta ha comunicato che Llama 2 è stato addestrato su “un nuovo mix di dati online pubblicamente disponibili”, e ha dichiarato che è stato supervisionato con test di sicurezza per evitare che venga usato per attività illecite e pericolose.
Llama 2 è diviso nello stesso modello che va da 7 a 70 miliardi di parametri, e in quello più specifico e ottimizzato (fine-tuned) per i dialoghi, chiamato Llama 2-Chat.
In italiano potrebbe zoppicare
Andando a sfogliare il documento di ricerca con il quale è stato presentato il nuovo modello linguistico di Meta, si scopre che, come spesso accade, anche per preaddestrare Llama 2 è stata utilizzata prevalentemente la lingua inglese (89,70% dei dati), mentre all’italiano è stato riservato solo uno 0,11% dei dati.
Meta ha infatti scritto che, sebbene Llama 2 abbia acquisito una certa competenza in altre lingue, questa è limitata soprattutto a causa della scarsa quantità di dati di preaddestramento disponibili in lingue diverse dall'inglese: conseguenza che spinge Meta a dichiarare che le prestazioni del modello in altre lingue diverse dall’inglese sono precarie e che in questi scenari linguistici Llama 2 deve essere “usato con cautela”.
539 tonnellate di CO2 emessa
Sfogliando ancora il documento di ricerca, si scopre che il preaddestramento di Llama 2 è stato realizzato con il supercomputer di Meta Research SuperCluster e su cluster di produzione interni utilizzando per entrambi GPU Nvidia A100.
Per il preaddestramento sono state necessarie 3,3 milioni di ore GPU e il totale di CO2 equivalente è stato pari a 539 tonnellate.
Llama 2 può essere scaricato da chiunque perché è un modello open-source, ma la sua applicazione richiede certe competenze e potenze, ma sarà disponibile anche tramite Azure, AWS e Hugging Face.
Qualcomm ha anche annunciato che sta collaborando con Meta per portare Llama 2 su computer portatili, telefoni e visori AR/VR a partire dal 2024, per applicazioni basate sull’IA che funzionano in locale e senza fare affidamento sui servizi cloud.
Qualcomm strabiliante: Generata un’immagine IA su un telefono Android in meno di 15 secondi
Llama 2 può essere usato anche per scopi commerciali ma, se si vanno a guardare le clausole, la licenza non può essere usata se si hanno oltre 700 milioni di utenti mensili; per generare altri modelli linguistici di grandi dimensioni partendo da Llama 2; e in generale non si può usare Llama 2 per scopi militari, per il funzionamento di infrastrutture critiche, e per svolgere attività di bullismo.
© riproduzione riservata
https://www.dday.it/redazione/46455/meta-lancia-il-suo-modello-linguistico-gratuito-si-chiama-llama-2-e-vuole-sfidare-openai?utm_source=pocket-newtab-bff