Gemini Ai è il nuovo modello di linguaggio di grandi dimensioni (Llm, Large Language Model) sviluppato da Google del quale si parla da giugno. Il primo annuncio ufficiale è stato presentato sul blog di Google il 6 dicembre. Gemini Ai è un Llm di quarta generazione, progettato per essere più potente e capace del suo predecessore, Palm (terza generazione), a sua volta successore di Lamda (seconda generazione). Anche Gemini è costruito per la multimodalità, potendo lavorare senza problemi su testo, immagini, video, audio e codice.
Gemini è stato addestrato sui Tpu (Tensor Processing Unit), i chip di elaborazione tensoriale di cui Google è proprietaria, progettati per eseguire operazioni di moltiplicazione e accumulo su matrici di grandi dimensioni, le operazioni più comuni utilizzate nelle reti neurali alla base dell'Ai. Proprio le Tpu, sostiene Google, permettono di contenere le richieste di consumi energetici rispetto alle altre piattaforme utilizzate dalle intelligenze artificiali.
Campi di applicazione di Gemini
Gemini gestisce tutti i tipi di contenuto, dal testo al software, dall’immagine all’audio, per arrivare al ragionamento matematico. Tra i campi preferiti di applicazione di Gemini sono stati indicati visione, geografia e salute. Per la visione artificiale interessano particolarmente rilevamento di oggetti, comprensione della scena e rilevamento di anomalie. Le scienze geospaziali miglioreranno per fusione di dati multisorgente, pianificazione e intelligence, monitoraggio continuo. La salute si gioverà di assistenza personalizzata, integrazione di biosensori e medicina preventiva.
Le tre varianti di Gemini e l'integrazione in Bard
Gemini sarà inizialmente disponibile in tre varianti: Nano, Pro e Ultra, pensate per soddisfare le varie esigenze degli utenti. Nano è per compiti veloci su dispositivi, Pro è una versione versatile e Ultra è la più potente.
Gemini Pro è già integrato con Bard, il chatbot di Google al quale si può accedere gratuitamente attraverso un account Google. Questa informazione è confermata …dallo stesso Bard. L’azienda ha introdotto miglioramenti significativi, permettendo a Bard di generare risposte più accurate e di maggior qualità. Gemini Nano sarà disponibile sul Pixel 8 Pro anche senza connessione Internet. Ancora non è noto se e quali versioni saranno rese disponibili a pagamento, in un modello eventualmente confrontabile con quello di ChatGpt.