Pubblicato il 16/12/24 - aggiornato il  | Nessun commento :

Come usare l'intelligenza artificiale Gemini 2.0 su Google AI Studio

Google ha rilasciato il modello multimodale Gemini 2.0 Flash Experimental da usare gratis su Google AI Studio caricando più file e digitando prompt

Con un post nel suo blog ufficiale, il CEO di Google ha annunciato il rilascio di Gemini 2.0 Flash Experimental, un "nuovo modello di AI per l'era agenziale". I modelli agentici sono in grado di comprendere meglio il mondo che ci circonda per anticipare i passaggi e agire per nostro conto però sempre sotto la nostra supervisione.

Gemini 2.0 secondo Google si presenta come il primo modello nativamente multimodale in grado quindi di elaborare e comprendere informazioni da testo, immagini, video, audio e codice in modo più efficace.

Dall'11 Dicembre 2024 tutti gli utenti di Gemini, compresi quelli con un account gratuito, potranno accedere al modello sperimentale Gemini 2.0 Flash. Gemini 2.0 Flash ha una velocità doppia rispetto a Gemini 1.5 Flash.

Inoltre Gemini 2.0 Flash supporta i multi input come immagini, video, audio multilingue e codice. Gemini 2.0 Flash può essere usato dagli utenti loggati con Google nella pagina di Gemini con un qualsiasi browser desktop.

Al momento però il multi input ancora non è stato perfezionato e si possono caricare solo file di immagini. Per una esperienza migliore si può usare lo strumento Google AI Studio a cui accedere gratis con un account Google.

Ho pubblicato sul mio Canale Youtube un tutorial su come usare Gemini 2.0 Flash su Google AI Studio.

Dopo aver effettuato l'accesso a Google AI Studio, si va in alto a destra su Model e si sceglie quello Gemini 2.0 Flash Experimental. Più in basso c'è il conteggio dei token dell'utente che ne ha in dotazione circa un milione.

La casella del prompt si trova in basso al centro. Andando sul pulsante del Più possiamo caricare diversi tipi di file.

usare gemini 2

I file possono essere caricati dal dispositivo ma anche da Google Drive. Inoltre in fase di test si può andare su Sample Media per aprire foto o video già predisposti da Google come esempi. Si può anche registrare audio da microfono e video dalla fotocamera del dispositivo con cui si possono anche scattare delle fotografie.

Dopo aver opzionalmente caricato un file, aver digitato un prompt, in italiano o in un'altra lingua qualsiasi, si clicca su Run e si attende la risposta di Gemini. Le conversazioni avute con Gemini 2.0 si ritroveranno nella Library.

Nel video incorporato sopra ho mostrato come si possa analizzare un'immagine, ma come ancora ci siano difficoltà per modificarla. Andando su Advanced Settings → Safety Settings → Edit Safety Settings si possono disattivare i vari filtri per avere risultati più pertinenti alle nostre richieste. Una delle novità più interessanti è la capacità di creare immagini originali. Si può descrivere l'immagine e Gemini 2.0 Flash la genererà per noi.

Al momento però questa funzionalità crea un testo ma non l'immagine, almeno su Google AI Studio. Il modello in oggetto però può convertire il testo in parlato con voci naturali e in diverse lingue. Ho inoltre sperimentato come sia possibile creare riassunti in qualsiasi lingua, non solo di testo, ma anche di file audio e di video caricati.

Andando su Save in alto a destra si può salvare il prompt immesso. Si va su Create Prompt per una nuova chat.

trama romanzo giallo

Chi ha velleità da scrittore può farsi aiutare da Gemini 2.0 Flash, ma del resto anche da tutti gli altri modelli linguistici di intelligenza artificiale, a buttar giù la sinossi di una trama per poi svilupparla in un secondo tempo.



Nessun commento :

Posta un commento

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy