DeepSeek è un'azienda cinese specializzata in intelligenza artificiale che usa un modello di linguaggio sviluppato dal loro stesso team. Il modello deriva dall'addestramento su enormi quantità di dati testuali (libri, articoli, conversazioni, ecc.), usando architetture avanzate basate sui trasformer, simili a quelle di GPT. Tuttavia, i dettagli specifici del training (come dataset esatti o parametri) non sono pubblici. La base è un modello proprietario di DeepSeek, ottimizzato per bilanciare prestazioni e efficienza. Pur condividendo principi con modelli come GPT o Llama (es. meccanismi di attenzione), l'architettura esatta del modello non è open source. La versione attuale si concentra su risposte concise, accuratezza e adattabilità a contesti multilingue, incluso quello della lingua italiana.
DeepSeek ha rilasciato alcune versioni open source di modelli precedenti per trasparenza, collaborazione e accessibilità. La scorsa settimana l'applicazione DeepSeek per iPhone è stata la più scaricata dall'App Store.
Questa notizia unitamente al costo del modello, dichiarato in 6 milioni di dollari contro i 100 milioni dei modelli simili, ha innescato un effetto ribassista su tutti i titoli tecnologici americani e segnatamente su quelli che producono i chip per i data center dell'intelligenza artificiale. L'azienda NVIDIA è stata la più colpita con un crollo del 17%.
Adesso però NVIDIA sta recuperando il 6% dopo alcune considerazioni apparse su Telegram. Pare che Singapore lo scorso anno abbia acquistato un numero di chip da NVIDIA quattro volte superiori senza che nella Città Stato ci siano aziende che abbiano bisogno di una tale mole di chip. In molti pensano che DeepSeek abbia usato Singapore per acquistare chip NVIDIA senza poterlo dichiarare per i noti blocchi imposti dall'amministrazione americana.
Se fosse vero il costo del modello sarebbe molto più elevato. DeepSeek si può usare anche dall'Italia da una scheda del browser o anche da app per il mobile installabili per Android e per iPhone. Ho pubblicato sul mio Canale YouTube un video tutorial in cui analizzo le problematiche innescate da DeepSeek e spiego come utilizzarla.
Dopo aver aperto la homepage si va su Start Now per aprire la chat di DeepSeek. Si può accedere con le credenziali di Google o andando su Sign Up per registrarsi con indirizzo email e password. Ci verrà inviato un codice con cui perfezionare la registrazione. Al momento questa opzione però è molto lenta e non ci permette il login.
Dopo l'accesso, in basso si vede il campo di testo in cui digitare la domanda per la AI di DeepSeek. Si può scegliere Deep Think (pensiero profondo) o Search per ricerche nel web. Si può anche andare sull'icona dell'allegato per caricare immagini o documenti. Dalle immagini per adesso si può solo estrarre del testo con la tecnologia OCR.
Sulla sinistra c'è la cronologia delle chat e il pulsante New Chat per iniziarne una nuova. In basso a sinistra c'è il profilo e un QR Code per scaricare le applicazioni di DeepSeek rispettivamente dal Play Store e dall'AppStore.
Dopo alcune chat iniziali ho caricato un mio vecchio ebook in formato PDF e ho chiesto di farmi un riassunto.
Il riassunto dell'ebook è stato perfetto e con una formattazione efficace anche migliore di quella originale.
Dopo aver fatto una domanda si può continuare a chattare sullo stesso tema oppure andare su New Chat per iniziare una nuova conversazione. Andando su My Profile → Settings si può scegliere la lingua di sistema.
Si può anche selezionare il Tema Chiaro, il Tema Scuro e il Tema del Sistema. Le chat vengono salvate automaticamente. Possono essere eliminate anche singolarmente cliccando sui tre puntini posti alla loro destra.
Lo stesso team di DeepSeek ha appena rilasciato Janus-PRO come alternativa a DALL·E. Al momento è stata rilasciata solo la versione 7B open source condivisa su HuggingFace che presenterò in un prossimo post.
Nessun commento :
Posta un commento
Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy