![Shutterstock Shutterstock](/im/Files/7/6/6/6/1/9/0/9/shutterstock_248033556521.png?impolicy=teaser&resizeWidth=700&resizeHeight=350)
7 domande e risposte su DeepSeek
Il chatbot cinese DeepSeek sta scuotendo il mondo della tecnologia da una settimana. Perché questa agitazione? Chi c'è dietro la nuova IA? Il modello è davvero open source? Risposte alle domande più pressanti.
La scorsa settimana, un'intelligenza artificiale (IA) proveniente dalla Cina ha fatto scalpore. Apparentemente dal nulla, DeepSeek si è catapultato in cima agli app store. Dopo il panico iniziale nella Silicon Valley, la situazione si è lentamente calmata e abbiamo nuove informazioni. Facciamo quindi chiarezza.
1. Cosa rende DeepSeek speciale?
DeepSeek è un chatbot IA gratuito simile, ad esempio, a ChatGPT. È disponibile come versione browser e come applicazione. Il bot si basa su DeepSeek R1, un modello di intelligenza artificiale che padroneggia il «pensiero» logico («Reasoning Engine»). Anche le nuove versioni di ChatGPT (OpenAI o1) e Google Gemini (Gemini 2.0 Flash Thinking) hanno questa capacità.
Secondo le sue stesse informazioni, DeepSeek compete con i migliori modelli statunitensi in vari benchmark. Le opinioni degli utenti e degli esperti indipendenti sono contrastanti: a seconda dell'applicazione, DeepSeek o un'altra IA offre probabilmente i risultati migliori. Nel complesso, tuttavia, si ritiene che l'IA cinese sia in grado di tenere il passo con i modelli consolidati ed è particolarmente forte in task tecniche come il coding.
![I risultati dei benchmark di DeepSeek confermano le prestazioni top dell'intelligenza artificiale cinese.](/im/Files/7/6/6/6/3/0/8/6/r1_bench.webp?impolicy=resize&resizeWidth=430)
Fonte: DeepSeek
2. DeepSeek R1 è davvero open source?
Snì. Puoi scaricare il modello ed eseguirlo in locale. Tuttavia, DeepSeek R1 è solo «open weight»: i dati da cui genera le risposte («weight») sono pubblicamente accessibili. Ma gli algoritmi cha stanno dietro e i dati di addestramento rimangono criptati. In un vero modello open source, anche questi sarebbero accessibili.
L'unico altro modello open weight di grandi dimensioni è Llama di Meta AI. OpenAI, Google e Anthropic tengono nascosti i codici sorgente dei loro bot. Un gruppo sulla piattaforma Hugging Face sta già cercando di riprodurre una versione completamente aperta di DeepSeek. I modelli open weight e soprattutto open source possono fungere da elementi costitutivi per i nuovi chatbot, rendendo il loro sviluppo più semplice e meno costoso.
3. DeepSeek ha rubato da OpenAI?
È una questione di prospettiva. OpenAI e Microsoft hanno avviato un'indagine perché avevano le prove che DeepSeek avesse ottenuto grandi quantità di dati da ChatGPT tramite un account per sviluppatori alla fine del 2024. Questi dati sarebbero poi stati utilizzati per addestrare il loro modello.
![Sam Altman, CEO di OpenAI, scrive su X: «È facile copiare qualcosa».](/im/Files/7/6/6/6/1/9/3/4/shutterstock_2366323225.jpg?impolicy=resize&resizeWidth=430)
Fonte: Shutterstock
Questa tecnica si chiama «distillazione» e viola le condizioni d'uso. Gli sviluppatori possono integrare i modelli di intelligenza artificiale di OpenAI nelle proprie applicazioni solo tramite un'interfaccia, ma non possono utilizzarli per costruire prodotti concorrenti. Tuttavia, se questo possa essere applicato legalmente è un'altra questione.
L'ironia è che anche OpenAI, Google e simili hanno setacciato l'intero internet senza autorizzazione per addestrare i loro modelli – violando presumibilmente tonnellate di copyright. La T di ChatGPT sta inoltre per un modello «transformer» originariamente sviluppato da Google. La compassione per Sam Altman è quindi molto limitata.
4. Com'è con la protezione dei dati e la censura?
Secondo le sue stesse linee guida, le versioni online di DeepSeek raccolgono molti dati degli utenti. Tra questi:
- indirizzo e-mail, numero di telefono, data di nascita
- cronologia delle chat e qualsiasi input, anche i «keystroke pattern»
- indirizzi IP e informazioni tecniche sul tuo dispositivo
DeepSeek utilizza tutte queste informazioni per migliorare la «sicurezza e la stabilità» dei suoi servizi. D'altro canto, può anche condividere i dati con partner pubblicitari e conservarli «per il tempo necessario».
Anche altri chatbot raccolgono dati. Le linee guida di OpenAI e Google sono simili. Tuttavia, la sede centrale di DeepSeek in Cina solleva ulteriori preoccupazioni – resta da vedere se giustamente o ingiustamente. L'Italia ha quindi bloccato l'app e anche il ministro australiano della Scienza Ed Husic invita a fare attenzione.
Più tangibile è la censura di alcuni argomenti considerati politicamente sensibili in Cina. Ad esempio, il bot blocca le richieste di informazioni su Tien'anmen, sul Tibet o su Xi Jinping, mentre fornisce prontamente informazioni su altre figure politiche. Le restrizioni possono essere aggirate con dei trucchi, ma le risposte sembrano comunque avere una nota politica.
Le accuse di censura non sono rivolte solo a DeepSeek. Tutti i principali chatbot evitano determinati argomenti, come la violenza e la sessualità. Anche OpenAI ha dovuto affrontare l'accusa di non essere politicamente neutrale.
5. Chi c'è dietro DeepSeek?
Un ingegnere e imprenditore di nome Liang Wenfeng. La controparte cinese di Sam Altman è nata a Zhangjang nel 1985 e ha frequentato la rinomata Zheijang University. Nel 2015 ha fondato con due amici un hedge fund chiamato High-Flyer e ha fatto fortuna con il trading di azioni supportato dall'intelligenza artificiale. Ci sono state volte in cui High-Flyer ha gestito quasi 14 miliardi di dollari USA.
![Una delle uniche immagini di Liang Wenfeng proviene dalla televisione di Stato cinese.](/im/Files/7/6/6/6/1/9/5/0/29DeepSeek-CEO-WWK-superJumbo.jpg?impolicy=resize&resizeWidth=430)
Fonte: CCTV
Nel 2023, Liang Wenfeng ha fondato DeepSeek con i profitti del suo hedge fund. Ha messo insieme un team di giovani talenti e ha acquistato acceleratori di intelligenza artificiale su larga scala. Il quarantenne è considerato un ideologo focalizzato sulla tecnologia. Vuole raggiungere gli Stati Uniti e il suo obiettivo dichiarato è lo sviluppo della Artificial General Intelligence (A.G.I.). Per quanto si può vedere, non aveva alcun legame diretto con il governo cinese.
6. Perché il panico iniziale sul mercato azionario?
Negli ultimi due anni Wall Street ha investito trilioni di dollari in Big Tech, nella speranza che l'intelligenza artificiale porti a profitti elevati in futuro. Questo funziona solo se alla fine Microsoft, Google e simili possono vendere i loro chatbot a un prezzo elevato. DeepSeek mette in discussione questo modello di business da un lato e il dominio degli Stati Uniti dall'altro. Il noto Venture Capitalist Marc Andreessen ha descritto R1 come il «momento Sputnik dell'IA».
DeepSeek R1 is AI's Sputnik moment.
Lo shock più grande per gli investitori: DeepSeek dichiara costi di sviluppo di soli 5,6 milioni di dollari per R1 e relativamente poche ore di GPU per l'addestramento. Finora, la saggezza convenzionale è stata quella di ritenere che un buon modello richieda grandi quantità di capitale, competenze, tempo ed energia. Il GPT-4o di OpenAI è costato oltre 100 milioni, Anthropic cita una cifra compresa tra 100 milioni e un miliardo per un modello di addestramento Claude.
I modelli statunitensi richiedono le più recenti GPU H100 di Nvidia. In Cina, a causa di un divieto di esportazione, sono teoricamente disponibili solo le H800 più vecchie. Tuttavia, ci sono indicazioni che DeepSeek abbia comunque ottenuto acceleratori H100 tramite deviazioni e li abbia utilizzati almeno per l'addestramento del modello. Secondo quanto riferito, l'azienda utilizza i chip di Huawei.
7. L'agitazione è giustificata?
Gli analisti ne stanno discutendo a lungo. Da un lato, DeepSeek potrebbe aver sorvolato sui costi del suo modello e sembra basarsi, almeno in parte, su innovazioni provenienti dagli Stati Uniti. Dall'altro, anche gli esperti indipendenti sono impressionati dall'efficienza di DeepSeek. Grazie a soluzioni intelligenti, il modello raggiunge prestazioni pari a quelle di OpenAI o1 con uno sforzo di calcolo significativamente inferiore.
Come minimo, l'episodio dimostra che i chatbot leader di mercato sono relativamente facili da copiare. Resta da vedere se DeepSeek riuscirà ad affermarsi ai vertici a lungo andare. Le server farm di OpenAI e altri non sono improvvisamente prive di valore, ma rimangono importanti per il progresso dell'intelligenza artificiale. Anche i prezzi delle azioni delle società statunitensi si sono leggermente ripresi dal crollo di venerdì.
Tuttavia, la forte reazione mostra il nervosismo degli investitori. Negli ultimi anni, le valutazioni delle aziende legate all'IA sono andate in una sola direzione: verso l'alto. Il rapporto medio prezzo-utile di Nvidia, Alphabet, Microsoft, Meta e Amazon è pari a 38 – quasi il doppio della media delle 500 maggiori società statunitensi (S&P 500 Equal Weight). A seconda del punto di vista, le costose azioni tech sono un investimento nel futuro o un castello di carte. La realtà sta probabilmente nel mezzo.
A 79 persone piace questo articolo
![User Avatar](/im/Files/6/7/9/9/6/9/4/4/buchmann_samuel-3.jpg?impolicy=avatar&resizeWidth=96)
![User Avatar](/im/Files/6/7/9/9/6/9/4/4/buchmann_samuel-3.jpg?impolicy=avatar&resizeWidth=80)
Le mie impronte digitali cambiano talmente spesso che il mio MacBook non le riconosce più. Il motivo? Se non sono seduto davanti a uno schermo o in piedi dietro a una telecamera, probabilmente mi trovo appeso a una parete di roccia mantenendomi con i polpastrelli.