Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. La startup cinese afferma di aver formato la sua potente rete neurale di DeepSeek V3 per soli 6 milioni di dollari, utilizzando solo 2048 GPU, un netto contrasto con i costi significativamente più elevati dei concorrenti. Questa cifra apparentemente bassa, tuttavia, riflette solo l'utilizzo della GPU pre-allenamento ed esclude la ricerca sostanziale, la raffinatezza, l'elaborazione dei dati e le spese di infrastruttura.
Immagine: Ensigame.com
L'architettura innovativa di Deepseek V3 contribuisce alla sua efficienza. Le tecnologie chiave includono la previsione multi-token (MTP), che prevede contemporaneamente più parole; Miscela di esperti (MOE), che impiegano 256 reti neurali per la formazione accelerata; e l'attenzione latente a più testa (MLA), concentrandosi su elementi di frase cruciale per una migliore precisione.
Immagine: Ensigame.com
Tuttavia, uno sguardo più attento rivela un investimento sostanziale. La semianalisi ha scoperto l'uso da parte di Deepseek di circa 50.000 GPU di Hopper Nvidia, valutati a circa $ 1,6 miliardi, con costi operativi che hanno raggiunto $ 944 milioni. Ciò contraddice il reclamo iniziale di $ 6 milioni.
Immagine: Ensigame.com
Il successo di DeepSeek deriva da una combinazione di fattori: finanziamenti sostanziali (oltre $ 500 milioni investiti nello sviluppo dell'IA), progressi tecnologici e un team altamente qualificato che guadagna salari sostanziali (alcuni oltre $ 1,3 milioni all'anno). La struttura e la proprietà indipendenti della società dei suoi data center contribuiscono alla sua agilità ed efficienza.
Immagine: Ensigame.com
Mentre la narrazione "economica" di Deepseek è probabilmente gonfiata, il suo risultato rimane significativo. La società dimostra che un'entità di intelligenza artificiale indipendente ben finanziata può competere efficacemente con i giocatori affermati, nonostante l'investimento sostanziale alla fine richiesto. Il contrasto è netto quando si confronta i costi di formazione: R1 di Deepseek costa $ 5 milioni, mentre CHATGPT4 costano $ 100 milioni segnalati. Nonostante il costo effettivo più elevato, il modello di Deepseek rimane relativamente più economico dei suoi concorrenti.