Deepseek's verrassend goedkope AI -model daagt reuzen uit de industrie uit. De Chinese startup beweert zijn krachtige Deepseek V3 -neurale netwerk te hebben getraind voor slechts $ 6 miljoen, met slechts 2048 GPU's, een schril contrast met de aanzienlijk hogere kosten van concurrenten. Dit schijnbaar lage cijfer weerspiegelt echter alleen PRPU-gebruik pre-training en sluit substantiële onderzoek, verfijning, gegevensverwerking en infrastructuurkosten uit.
afbeelding: ensigame.com
De innovatieve architectuur van Deepseek V3 draagt bij aan de efficiëntie ervan. Belangrijkste technologieën omvatten multi-token voorspelling (MTP), die meerdere woorden tegelijkertijd voorspelt; Mix van experts (MOE), met 256 neurale netwerken voor versnelde training; en multi-head latente aandacht (MLA), gericht op cruciale zinselementen voor verbeterde nauwkeurigheid.
afbeelding: ensigame.com
Een nadere blik onthult echter een substantiële investering. Semianalysis ontdekte het gebruik van Deepseek van ongeveer 50.000 Nvidia Hopper GPU's, met een waarde van ongeveer $ 1,6 miljard, met operationele kosten van $ 944 miljoen. Dit is in tegenspraak met de initiële claim van $ 6 miljoen.
afbeelding: ensigame.com
Het succes van Deepseek komt voort uit een combinatie van factoren: substantiële financiering (meer dan $ 500 miljoen geïnvesteerd in AI -ontwikkeling), technologische vooruitgang en een zeer bekwaam team dat aanzienlijke salarissen verdient (sommige meer dan $ 1,3 miljoen per jaar). De onafhankelijke structuur en het eigendom van het bedrijf van zijn datacenters dragen bij aan zijn behendigheid en efficiëntie.
afbeelding: ensigame.com
Hoewel het "budgetvriendelijke" verhaal van Deepseek aantoonbaar is opgeblazen, blijft de prestatie ervan aanzienlijk. Het bedrijf toont aan dat een goed gefinancierde, onafhankelijke AI-entiteit effectief kan concurreren met gevestigde spelers, ondanks de substantiële investering die uiteindelijk vereist is. Het contrast is grimmig bij het vergelijken van trainingskosten: de R1 van Deepseek kost $ 5 miljoen, terwijl Chatgpt4 een gerapporteerde $ 100 miljoen kostte. Ondanks de hogere werkelijke kosten, blijft het model van DeepSeek relatief goedkoper dan zijn concurrenten.