Ang nakakagulat na Deepseek ay murang mga hamon sa modelo ng AI na mga higante sa industriya. Sinasabi ng Startup ng Tsino na sinanay ang malakas na Deepseek V3 Neural Network para sa isang $ 6 milyon lamang, na gumagamit lamang ng 2048 GPUs, isang kaibahan na kaibahan sa mga mas mataas na gastos ng mga kakumpitensya. Ang tila mababang figure na ito, gayunpaman, ay sumasalamin lamang sa paggamit ng pre-pagsasanay ng GPU at hindi kasama ang malaking pananaliksik, pagpipino, pagproseso ng data, at mga gastos sa imprastraktura.
Imahe: ensigame.com
Ang makabagong arkitektura ng Deepseek V3 ay nag -aambag sa kahusayan nito. Ang mga pangunahing teknolohiya ay may kasamang multi-token prediction (MTP), na mga pagtataya ng maraming mga salita nang sabay-sabay; Pinaghalong mga eksperto (MOE), na gumagamit ng 256 neural network para sa pinabilis na pagsasanay; at multi-head latent pansin (MLA), na nakatuon sa mga mahahalagang elemento ng pangungusap para sa pinahusay na kawastuhan.
Imahe: ensigame.com
Gayunpaman, ang isang mas malapit na hitsura ay nagpapakita ng isang malaking pamumuhunan. Ang Semianalysis ay walang takip na paggamit ng Deepseek na humigit -kumulang na 50,000 NVIDIA HOPPER GPU, na nagkakahalaga ng halos $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na umaabot sa $ 944 milyon. Salungat ito sa paunang $ 6 milyong paghahabol.
Imahe: ensigame.com
Ang tagumpay ng Deepseek ay nagmumula sa isang kumbinasyon ng mga kadahilanan: malaking pondo (higit sa $ 500 milyon na namuhunan sa pag -unlad ng AI), mga pagsulong sa teknolohiya, at isang mataas na bihasang koponan na kumikita ng malaking suweldo (ang ilan na higit sa $ 1.3 milyon taun -taon). Ang independiyenteng istraktura at pagmamay -ari ng kumpanya ng mga sentro ng data nito ay nag -aambag sa liksi at kahusayan nito.
Imahe: ensigame.com
Habang ang salaysay na "badyet" ng Deepseek ay maaaring mapalaki, ang nakamit nito ay nananatiling makabuluhan. Ipinakita ng kumpanya na ang isang mahusay na pinondohan, independiyenteng entidad ng AI ay maaaring epektibong makipagkumpetensya sa mga naitatag na manlalaro, sa kabila ng malaking pamumuhunan sa huli na kinakailangan. Ang kaibahan ay stark kapag inihahambing ang mga gastos sa pagsasanay: Ang R1's R1 ay nagkakahalaga ng $ 5 milyon, habang ang Chatgpt4 ay nagkakahalaga ng isang iniulat na $ 100 milyon. Sa kabila ng mas mataas na aktwal na gastos, ang modelo ng Deepseek ay nananatiling mas mura kaysa sa mga katunggali nito.