Zaskakująco niedrogi model AI Deepseek wyzwala gigantów branżowych. Chiński startup twierdzi, że wyszkolił swoją potężną sieć neuronową Deepseek V3 za zaledwie 6 milionów dolarów, wykorzystując tylko 2048 GPU, co stanowi wyraźny kontrast z znacznie wyższymi kosztami konkurencji. Ta pozornie niska liczba odzwierciedla jedynie wstępne wykorzystywanie GPU i wyklucza znaczne badania, udoskonalenie, przetwarzanie danych i wydatki infrastrukturalne.
Obraz: engame.com
Innowacyjna architektura Deepseek V3 przyczynia się do jej wydajności. Kluczowe technologie obejmują prognozę wielofunkcyjną (MTP), która jednocześnie prognozuje wiele słów; Mieszanka ekspertów (MOE), wykorzystując 256 sieci neuronowych do przyspieszonego szkolenia; oraz wielorakiej ukrytej uwagi (MLA), koncentrując się na kluczowych elementach zdań w celu lepszej dokładności.
Obraz: engame.com
Jednak bliższe spojrzenie ujawnia znaczną inwestycję. Semianaliza odkryła wykorzystanie Deepeek w wysokości około 50 000 GPU Nvidia Hopper, o wartości około 1,6 miliarda dolarów, a koszty operacyjne osiągnęły 944 miliony dolarów. Jest to sprzeczne z początkowym roszczeniem o wartości 6 milionów dolarów.
Obraz: engame.com
Sukces Deepseek wynika z kombinacji czynników: znacznych funduszy (ponad 500 milionów dolarów zainwestowanych w rozwój AI), postępy technologiczne i wysoko wykwalifikowanego zespołu zarabiającego znaczne pensje (niektóre przekraczające 1,3 miliona dolarów rocznie). Niezależna struktura i własność jej centrów danych przyczyniają się do jej zwinności i wydajności.
Obraz: engame.com
Podczas gdy „przyjazna budżet” narracja Deepseek jest prawdopodobnie zawyżona, jej osiągnięcie pozostaje znaczące. Firma pokazuje, że dobrze finansowana, niezależna jednostka sztucznej inteligencji może skutecznie konkurować z uznanymi graczami, pomimo ostatecznie wymaganej istotnej inwestycji. Kontrast jest wyraźny przy porównywaniu kosztów szkolenia: R1 Deepseek kosztował 5 milionów dolarów, podczas gdy Chatgpt4 kosztuje zgłoszone 100 milionów dolarów. Pomimo wyższych rzeczywistych kosztów model Deepseek pozostaje stosunkowo tańszy niż jego konkurenci.