Deepseeks überraschend kostengünstige KI -Modell stellt die Branchenriesen heraus. Das chinesische Startup behauptet, sein mächtiges Neuralnetz von Deepseek V3 für nur 6 Millionen US -Dollar ausgebildet zu haben, wobei nur 2048 GPUs ein starker Kontrast zu den deutlich höheren Kosten der Wettbewerber verwendet wurden. Diese scheinbar niedrige Zahl spiegelt jedoch nur die Nutzung der GPU vor dem Training wider und schließt erhebliche Forschungs-, Verfeinerungs-, Datenverarbeitungs- und Infrastrukturkosten aus.
Bild: Ensigame.com
Die innovative Architektur von Deepseek V3 trägt zur Effizienz bei. Zu den Schlüsseltechnologien gehören Multi-Southt-Vorhersage (MTP), die gleichzeitig mehrere Wörter prognostiziert. Mischung von Experten (MOE), die 256 neuronale Netze für beschleunigte Schulungen einsetzen; und latente Aufmerksamkeit mit mehreren Kopf (MLA), die sich auf entscheidende Satzelemente für eine verbesserte Genauigkeit konzentrieren.
Bild: Ensigame.com
Ein genauerer Blick zeigt jedoch eine erhebliche Investition. Die semianalyse entdeckte Deepseeks Verwendung von ungefähr 50.000 NVIDIA Hopper -GPUs im Wert von rund 1,6 Milliarden US -Dollar, wobei die Betriebskosten 944 Millionen US -Dollar beliefern. Dies widerspricht der anfänglichen Ansprüche in Höhe von 6 Millionen US -Dollar.
Bild: Ensigame.com
Der Erfolg von Deepseek beruht auf einer Kombination von Faktoren: erhebliche Finanzierung (über 500 Millionen US -Dollar, die in AI -Entwicklung investiert wurden), technologische Fortschritte und ein hochqualifiziertes Team, das erhebliche Gehälter verdient (einige über 1,3 Millionen US -Dollar pro Jahr). Die unabhängige Struktur und das Eigentum des Unternehmens an seinen Rechenzentren tragen zu seiner Beweglichkeit und Effizienz bei.
Bild: Ensigame.com
Während Deepseeks "budgetfreundliche" Erzählung wohl aufgeblasen ist, bleibt seine Leistung von Bedeutung. Das Unternehmen zeigt, dass ein gut finanziertes, unabhängiges KI-Unternehmen trotz der erheblichen Investitionen letztendlich mit etablierten Spielern konkurrieren kann. Der Kontrast ist im Vergleich der Schulungskosten stark: Deepseeks R1 kostete 5 Millionen US -Dollar, während Chatgpt4 100 Millionen US -Dollar kostete. Trotz der höheren tatsächlichen Kosten bleibt das Modell von Deepseek vergleichsweise billiger als seine Konkurrenten.