仙境傳說 3 預購詳情仙境傳說 3 目前在官方商店尚未開放預購,請耐心等待官方消息,屆時我們將第一時間為您帶來最新資訊。可嘗試的類似遊戲
作者: Grace閱讀:0
DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。這家中國初創公司聲稱已經培訓了其強大的DeepSeek V3神經網絡,僅利用2048 GPU,這與競爭對手的成本明顯更高。但是,這個看似較低的數字僅反映了訓練前的GPU使用情況,並排除了大量研究,改進,數據處理和基礎設施費用。
圖像:ensigame.com
DeepSeek V3的創新架構有助於其效率。關鍵技術包括多言預測(MTP),該預測同時預測了多個單詞;專家(MOE)的混合物,采用256個神經網絡進行加速培訓;和多頭潛在注意力(MLA),重點是至關重要的句子元素以提高準確性。
圖像:ensigame.com
但是,近距離的外觀揭示了一筆巨大的投資。半分析發現了DeepSeek的使用約50,000名NVIDIA Hopper GPU,價值約16億美元,運營成本達到9.44億美元。這與最初的600萬美元索賠相矛盾。
圖像:ensigame.com
DeepSeek的成功源於多種因素:大量資金(用於AI開發的5億美元投資),技術進步以及高技能的團隊賺取了可觀的薪水(每年超過130萬美元)。該公司的獨立結構和數據中心的所有權有助於其敏捷性和效率。
圖像:ensigame.com
盡管DeepSeek的“預算友好”敘事可以說是誇張的,但其成就仍然很重要。該公司表明,盡管最終需要進行大量投資,但資金豐富,獨立的AI實體仍可以有效地與知名參與者競爭。在比較培訓成本時,這種對比是鮮明的:DeepSeek的R1耗資500萬美元,而Chatgpt4的成本為1億美元。盡管實際成本較高,但DeepSeek的模型仍然比競爭對手便宜。
最新文章 17
2025-12
16
2025-12
16
2025-12
14
2025-12