
Deepseek รุ่น AI ที่ไม่แพงอย่างน่าประหลาดใจท้าทายยักษ์ใหญ่ในอุตสาหกรรม การเริ่มต้นของจีนอ้างว่าได้ฝึกอบรมเครือข่ายประสาท Deepseek V3 ที่ทรงพลังในราคาเพียง 6 ล้านเหรียญสหรัฐโดยใช้ GPU ในปี 2048 ซึ่งตรงกันข้ามกับค่าใช้จ่ายที่สูงขึ้นอย่างมากของคู่แข่ง อย่างไรก็ตามตัวเลขที่ดูเหมือนต่ำนี้สะท้อนให้เห็นถึงการใช้งาน GPU ก่อนการฝึกอบรมและไม่รวมการวิจัยที่สำคัญการปรับแต่งการประมวลผลข้อมูลและค่าใช้จ่ายโครงสร้างพื้นฐาน
IMGP%Image: Ensigame.com
สถาปัตยกรรมที่เป็นนวัตกรรมของ Deepseek V3 มีส่วนช่วยในการมีประสิทธิภาพ เทคโนโลยีที่สำคัญ ได้แก่ การทำนายแบบมัลติเทน (MTP) ซึ่งคาดการณ์หลายคำพร้อมกัน ส่วนผสมของผู้เชี่ยวชาญ (MOE) ใช้เครือข่ายประสาท 256 แห่งสำหรับการฝึกอบรมเร่งความเร็ว และความสนใจแฝงหลายหัว (MLA) โดยมุ่งเน้นไปที่องค์ประกอบประโยคสำคัญเพื่อการปรับปรุงความแม่นยำ
IMGP%Image: Ensigame.com
อย่างไรก็ตามการมองอย่างใกล้ชิดเผยให้เห็นการลงทุนที่สำคัญ Semianalysis เปิดการใช้งานของ Deepseek ประมาณ 50,000 Nvidia Hopper GPUs มูลค่าประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานสูงถึง 944 ล้านดอลลาร์ สิ่งนี้ขัดแย้งกับการเรียกร้องเริ่มต้น $ 6 ล้าน
IMGP%Image: Ensigame.com
ความสำเร็จของ Deepseek เกิดจากการรวมกันของปัจจัย: การระดมทุนจำนวนมาก (มากกว่า $ 500 ล้านลงทุนในการพัฒนา AI) ความก้าวหน้าทางเทคโนโลยีและทีมงานที่มีทักษะสูงได้รับเงินเดือนจำนวนมาก (บางส่วนเกิน 1.3 ล้านเหรียญสหรัฐต่อปี) โครงสร้างอิสระของ บริษัท และความเป็นเจ้าของศูนย์ข้อมูลมีส่วนช่วยให้เกิดความคล่องตัวและประสิทธิภาพ
IMGP%Image: Ensigame.com
ในขณะที่การเล่าเรื่อง "เป็นมิตรกับงบประมาณ" ของ Deepseek นั้นสูงเกินจริงเนื้อหาความสำเร็จของมันยังคงมีความสำคัญ บริษัท แสดงให้เห็นว่าหน่วยงาน AI อิสระที่ได้รับการสนับสนุนอย่างดีสามารถแข่งขันกับผู้เล่นที่จัดตั้งขึ้นได้อย่างมีประสิทธิภาพแม้จะมีการลงทุนอย่างมากในที่สุด ความแตกต่างนั้นสิ้นเชิงเมื่อเปรียบเทียบค่าใช้จ่ายในการฝึกอบรม: R1 ของ Deepseek มีราคา $ 5 ล้านในขณะที่ CHATGPT4 มีค่าใช้จ่าย $ 100 ล้าน แม้จะมีค่าใช้จ่ายจริงที่สูงขึ้น แต่แบบจำลองของ Deepseek ยังคงถูกกว่าคู่แข่ง