ต้นทุน GPU Nvidia Blackwell เพิ่มขึ้นเป็น 2 เท่า แต่ค่าใช้จ่ายสำหรับการอินเฟอเรนซ์ต่อ 1 โทเคนลดลง 35 เท่าเมื่อเทียบกับ Hopper

จากการวิเคราะห์บล็อกล่าสุดของ Nvidia ระบุว่า GPU ตระกูล Blackwell มีต้นทุนต่อชั่วโมงสูงเกือบ 2 เท่าเมื่อเทียบกับรุ่น Hopper แต่กลับให้ต้นทุนการอินเฟอเรนซ์ต่อโทเค็นต่ำลงถึง 35 เท่า ใช้ DeepSeek-R1 เป็นโมเดลทดสอบ พบว่า Blackwell (GB300 NVL72) ให้บริการเช่าในราคา $2.65 ต่อ GPU ต่อชั่วโมง ขณะที่ Hopper อยู่ที่ $1.41 อย่างไรก็ตาม ประสิทธิภาพแบบต่อ GPU เพิ่มจาก 90 เป็น 6,000 โทเค็นต่อวินาที การเพิ่มขึ้นของทรูพุต 65 เท่านี้ทำให้ต้นทุนต่อโทเค็น 1 ล้านโทเค็นลดจาก $4.20 เหลือ $0.12

ตัวเลข $0.12 ตั้งสมมติฐานว่ามีการปรับแต่งซอฟต์แวร์เต็มรูปแบบ รวมถึงการอินเฟอเรนซ์ความแม่นยำต่ำ FP4 และการทำนายหลายโทเค็น (MTP) หากปิด MTP ต้นทุนต่อโทเค็น 1 ล้านโทเค็นจะพุ่งขึ้นไปอยู่ที่ประมาณ $2.35 ก่อนจะลดลงเหลือ $0.11 เมื่อเปิดใช้งาน โดยแสดงให้เห็นว่าฟีเจอร์นี้เพียงอย่างเดียวมีผลต่อการเพิ่มประสิทธิภาพถึง 21 เท่า

news.article.disclaimer

btc.bar.articles

ซีอีโอของ Google DeepMind คาดการณ์ว่า AGI จะมาถึงภายในปี 2030 พร้อมให้บริษัทต่างๆ มีเวลา 4 ปีในการเตรียมตัว

จากวิดีโอซีรีส์ของ Sequoia Capital ที่มี Demis Hassabis เป็นผู้ร่วมรายการ ประธานเจ้าหน้าที่บริหารของ Google DeepMind คาดการณ์ว่า ปัญญาประดิษฐ์ทั่วไป (AGI) จะมาถึงภายในปี 2030 Hassabis ซึ่งได้รับรางวัลโนเบลสาขาเคมีประจำปี 2024 มองกรอบเวลานี้เป็นความจริงเชิงธุรกิจที่เข้มงวด ทำให้ผู้นำต้องทบทวนเรื่องการพัฒนาผลิตภัณฑ์ de

GateNews2 นาที ที่แล้ว

OpenAI จะดำเนินการเป็นบริษัทที่มีกำไรต่ำแบบต่อเนื่อง และลงนามข้อตกลงด้านพลังงานระยะเวลา 20 ปี

ตามรายงานของ Odaily ประธานเจ้าหน้าที่บริหารของ OpenAI อย่าง Sam Altman กล่าวใน Stripe Sessions ว่า OpenAI ตั้งเป้าที่จะกลายเป็นบริษัทโครงสร้างพื้นฐานขนาดใหญ่ที่มีกำไรต่ำอย่างต่อเนื่องแต่เติบโตอย่างรวดเร็ว โดยจะให้บริการผลิตภัณฑ์ในลักษณะเดียวกับ “มิเตอร์อัจฉริยะ” ซึ่งผู้ใช้งานสามารถซื้อเพื่อทำให้งานการดำเนินธุรกิจอัตโนมัติ หรือฝังเข้าไปใน

GateNews3 นาที ที่แล้ว

Forefront Tech เสร็จสิ้นการกำหนดราคาการเสนอขาย IPO ที่ $100M แล้ว พร้อมเข้าจดทะเบียนใน Nasdaq

ตามรายงานของ ChainCatcher บริษัท Forefront Tech Holdings Acquisition Corp ได้เสร็จสิ้นการกำหนดราคาเสนอขายหุ้น IPO มูลค่า 100 ล้านดอลลาร์สหรัฐในวันที่ 30 เมษายน โดยจะเข้าจดทะเบียนใน Nasdaq ภายใต้สัญลักษณ์ FTHAU เงินที่ได้จะถูกนำไปใช้เพื่อสำรวจโอกาสด้านการควบรวมกิจการและการเข้าซื้อกิจการในบล็อกเชน ปัญญาประดิษฐ์ ฟินเทค และด้านอื่นๆ

GateNews40 นาที ที่แล้ว

อดีตผู้บริหารของ Meta ระดมทุนให้กับสตาร์ทอัพด้าน AI Flourish ที่มูลค่า 2.5 พันล้านดอลลาร์

ตามรายงานของ Bloomberg โธมัส เรียร์ดอน (Thomas Reardon) อดีตผู้บริหารของ Meta ซึ่งเคยเป็นผู้นำงานเกี่ยวกับ Meta's Neural Band กำลังระดมทุนให้กับ Flourish สตาร์ทอัพด้าน AI แห่งใหม่ที่มุ่งเน้นระบบ AI แบบใช้พลังงานต่ำ โดย Lux Capital และ Google Ventures ตกลงจะเป็นนักลงทุนรายใหญ่ และมีผู้สนับสนุนบางส่วนได้ให้คำมั่นเงินแล้ว 500 ล้านดอลลาร์ ที่การประเมินมูลค่า 2.5

GateNews42 นาที ที่แล้ว

OpenAI ย้อนรอยปัญหา “Goblin” ไปยังสัญญาณตอบแทนตามบุคลิกแนวเนิร์ด และการพูดถึง Goblin พุ่งขึ้น 175% ใน GPT-5.1

ตามที่ OpenAI ระบุ บริษัทได้ระบุสาเหตุรากของปัญหา “goblin” ที่รุมหลอกหลอนโมเดล GPT ตั้งแต่ GPT-5.1 เป็นต้นมา โดยสัญญาณรางวัลที่ใช้เพื่อเสริมแรงบุคลิก “Nerdy” กระตุ้นให้เกิดคำตอบที่มีการอ้างอิงถึงสิ่งมีชีวิตในจินตนาการ โดยข้อมูลชุดฝึก 76.2% แสดงถึง

GateNews1 ชั่วโมง ที่แล้ว

Parallel Web Systems ระดมทุน Series B จำนวน $100M ที่มูลค่า $2B นำโดย Sequoia

ตามรายงานของ TechCrunch Parallel Web Systems สตาร์ทอัพด้าน AI ที่ก่อตั้งโดย Parag Agrawal อดีต CEO ของ Twitter ระดมทุนได้ 100 ล้านดอลลาร์สหรัฐในรอบซีรีส์ B โดยมี Sequoia เป็นผู้นำที่มูลค่าประเมิน 2 พันล้านดอลลาร์สหรัฐ รอบนี้ทำให้เงินทุนรวมของบริษัทอยู่ที่ 230 ล้านดอลลาร์สหรัฐ ห่างจากรอบซีรีส์ A มูลค่า 100 ล้านดอลลาร์สหรัฐเพียง 5 เดือน Parallel

GateNews2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น