DeepSeek V4 เปิดตัวพร้อมหน้าต่างบริบท 1M; ชิป Huawei Ascend และ Cambricon ทำได้เต็มรูปแบบ

ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — DeepSeek V4-Pro และ DeepSeek V4-Flash ได้รับการปล่อยอย่างเป็นทางการและเปิดซอร์สเมื่อวันที่ 24 เมษายน โดยมีความยาวการประมวลผลบริบทเพิ่มขึ้นอย่างมีนัยสำคัญจาก 128K เป็น 1M ซึ่งคิดเป็นการเพิ่มความจุเกือบ 10 เท่า โดย Huawei Computing ประกาศว่า ผลิตภัณฑ์ซูเปอร์โหนด Ascend ของบริษัท รองรับโมเดลตระกูล DeepSeek V4 อย่างเต็มรูปแบบผ่านความร่วมมืออย่างใกล้ชิดระหว่างเทคโนโลยีชิปและโมเดล

Huawei Ascend 950 ทำให้การดีพลอยการอินเฟอเรนซ์ของโมเดล DeepSeek V4 มีอัตราการส่งผ่านสูงและหน่วงเวลาต่ำ โดยใช้เทคนิค fused kernel และ multi-stream parallelism เพื่อลดภาระการคำนวณ Attention และค่าใช้จ่ายในการเข้าถึงหน่วยความจำ สำหรับ DeepSeek V4-Pro เมื่อมีอินพุต 8K Ascend 950 ทำได้ประมาณ 20ms TPOT ด้วยอัตราการ Decode แบบ single-card 4,700 TPS; สำหรับ DeepSeek V4-Flash ภายใต้อินพุต 8K จะทำได้ประมาณ 10ms TPOT ด้วยทรูพุต 1,600 TPS Ascend A3 ซีรีส์ซูเปอร์โหนดยังทำได้เต็มรูปแบบเช่นกัน โดยมีการจัดเตรียมชุดอ้างอิงสำหรับการเทรนนิงเพื่อการ fine-tune ได้อย่างรวดเร็ว จากซูเปอร์โหนด Ascend A3 ขนาด 64 การ์ดที่มีโหมด large EP DeepSeek V4-Flash ทำได้มากกว่า 2,000 TPS ในการ Decode แบบ single-card สำหรับสถานการณ์อินพุต-เอาต์พุต 8K/1K โดยใช้เอนจินการอินเฟอเรนซ์ vLLM สายผลิตภัณฑ์ Ascend A2, A3 และ 950 ทั้งหมดของ Huawei รองรับทั้ง DeepSeek V4-Flash และ V4-Pro

Huawei Cloud ประกาศความเข้ากันได้แบบผู้มาก่อนได้เปรียบกับ DeepSeek V4 โดยให้บริการ API token แบบคลิกเดียวแก่ผู้พัฒนาผ่านแพลตฟอร์ม MaaS ของบริษัท Huawei Cloud ปรับความสามารถในเลเยอร์ระบบ เลเยอร์โอเปอเรเตอร์ และเลเยอร์คลัสเตอร์ให้เหมาะสม เพื่อให้มั่นใจว่าโมเดลสามารถปรับตัวได้อย่างรวดเร็วและทำการดีพลอยที่มีประสิทธิภาพสูง องค์กรต่างๆ รวมถึง Kingsoft WPS และ 360 ได้ผนวกรวมโมเดลใหม่ของ DeepSeek ผ่าน Huawei Cloud แล้ว

Cambricon ยังประกาศความเข้ากันได้ Day 0 กับ DeepSeek V4-Flash และ V4-Pro โดยอิงตามเฟรมเวิร์กการอินเฟอเรนซ์ vLLM โดยมีโค้ดสำหรับการปรับใช้เปิดซอร์สให้กับชุมชน GitHub Cambricon เคยทำสำเร็จในการปรับใช้แบบผู้มาก่อนได้เปรียบเช่นกันเมื่อ DeepSeek V3.2 เปิดตัวเมื่อปีที่แล้ว โดยได้ดำเนินการปรับปรุงสมรรถนะแบบร่วมมืออย่างลึกซึ้งระหว่างซอฟต์แวร์และฮาร์ดแวร์สำหรับโมเดลตระกูล DeepSeek

news.article.disclaimer

btc.bar.articles

Google ตั้งใจลงทุนสูงถึง $40 พันล้านดอลลาร์ใน Anthropic สัญญาจัดหาพลังประมวลผล 5+ กิกะวัตต์

ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — ตามแหล่งข่าวในตลาด Google วางแผนจะลงทุนสูงถึง $40 พันล้านดอลลาร์ใน Anthropic การลงทุนจะเริ่มต้นด้วยเงินสดตั้งต้น $10 พันล้านดอลลาร์ จากนั้นจะมีเงินเพิ่มได้สูงถึง $30 พันล้านดอลลาร์อีก ทั้งนี้ขึ้นอยู่กับการบรรลุเป้าหมายตามที่กำหนด Google จะจัดหา Anthropic ด้วยพลังประมวลผลอย่างน้อย 5 กิกะวัตต์ในฐานะส่วนหนึ่งของความร่วมมือ

GateNews1 ชั่วโมง ที่แล้ว

หน่วยงานกำกับดูแลของสวิตเซอร์แลนด์ FINMA เตือนว่าเครื่องมือ AI ของ Anthropic อย่าง Mythos ก่อความเสี่ยงทางการเงิน

ข้อความข่าว Gate News 24 เมษายน — สำนักงานกำกับดูแลตลาดการเงินของสวิตเซอร์แลนด์ (FINMA) ระบุว่า การอนุญาตให้ธนาคารสามารถนำเครื่องมือปัญญาประดิษฐ์ของ Anthropic อย่าง Mythos มาใช้ได้อย่างรวดเร็วและสะดวกสบายจะก่อให้เกิดความเสี่ยงร้ายแรงต่อ

GateNews1 ชั่วโมง ที่แล้ว

Fere AI เสร็จสิ้นการระดมทุน 1.3M ดอลลาร์ ที่นำโดย Ethereal Ventures

ข่าว Gate ประจำวัน 24 เมษายน — Fere AI ซึ่งเป็นแพลตฟอร์มเอเจนต์การเทรดสินทรัพย์ดิจิทัลที่ขับเคลื่อนด้วย AI ประกาศเสร็จสิ้นการระดมทุนมูลค่า 1.3 ล้านดอลลาร์ ซึ่งนำโดย Ethereal Ventures โดย Galaxy Vision Hill และ Kosmos Ventures เข้าร่วมด้วย แพลตฟอร์มรองรับเครือข่ายข้ามสายรวมถึง Ethereum,

GateNews3 ชั่วโมง ที่แล้ว

Anthropic ย้อนกลับการเปลี่ยนแปลงของ Claude Code หลังคุณภาพลดลง; แก้ไขทั้งหมดเสร็จสิ้นแล้ว

ข้อความ Gate News วันที่ 24 เมษายน — Anthropic ได้รับทราบว่าคุณภาพของ Claude Code เพิ่งลดลง และยืนยันว่าปัญหาที่เกี่ยวข้องทั้งหมดได้รับการแก้ไขแล้วด้วยการย้อนกลับ (rollbacks) และการแก้ไข (fixes) ปัญหาดังกล่าวเกิดจากการปรับผลิตภัณฑ์และพรอมป์ต์จำนวนสามรายการที่ทำขึ้นระหว่างช่วงต้นถึงกลางเดือนเมษายน ในวันที่ 4 มีนาคม

GateNews4 ชั่วโมง ที่แล้ว

Kaelan ผู้ร่วมก่อตั้ง NeoSoul: อุตสาหกรรม AI ควรเปิดพื้นที่ให้ของเล่นมีอยู่ นวัตกรรมมักเริ่มต้นจากผลิตภัณฑ์เชิงทดลอง

ข้อความจาก Gate News วันที่ 24 เมษายน — ในงานเสวนาที่ฮ่องกงเกี่ยวกับการเงินอัจฉริยะที่เข้ารหัส NeoSoul ร่วมก่อตั้งโดย Kaelan ได้แบ่งปันมุมมองเกี่ยวกับการประเมินโครงการ AI ในระยะแรกเริ่ม ซึ่งเป็นอุตสาหกรรม AI ที่พัฒนารวดเร็ว โดยนอกเหนือจากการประเมินผลิตภัณฑ์ปัจจุบันแล้ว ทีมงานต้องแสดงให้เห็นถึงความสามารถในการก้าวทันความสามารถของโมเดลพื้นฐานอย่างต่อเนื่อง เขากล่าวว่า ใน

GateNews5 ชั่วโมง ที่แล้ว

Meta เตรียมติดตั้งชิป AWS Graviton5 หลายสิบล้านชิ้นในดีลมูลค่าหลายปีระดับพันล้านดอลลาร์

ข้อความข่าว Gate วันที่ 24 เมษายน — Meta ได้ลงนามในข้อตกลงหลายปีร่วมกับ Amazon Web Services เพื่อปรับใช้โปรเซสเซอร์ Graviton5 หลายสิบล้านตัวสำหรับโครงสร้างพื้นฐานด้าน AI ทำให้ Meta เป็นหนึ่งในลูกค้ารายใหญ่ที่สุดของ AWS ด้าน Graviton5 ทั่วโลก ข้อตกลงดังกล่าว ครอบคลุมระยะเวลา 3 ถึง 5 ปี และมีมูลค่าเป็นพันล้านด

GateNews5 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น