อดีตวิศวกร Seed ของ ByteDance: การอัปเดต AI ของ ByteDance ใช้เวลาหกเดือน เทียบกับสามเดือนของ Google

ข้อความ Gate News วันที่ 24 เมษายน — จางฉี อดีตวิศวกรทีม Seed ของ ByteDance และปัจจุบันเป็นผู้ช่วยศาสตราจารย์ที่มหาวิทยาลัยปักกิ่ง ได้เปิดเผยในพอดแคสต์ “Into Asia” ว่า ByteDance ใช้เวลาประมาณหกเดือนในการทำวงจรเต็มรูปแบบของการฝึกพรีเทรนโมเดลภาษาขนาดใหญ่ (pretraining รวมถึงการฝึกหลังการฝึก) ขณะที่ Google มีรายงานว่าใช้เวลาเพียงสามเดือนเท่านั้น จางมองว่าส่วนต่างด้านความเร็วนี้เป็นเหตุผลหลักประการหนึ่งที่ทำให้บริษัทจีนประสบปัญหาในการตามให้ทันในการพัฒนา AI

จางได้บรรยายถึง “วัฒนธรรมการตั้งตัวชี้วัด” ภายใน Seed โดยหัวหน้าทีมจะได้รับการประเมินจากคะแนนตัวชี้วัดที่พวกเขาดูแล และสมาชิกทุกคนมุ่งเน้นการเร่งตัวเลข อย่างไรก็ตาม เขาระบุว่าสิ่งนี้ไม่ได้แปลเป็นประสบการณ์ผู้ใช้ที่ดีขึ้นในทางปฏิบัติ แม้โมเดลของบริษัทจีนรายใหญ่จะดูแข่งขันได้กับโมเดลแนวหน้าของสหรัฐฯ บนกระดาษ แต่กลับไม่ถึงระดับในสภาพการใช้งานจริง เป้าหมายของ Seed คือการก้าวไปสู่ระดับสมรรถนะชั้นนำระดับโลก แต่จางกล่าวว่าเขาไม่เชื่อว่าทีมได้ทำได้ และยังไม่บรรลุเป้าหมายด้านความเป็นผู้นำในประเทศ

ช่วงปลายปี 2024 Seed มองว่าตัวเองเทียบเท่ากับ GPT-4o แต่หลังจากการเปิดตัวของ DeepSeek ทีมกลับตระหนักว่ายังมีช่องว่างอยู่ เมื่อจางเข้าร่วม กลุ่มทั้งหมดกำลังเร่งปรับเปลี่ยนทิศทางไปสู่การเรียนรู้แบบเสริมแรงเพื่อแก้ไขข้อบกพร่องอย่างเร่งด่วน

news.article.disclaimer

btc.bar.articles

DeepSeek V4-Flash ขึ้นบน Ollama Cloud, โฮสต์ในสหรัฐอเมริกา: Claude Code, OpenClaw เชื่อมต่อด้วยปุ่มเดียว

Ollama Cloud ได้วางจำหน่าย DeepSeek V4-Flash แล้ว โดยการอนุมานทำบนโฮสต์ในสหรัฐฯ และมีชุดคำสั่งแบบกดครั้งเดียวให้เลือก 3 ชุด สำหรับการเชื่อมต่อ Claude Code, OpenClaw และ Hermes V4-Flash/V4-Pro ใช้สถาปัตยกรรมแบบ MoE รองรับบริบท 1M แบบเนทีฟ และลดต้นทุนด้วยการบีบอัดแบบ Token-wise + DSA sparse attention ในสถานการณ์ 1M การทำงานต่อ token FLOPs ลดลง 27% และ KV cache ลดลง 10% API มีความเข้ากันได้กับ OpenAI ChatCompletions และ Anthropic ทำให้ง่ายต่อการสลับระหว่างเวิร์กโฟลว์หลายแบบ ลดต้นทุนและความเสี่ยงด้านอธิปไตยของข้อมูล

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

โครงสร้างพื้นฐาน Web3 AI AIW3 ระดมทุน Seed ได้ $2M ล้าน นำโดย Buffalo Capital

ข่าวจาก Gate วันที่ 24 เมษายน — แพลตฟอร์มโครงสร้างพื้นฐาน Web3 AI AIW3 ประกาศเสร็จสิ้นการระดมทุน Seed รอบแรกจำนวน $2 ล้านดอลลาร์แล้ว รอบนี้นำโดย Buffalo Capital โดย GalaXin Capital และ Three-stones Ventures เข้าร่วมในฐานะผู้ร่วมลงทุน AIW3 กำลังเปลี่ยนผ่านไปสู่กรอบแนวคิดการดำเนินการแบบ on-chain ของ Agent-as-a-Service

GateNews1 ชั่วโมง ที่แล้ว

Cohere เข้าซื้อกิจการบริษัท AI ของเยอรมนี Aleph Alpha พร้อมเงินลงทุน $600M เพื่อขยายการเติบโตในยุโรป

ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — บริษัท AI ของแคนาดา Cohere ประกาศแผนที่จะเข้าซื้อกิจการ Aleph Alpha ซึ่งเป็นบริษัท AI ในเยอรมนี เพื่อเสริมความแข็งแกร่งในยุโรป Schwarz Group ซึ่งเป็นผู้สนับสนุนของ Aleph Alpha วางแผนจะลงทุน $600 ล้านดอลลาร์ในการระดมทุนรอบ Series E ของ Cohere คาดว่ารอบการระดมทุนจะปิดในปี 202

GateNews2 ชั่วโมง ที่แล้ว

Xpeng, Xiaomi Lead In-Car AI Push at Beijing Auto Show

Gate News message, April 24 — Chinese automakers showcased advanced in-car AI systems at the Beijing Auto Show on April 24, as the country accelerates its AI Plus strategy and seeks greater independence from foreign semiconductors. Xpeng demonstrated voice-controlled parking that allows drivers to

GateNews2 ชั่วโมง ที่แล้ว

วิศวกรของ OpenAI Clive Chan ท้าทายคำแนะนำด้านฮาร์ดแวร์ของ V4 โดยชี้ให้เห็นข้อผิดพลาดและความคลุมเครือเมื่อเทียบกับ V3

ข่าวประจำประตู ประจำวันที่ 24 เมษายน — วิศวกรของ OpenAI ชื่อ Clive Chan ได้ยื่นคัดค้านอย่างละเอียดต่อบทแนะนำด้านฮาร์ดแวร์ในรายงานทางเทคนิค V4 โดยกล่าวว่าเมื่อเทียบกับเวอร์ชัน V3 ที่ได้รับคำชม มันเป็น "ค่อนข้างห่วยและเสี่ยงต่อข้อผิดพลาดอย่างน่าประหลาดใจ" คำแนะนำด้านฮาร์ดแวร์ของ V3 ซึ่งมีเซสชัน Q&A

GateNews3 ชั่วโมง ที่แล้ว

Naver เปิดตัว AI Tab รุ่นเบต้า ขณะที่ Google Gemini ก้าวเข้าสู่ตลาดการค้นหาในเกาหลีใต้

ประกาศข่าว Gate ประจำวันที่ 24 เมษายน — Naver ประกาศเริ่มการทดสอบแบบปิดสำหรับ AI Tab ซึ่งเป็นฟีเจอร์การค้นหาแบบสนทนาใหม่ หลังจากที่ Google เปิดตัว Gemini ใน Chrome ในเกาหลีใต้ AI Tab จะปรากฏควบคู่ไปกับแท็บการค้นหาที่มีอยู่ของ Naver โดยมอบพื้นที่เฉพาะสำหรับคำถามแบบสนทนา

GateNews3 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น