อดีตวิศวกร Seed ของ ByteDance: การอัปเดต AI ของ ByteDance ใช้เวลาหกเดือน เทียบกับสามเดือนของ Google

ข้อความ Gate News วันที่ 24 เมษายน — จางฉี อดีตวิศวกรทีม Seed ของ ByteDance และปัจจุบันเป็นผู้ช่วยศาสตราจารย์ที่มหาวิทยาลัยปักกิ่ง ได้เปิดเผยในพอดแคสต์ “Into Asia” ว่า ByteDance ใช้เวลาประมาณหกเดือนในการทำวงจรเต็มรูปแบบของการฝึกพรีเทรนโมเดลภาษาขนาดใหญ่ (pretraining รวมถึงการฝึกหลังการฝึก) ขณะที่ Google มีรายงานว่าใช้เวลาเพียงสามเดือนเท่านั้น จางมองว่าส่วนต่างด้านความเร็วนี้เป็นเหตุผลหลักประการหนึ่งที่ทำให้บริษัทจีนประสบปัญหาในการตามให้ทันในการพัฒนา AI

จางได้บรรยายถึง “วัฒนธรรมการตั้งตัวชี้วัด” ภายใน Seed โดยหัวหน้าทีมจะได้รับการประเมินจากคะแนนตัวชี้วัดที่พวกเขาดูแล และสมาชิกทุกคนมุ่งเน้นการเร่งตัวเลข อย่างไรก็ตาม เขาระบุว่าสิ่งนี้ไม่ได้แปลเป็นประสบการณ์ผู้ใช้ที่ดีขึ้นในทางปฏิบัติ แม้โมเดลของบริษัทจีนรายใหญ่จะดูแข่งขันได้กับโมเดลแนวหน้าของสหรัฐฯ บนกระดาษ แต่กลับไม่ถึงระดับในสภาพการใช้งานจริง เป้าหมายของ Seed คือการก้าวไปสู่ระดับสมรรถนะชั้นนำระดับโลก แต่จางกล่าวว่าเขาไม่เชื่อว่าทีมได้ทำได้ และยังไม่บรรลุเป้าหมายด้านความเป็นผู้นำในประเทศ

ช่วงปลายปี 2024 Seed มองว่าตัวเองเทียบเท่ากับ GPT-4o แต่หลังจากการเปิดตัวของ DeepSeek ทีมกลับตระหนักว่ายังมีช่องว่างอยู่ เมื่อจางเข้าร่วม กลุ่มทั้งหมดกำลังเร่งปรับเปลี่ยนทิศทางไปสู่การเรียนรู้แบบเสริมแรงเพื่อแก้ไขข้อบกพร่องอย่างเร่งด่วน

news.article.disclaimer

btc.bar.articles

IREN เข้าซื้อ Mirantis ด้วยดีลแลกหุ้นทั้งหมด $625M เพื่อขยายแพลตฟอร์มคลาวด์สำหรับ AI

ตาม BlockBeats บริษัท IREN Limited ตกลงเข้าซื้อกิจการบริษัทซอฟต์แวร์โครงสร้างพื้นฐานบนคลาวด์ Mirantis ด้วยมูลค่าประมาณ 625 ล้านดอลลาร์สหรัฐ ในรูปแบบการแลกหุ้นทั้งหมด เมื่อวันที่ 5 พฤษภาคม การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อยกระดับความสามารถด้าน AI บนคลาวด์ของ IREN โดยการนำความสามารถด้านซอฟต์แวร์และการจัดการระบบออร์เคสตราชันเข้ามาเพื่อ

GateNews4 ชั่วโมง ที่แล้ว

ซีอีโอของ Anthropic: สหรัฐฯ กำลังพิจารณาเส้นทางการปล่อยโมเดล AI แบบง่ายขึ้น ขณะที่คู่แข่งตามหลัง 1-3 เดือน

ตาม 金十 ซีอีโอของ Anthropic เปิดเผยเมื่อวันที่ 5 พฤษภาคมว่า รัฐบาลสหรัฐฯ ดูเหมือนกำลังพิจารณาปรับให้กระบวนการในการปล่อยโมเดลปัญญาประดิษฐ์เป็นไปอย่างคล่องตัวมากขึ้น โดยซีอีโอระบุว่าขีดความสามารถของแล็บ AI รายใหญ่อื่นๆ อาจตามหลัง Anthropic อยู่ 1 ถึง 3

GateNews4 ชั่วโมง ที่แล้ว

ทีม SGLang ปิดรอบระดมทุนเมล็ดพันธุ์ $100M ได้สำเร็จที่ $400M มูลค่า โดย Accel เป็นผู้นำ

ตามรายงานของ Beating ทีมที่อยู่เบื้องหลังเอนจินอนุมานโอเพนซอร์ส SGLang ได้ก่อตั้ง RadixArk อย่างเป็นทางการแล้ว และได้ปิดรอบระดมทุนเมล็ดพันธุ์มูลค่า 100 ล้านดอลลาร์สหรัฐเรียบร้อย โดยประเมินมูลค่าหลังการลงทุนอยู่ที่ 400 ล้านดอลลาร์สหรัฐ Accel เป็นผู้นำรอบ โดย Spark Capital เป็นนักลงทุนร่วมที่นำรอบ และคู่แข่งด้านเซมิคอนดักเตอร์อย่าง Nvidia (ผ่าน

GateNews4 ชั่วโมง ที่แล้ว

OpenAI ให้ทุน 8,000 นักพัฒนา เพิ่มขีดจำกัดอัตรา Codex แบบ 10x ถึงวันที่ 5 มิถุนายน

ตาม Beating OpenAI ได้ส่งอีเมลไปยังนักพัฒนามากกว่า 8,000 คนที่ลงทะเบียนสำหรับอีเวนต์ GPT-5.5 แบบออฟไลน์ในซานฟรานซิสโก โดยให้สิทธิ์เพิ่มขีดจำกัดอัตราการใช้งาน Codex ขึ้น 10 เท่า มีผลทันทีจนถึงวันที่ 5 มิถุนายน ผู้สมัครทุกคนจะได้รับรางวัลไม่ว่าพวกเขาจะได้รับอีเวนต์หรือไม่ก็ตาม

GateNews4 ชั่วโมง ที่แล้ว

OpenAI อยู่ระหว่างการเจรจากับ Anthropic เพื่อทำบริษัทร่วมทุนในการเข้าซื้อบริษัทบริการ AI 3 แห่ง เมื่อวันที่ 5 พฤษภาคม

ตามรายงานของ Jin 10 การร่วมทุนของ OpenAI กับ Anthropic อยู่ระหว่างการเจรจาเพื่อเข้าซื้อบริษัทบริการ AI จำนวน 3 แห่งในวันที่ 5 พฤษภาคม โดยบริษัทเป้าหมายที่คาดกันว่าได้แก่บริษัทที่เน้นงานด้านวิศวกรรมในกลุ่มบริการ AI

GateNews4 ชั่วโมง ที่แล้ว

Anthropic เปิดตัวเอเจนต์ AI 10 ตัวสำหรับบริการทางการเงินในวันอังคาร

Anthropic ได้เปิดตัวเอเจนต์ AI ใหม่ 10 ตัวเมื่อวันอังคาร โดยออกแบบมาเพื่อทำงานด้านบริการทางการเงิน รวมถึงการร่างสไลด์สำหรับการประชุมกับลูกค้า การตรวจทานงบการเงิน และการส่งต่อเคสเพื่อให้มีการทบทวนด้านการปฏิบัติตามกฎระเบียบ เครื่องมือนี้มุ่งเป้าไปที่ผู้เชี่ยวชาญในธุรกิจธนาคาร ประกัน การบริหารสินทรัพย์ และฟินเทค

GateNews4 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น