OpenAI เปิดเผยโปรโตคอลเครือข่ายซูเปอร์คอมพิวเตอร์ MRC! ร่วมมือกับ Nvidia, AMD และ Microsoft เพื่อสร้างโครงสร้างพื้นฐานของ Stargate

ChainNewsAbmedia

OpenAI ประกาศเปิดตัวโปรโตคอลเครือข่าย AI ซูเปอร์คอมพิวเตอร์รุ่นใหม่ล่าสุด MRC(Multipath Reliable Connection)และได้ปล่อยโค้ดโอเพนซอร์สผ่าน Open Compute Project(OCP)แล้ว เทคโนโลยีนี้พัฒนาโดย OpenAI ร่วมกับ AMD、Microsoft、NVIDIA、Intel、Broadcom และผู้ให้บริการรายอื่นๆ โดยมีเป้าหมายเพื่อแก้ปัญหาคอขวดในการถ่ายโอนข้อมูลระหว่าง GPU สำหรับคลัสเตอร์ฝึก AI ระดับที่ใหญ่ยิ่งมาก

คอขวดตัวจริงของการฝึก AI คือการสื่อสารระหว่าง GPU

OpenAI ระบุว่า เมื่อจำนวนผู้ใช้งาน ChatGPT เพิ่มขึ้นจนมากกว่า 9 อันดับล้านคนต่อสัปดาห์ AI ระบบกำลังค่อยๆ กลายเป็นบริการระดับโครงสร้างพื้นฐาน เพื่อรองรับความต้องการการฝึกและการประมวลผลของโมเดลยุคถัดไป OpenAI มองว่าไม่เพียงแต่ตัวโมเดลเท่านั้นที่ต้องพัฒนา แต่โครงสร้างเครือข่ายก็จำเป็นต้องได้รับการออกแบบใหม่ด้วย

ในบทความทางเทคนิค OpenAI ชี้ว่า ในการฝึกโมเดล AI ขนาดใหญ่ ขั้นตอนการฝึกครั้งหนึ่งอาจเกี่ยวข้องกับการแลกเปลี่ยนข้อมูลระหว่าง GPU นับเป็นล้านครั้ง หากการส่งถ่ายโอนแม้เพียงหนึ่งในนั้นมีความหน่วง อาจทำให้การซิงก์การฝึกรั้งหยุดทั้งหมด ส่งผลให้ GPU จำนวนมากต้องหยุดทำงาน

และเมื่อขนาดของ AI ซูเปอร์คอมพิวเตอร์ยิ่งใหญ่ขึ้น ปัญหาเครือข่ายคับคั่ง ความผิดพลาดของสวิตช์ ความหน่วงแกว่ง (jitter) จะยิ่งทวีความรุนแรงอย่างรวดเร็ว OpenAI มองว่า นี่คือหนึ่งในความท้าทายทางเทคนิคที่สำคัญที่สุดของแผนงานซูเปอร์คอมพิวเตอร์ Stargate

ในอดีต สถาปัตยกรรมเครือข่ายของดาต้าเซ็นเตอร์ส่วนใหญ่ใช้การส่งข้อมูลผ่านเส้นทางเดียว (single-path) แต่การเปลี่ยนแปลงใหญ่ที่สุดของ MRC คือการทำให้ข้อมูลชุดเดียวกันถูกกระจายและส่งผ่านเส้นทางจำนวนหลายร้อยเส้นพร้อมกัน

MRC คืออะไร?OpenAI:ทำให้เครือข่าย AI กลายเป็นการหลบสิ่งกีดขวางแบบอัตโนมัติ

จากคำอธิบายของ OpenAI และ AMD แก่นของ MRC คือ:

แยกข้อมูลออก แล้ววิ่งผ่านหลายเส้นทางพร้อมกัน

หลบความผิดปกติแบบอัตโนมัติในระดับไมโครวินาที

ลดความหน่วงที่เกิดจากเครือข่ายคับคั่ง

ทำให้ GPU ทำงานแบบซิงก์ต่อเนื่อง

AMD เปรียบเทียบว่า เครือข่าย AI แบบดั้งเดิมเหมือนทางด่วนที่วิ่งเส้นเดียว พอเกิดรถติดหรืออุบัติเหตุก็จะกระทบความคืบหน้าทั้งระบบ ขณะที่ MRC ก็เหมือนระบบขนส่งอัจฉริยะที่มีความสามารถเปลี่ยนเส้นทางได้ทันที AMD ถึงกับระบุว่า “คอขวดที่แท้จริงของการทำให้ AI ขยายขนาดไม่ได้อยู่ที่ GPU และ CPU แล้ว แต่อยู่ที่เครือข่าย”

ทำไม OpenAI ถึงต้องออกแบบโปรโตคอลเครือข่ายเอง?

สัญญาณครั้งนี้ของ OpenAI ชัดเจนมาก:การแข่งขันด้าน AI ไม่ใช่แค่การแข่งขันที่ตัวโมเดลเท่านั้น แต่เป็นการแข่งขันที่ “โครงสร้างพื้นฐานของซูเปอร์คอมพิวเตอร์” ทั้งชุด ในบทความ OpenAI กล่าวไว้ว่า ก่อนที่ Stargate จะเกิดขึ้น พวกเขากับพาร์ทเนอร์ได้ร่วมกันดูแลซูเปอร์คอมพิวเตอร์ AI รุ่นก่อนหน้ามาถึง 3 รุ่น ประสบการณ์เหล่านี้ทำให้ OpenAI สรุปได้ว่า หากต้องการใช้งานพลังการประมวลผลอย่างมีประสิทธิภาพภายใต้ขนาด Stargate ทั้งสแตก (stack) ต้องลดความซับซ้อนลงอย่างมาก ซึ่งรวมถึงชั้นเครือข่ายด้วย

กล่าวคือ ในการแข่งขันของ Frontier Model ในอนาคต ไม่ได้เป็นแค่ใครมีโมเดลที่แข็งแกร่งกว่า แต่เป็นใครที่ทำให้ GPU หลายหมื่นหรือแม้กระทั่งหลายล้านตัวทำงานแบบซิงก์กันได้อย่างมีประสิทธิภาพมากกว่า

เบื้องหลัง MRC คือ Stargate:แผนแมนฮัตตันของ OpenAI

พื้นฐานของ MRC จริงๆ แล้วอยู่ที่ Stargate LLC Stargate เป็นโครงการโครงสร้างพื้นฐาน AI ขนาดใหญ่ที่ OpenAI、SoftBank Group、Oracle Corporation และ MGX ร่วมผลักดัน โดยเริ่มต้นตั้งเป้าจะลงทุนโครงสร้างพื้นฐาน AI ในสหรัฐฯ สูงถึง 500 พันล้านดอลลาร์ OpenAI ระบุว่า ขณะนี้พวกเขาทำได้เกินเป้าหมายชั่วคราวระดับ 10GW แล้ว และในช่วง 90 วันที่ผ่านมาได้เพิ่มกำลังการผลิตโครงสร้างพื้นฐาน AI มากกว่า 3GW

ซูเปอร์คอมพิวเตอร์ Stargate ที่ตั้งอยู่ใน Abilene รัฐเท็กซัส เป็นหนึ่งในพื้นที่ใช้งานหลักของ MRC OpenAI ระบุว่า MRC ได้ถูกรวมเข้ากับอินเทอร์เฟซเครือข่าย 800Gb/s รุ่นล่าสุด และได้เดินระบบจริงในคลัสเตอร์ฝึกขนาดใหญ่

บทความนี้ที่ OpenAI เผยแพร่โปรโตคอลเครือข่ายซูเปอร์คอมพิวเตอร์ MRC!ร่วมมือกับ NVIDIA、AMD、ไมโครซอฟต์เพื่อสร้างโครงสร้างพื้นฐาน Stargate เผยแพร่ครั้งแรกที่ 鏈新聞 ABMedia

news.article.disclaimer

btc.bar.articles

Moonshot AI ระดมทุนได้ 2 พันล้านดอลลาร์ ที่มูลค่า 20 พันล้านดอลลาร์ นำโดย Meituan

ตามรายงานของ Bloomberg Moonshot AI ซึ่งเป็นสตาร์ทอัพจากกรุงปักกิ่งที่อยู่เบื้องหลังแชตบอท Kimi ระดมทุนได้ประมาณ 2 พันล้านดอลลาร์สหรัฐ ในรอบการลงทุนที่มี Long-Z Investments หน่วยงานร่วมลงทุนของ Meituan เป็นผู้นำ โดยประเมินมูลค่าบริษัทไว้ที่มากกว่า 20 พันล้านดอลลาร์สหรัฐ รายได้ประจำต่อปีของบริษัทเกิน 200 ล้านดอลลาร์สหรัฐใน

GateNews4 นาที ที่แล้ว

NVIDIA และ MediaTek จับมือกันสร้างผู้ช่วย AI สำหรับยานยนต์ยุคอนาคต

NVIDIA และ MediaTek ร่วมมือกันสร้างสถาปัตยกรรมรถยนต์พร้อม AI แบบกำเนิด โดยฝั่งเอดจ์ให้ DRIVE AGX รับผิดชอบงานด้านความหน่วงต่ำและความเป็นส่วนตัว พร้อมรองรับโมเดล 7B+ ขณะที่คลาวด์ทำหน้าที่เป็นโรงงาน AI เพื่อดำเนินการอนุมานและการฝึกระดับสูง ผ่านการจัดวางแบบพร็อกซีและการแชร์สถานการณ์เพื่อมอบประสบการณ์ผู้ใช้แบบไร้รอยต่อ Dimensity AX จัดการความบันเทิงระดับสูงและ IVI โดย Drive OS ใช้ร่วมกัน ทั้งสองส่วนแลกเปลี่ยนข้อมูลความถี่สูงแบบไร้รอยต่อผ่าน PCIe และ NvStreams API จนเกิดเป็นสถาปัตยกรรมคอมพิวเตอร์ส่วนกลาง

ChainNewsAbmedia21 นาที ที่แล้ว

OpenAI เพิกถอนใบรับรองการลงลายเซ็นสำหรับ macOS ในวันพรุ่งนี้ 8 พฤษภาคม ทำให้แอปที่ล้าสมัยใช้งานไม่ได้

ตามรายงานของ Beating ใบรับรองการลงนาม macOS ของ OpenAI จะถูกเพิกถอนในวันที่ 8 พฤษภาคม ทำให้เวอร์ชันที่ล้าสมัยของ ChatGPT Desktop, Codex, Codex CLI และ Atlas ใช้งานไม่ได้และไม่สามารถรับการอัปเดตได้ ผู้ใช้ที่ใช้ Mac ควรอัปเดตทันทีผ่านการอัปเดตในแอป หรือโดยการดาวน์โหลดจาก Ope

GateNews34 นาที ที่แล้ว

Chrome แอบดาวน์โหลด AI ขนาด 4GB ลบออกแล้วติดตั้งใหม่อีกครั้ง นักวิจัยชี้อาจขัดกฎหมายความเป็นส่วนตัวของสหภาพยุโรป

ตามรายงานของ Decrypt วันที่ 7 พฤษภาคม ระบุว่า Google Chrome ได้ดาวน์โหลดโมเดล AI ของ Gemini Nano จำนวนราว 4GB ไปยังอุปกรณ์ที่เข้าเกณฑ์โดยที่ไม่ได้รับความยินยอมจากผู้ใช้ และทำแบบเงียบๆ Alexander Hanff นักวิจัยด้านความเป็นส่วนตัวพบพฤติกรรมดังกล่าวระหว่างทำการตรวจสอบอัตโนมัติในโปรไฟล์ผู้ใช้ใหม่ โดยระบุว่านี่อาจขัดต่อคำสั่งว่าด้วยความเป็นส่วนตัวทางอิเล็กทรอนิกส์ของสหภาพยุโรป (EU ePrivacy Directive)

MarketWhisper46 นาที ที่แล้ว

เอกสารของศาลเผยว่า Altman เสนอซื้อกิจการ Microsoft เพื่อคงบทบาทตำแหน่ง CEO ในเดือนพฤศจิกายน 2023

ตามเอกสารยื่นต่อศาลที่เผยแพร่เมื่อวันที่ 7 พฤษภาคม เอกสารจากคดี Musk v. Altman เปิดเผยข้อความแชตระหว่าง Sam Altman กับ Mira Murati ซึ่งเป็นอดีต-CTO ในขณะนั้น ตั้งแต่วันที่ 19 พฤศจิกายน 2023 เมื่อบอร์ดของ OpenAI ได้ถอด Altman ออกจากตำแหน่ง CEO อย่างกะทันหัน ระหว่างวิกฤตครั้งนี้ Altman เสนอว่า Microsoft เข้าซื้อ OpenAI เพื่อ

GateNews50 นาที ที่แล้ว

CEX รายใหญ่ เพิ่มการซื้อขายก่อนการเสนอขายหุ้น (Pre-IPO) ของ SpaceX, OpenAI และ Anthropic

ตามรายงาน การแลกเปลี่ยนรวมศูนย์ชั้นนำได้เปิดตัวคู่เทรด SPACEX/USDT, OPENAI/USDT และ ANTHROPIC/USDT สำหรับการเทรดก่อนการเสนอขายหุ้นต่อสาธารณะ (Pre-IPO) ในวันนี้ (7 พฤษภาคม) แพลตฟอร์มดังกล่าวรองรับการเทรดด้วยเลเวอเรจสำหรับตราสารเหล่านี้

GateNews58 นาที ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น