Google เปิดตัว Gemini Robotics ER 1.6: โมเดลหุ่นยนต์ SOTA ที่เชี่ยวชาญด้านการรับรู้ด้วยภาพและการให้เหตุผลเชิงพื้นที่

ChainNewsAbmedia

Google DeepMind ได้นำเสนอโมเดลพื้นฐานสำหรับหุ่นยนต์รุ่นใหม่อย่าง Gemini Robotics ER 1.6 ซึ่ง ER ย่อมาจาก Embodied Reasoning (การให้เหตุผลแบบมีร่างกาย) โมเดลนี้ทำผลงานได้ดีที่สุดในปัจจุบัน (SOTA) ในด้านการให้เหตุผลเชิงการมองเห็นและเชิงพื้นที่ และได้เปิดให้ใช้งานผ่าน Gemini API แล้ว หัวหน้าฝ่ายความสัมพันธ์กับนักพัฒนา AI ของ Google อย่าง Logan Kilpatrick ได้ประกาศข่าวนี้บนโซเชียลมีเดีย (ที่มา)

อะไรคือ Embodied Reasoning?

Embodied Reasoning หมายถึงความสามารถของโมเดล AI ในการทำความเข้าใจและให้เหตุผลเกี่ยวกับโลกทางกายภาพ ต่างจากโมเดลภาษาทั่วไป โมเดลที่ให้เหตุผลแบบมีร่างกายจำเป็นต้องจัดการกับตำแหน่ง วัตถุในมิติสาม มิติ รูปร่าง วัสดุ และความสัมพันธ์ในการโต้ตอบเชิงฟิสิกส์ โมเดล Gemini Robotics ER 1.6 ได้รับการปรับให้เหมาะสมโดยเฉพาะสำหรับงานประเภทนี้ เพื่อให้หุ่นยนต์สามารถเข้าใจสภาพแวดล้อมรอบตัวได้แม่นยำยิ่งขึ้นและตัดสินใจเลือกการกระทำได้อย่างเหมาะสม

ความสามารถหลัก

ข้อได้เปรียบหลักของ Gemini Robotics ER 1.6 กระจุกตัวอยู่ที่สองด้าน:

ความสามารถ คำอธิบาย การให้เหตุผลเชิงการมองเห็น สามารถระบุวัตถุจากภาพและวิดีโอ เข้าใจโครงสร้างของฉาก และตัดสินใจตามนั้น การให้เหตุผลเชิงพื้นที่ เข้าใจตำแหน่งสัมพันธ์ ระยะทาง และทิศทางของวัตถุในพื้นที่มิติสาม สนับสนุนการวางแผนการปฏิบัติการที่ซับซ้อน

การผสานความสามารถทั้งสองนี้ทำให้หุ่นยนต์สามารถรับมือกับงานในโลกแห่งความเป็นจริงที่ซับซ้อนได้มากขึ้น ตัวอย่างเช่น ในสภาพแวดล้อมคลังสินค้า หุ่นยนต์จำเป็นต้องระบุวัตถุที่มีรูปร่างต่างกันพร้อมกัน และคำนวณมุมการหยิบจับและตำแหน่งการวางที่เหมาะที่สุด — นี่คือสถานการณ์ที่ Gemini Robotics ER 1.6 ทำได้ดีเป็นพิเศษ

การใช้งานผ่าน Gemini API

ต่างจากโมเดลหุ่นยนต์จำนวนมากในอดีตที่ยังคงอยู่ในขั้นของงานวิจัย Gemini Robotics ER 1.6 ได้ให้การเข้าถึงผ่าน Gemini API แล้ว นั่นหมายความว่านักพัฒนาและผู้ผลิตฮาร์ดแวร์สามารถนำโมเดลนี้ไปผสานเข้ากับระบบหุ่นยนต์ของตนได้โดยตรง โดยไม่จำเป็นต้องฝึกโมเดลตั้งแต่เริ่มต้น

การเปิด API ยังช่วยลดเกณฑ์ในการพัฒนา AI สำหรับหุ่นยนต์ ในอดีต การพัฒนาระบบหุ่นยนต์ที่มีความสามารถด้านการให้เหตุผลเชิงการมองเห็นและเชิงพื้นที่ต้องอาศัยการเก็บรวบรวมข้อมูลจำนวนมากและงานฝึกโมเดล ปัจจุบัน นักพัฒนาสามารถโฟกัสกับการพัฒนาด้านการออกแบบฮาร์ดแวร์และการใช้งานในสถานการณ์จริง โดยปล่อยความสามารถด้านการให้เหตุผลระดับล่างให้ Gemini Robotics ER 1.6 เป็นผู้จัดการ

แผนผัง AI หุ่นยนต์ของ Google

Gemini Robotics ER 1.6 คือผลงานล่าสุดของ Google DeepMind ในด้านหุ่นยนต์ ตั้งแต่ RT-2 ในช่วงแรกจนถึงปัจจุบันที่เป็นตระกูล Gemini Robotics Google ยังคงขยายขีดความสามารถของโมเดลภาษาขนาดใหญ่มาสู่การโต้ตอบกับโลกทางกายภาพ เวอร์ชัน ER 1.6 ยกระดับความแม่นยำในการให้เหตุผลจากเวอร์ชันก่อนหน้าให้ดียิ่งขึ้น โดยเฉพาะในสถานการณ์ที่ต้องใช้การปฏิบัติอย่างละเอียด ซึ่งทำได้โดดเด่นมาก

เมื่ออุตสาหกรรมหุ่นยนต์เข้าสู่ช่วงเติบโตระลอกใหม่ โมเดลพื้นฐานที่มีความสามารถด้านการให้เหตุผลเชิงการมองเห็นและเชิงพื้นที่อย่างแข็งแกร่งจะกลายเป็นโครงสร้างพื้นฐานสำคัญ หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับการพัฒนาของระบบนิเวศ Gemini สามารถดูได้จากคู่มือฉบับสมบูรณ์ของ Gemini

บทความนี้ Google เปิดตัว Gemini Robotics ER 1.6:โมเดลหุ่นยนต์ SOTA เชี่ยวชาญด้านการให้เหตุผลเชิงการมองเห็นและเชิงพื้นที่ ปรากฏครั้งแรกบน 鏈新聞 ABMedia

news.article.disclaimer

btc.bar.articles

OpenClaw ปล่อย v2026.5.2 พร้อมการย้ายปลั๊กอินจาก npm ไปยัง ClawHub และแก้ไขบั๊กมากกว่า 200 รายการ

ตามที่ Beating ระบุ ผู้ช่วย AI ส่วนบุคคลแบบโอเพนซอร์ส OpenClaw เปิดตัวเวอร์ชัน v2026.5.2 ในวันที่ 3 พฤษภาคม ถือเป็นการอัปเดตบำรุงรักษาด้านวิศวกรรมครั้งใหญ่ การเปลี่ยนแปลงหลักคือการย้ายระบบปลั๊กอินจาก npm ไปยังแพลตฟอร์มการจัดจำหน่ายที่ ClawHub สร้างขึ้นเอง การอัปเดตนี้มีการแก้ไขบั๊กมากกว่า 200 รายการ และเพิ่ม t

GateNews16 นาที ที่แล้ว

บาวแมน กรรมการเฟด: หน่วยงานกำกับดูแลต้องพิจารณาว่าจะรับมือกับเทคโนโลยีใหม่อย่าง Anthropic Mythos อย่างไร

PANews 2 พฤษภาคม รายงานว่า บรรดากรรมการของธนาคารกลางสหรัฐ (Fed) อย่างบาวแมน กล่าวว่า หน่วยงานกำกับดูแลต้องพิจารณาว่าจะกำกับดูแลเทคโนโลยีใหม่อย่าง Mythos ของ Anthropic ได้อย่างเหมาะสมที่สุดอย่างไร “ในแง่หนึ่ง ความสามารถดังกล่าวทำให้บริษัทสามารถจัดการช่องโหว่ที่ตนระบุเองได้ ซึ่งช่วยเสริมความปลอดภัยทางไซเบอร์” บาวแมนกล่าว “แต่ในอีกแง่หนึ่ง หากถูกใช้โดยเจตนาร้าย ก็อาจถูกใช้เพื่อระบุและหาประโยชน์จากจุดอ่อน” ขณะที่ Anthropic กำลังประเมินมาตรการป้องกันสำหรับเทคโนโลยีใหม่นี้ที่ทรงพลัง ได้จำกัดการเปิดตัวโมเดล AI ล่าสุดของตน โมเดลดังกล่าวยังทำให้เจ้าหน้าที่ฝ่ายรัฐบาลของทรัมป์เริ่มพิจารณาความเป็นไปได้ของการโจมตีทางไซเบอร์ที่อาจก่อให้เกิดภัยคุกคามต่อเสถียรภาพทางการเงิน

GateNews43 นาที ที่แล้ว

ศาลหางโจวสั่งห้ามการเลิกจ้างเฉพาะด้วย AI สนับสนุนลูกจ้าง หลังถูกลดค่าจ้าง 40% เมื่อวันที่ 28 เมษายน

ตามรายงานของ Bloomberg เมื่อวันที่ 28 เมษายน ศาลประชาชนระหว่างเมืองหางโจวได้มีคำตัดสินว่า นายจ้างไม่สามารถไล่คนงานออกหรือหักค่าจ้างเพียงเพราะว่า AI ได้ทำให้งานของพวกเขาเป็นอัตโนมัติ ศาลสนับสนุนการชดเชยให้กับลูกจ้างรายหนึ่งที่ค่าจ้างถูกลดลง 40% และถูกเลิกจ้าง หลังจากปฏิเสธการย้ายตำแหน่งเมื่อ AI

GateNews54 นาที ที่แล้ว

ศาลจีนมีคำพิพากษาใหม่ล่าสุด: เหตุผลทางกฎหมายที่ทำให้การทำงานอัตโนมัติด้วย AI ไม่ถือเป็นการเลิกจ้าง

ศาลในหางโจวมีคำพิพากษาล่าสุด ระบุว่า การที่บริษัทเลิกจ้าง ลดตำแหน่ง หรือปรับลดเงินเดือนลงอย่างมาก โดยอ้างเหตุการนำเทคโนโลยีอย่าง AI มาใช้ ถือเป็นการกระทำที่ผิดกฎหมาย และความก้าวหน้าของเทคโนโลยีเพียงอย่างเดียวไม่ได้เท่ากับการเลิกจ้างตามที่กฎหมายกำหนด ในคดีนี้ พนักงานถูกลดตำแหน่งเนื่องจากระบบอัตโนมัติและเผชิญการลดเงินเดือนสูงถึง 40% ศาลในที่สุดสนับสนุนการชดเชยให้กับพนักงาน ซึ่งสะท้อนให้เห็นว่า ในขณะที่ผลักดันระบบอัตโนมัติต้องดำเนินการให้เป็นไปตามกฎหมาย พร้อมทั้งจัดการเปลี่ยนบทบาทงานและการฝึกอบรม/ยกระดับทักษะใหม่อย่างเหมาะสม

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

Hoskinson พูดถึงบทบาทของ Midnight ในระบบนิเวศของ Cardano บน The Breakdown

Charles Hoskinson ผู้ก่อตั้ง Cardano และผู้ร่วมก่อตั้ง Ethereum ปรากฏตัวเป็นแขกรับเชิญในตอนที่ 701 ของพอดแคสต์ “The Breakdown” ที่ดำเนินรายการโดย David Gokhshtein เพื่อพูดคุยเกี่ยวกับโปรเจกต์ Midnight ความท้าทายด้านประสบการณ์ผู้ใช้ในวงการคริปโต และวิสัยทัศน์ของเขาสำหรับอนาคตของบล็อกเชน ระหว่างการสัมภาษณ์ Hoskinson

CryptoFrontier8 ชั่วโมง ที่แล้ว

Berkshire Energy มองโอกาสการเติบโตจากความต้องการพลังงานที่ขับเคลื่อนด้วย AI

ตามรายงานของ Beating ในการประชุมผู้ถือหุ้นของ Berkshire ซีอีโอ Abel ได้เน้นย้ำว่า ความต้องการไฟฟ้าที่ขับเคลื่อนด้วย AI กำลังสร้างโอกาสการเติบโตใหม่ๆ สำหรับธุรกิจพลังงานของบริษัท โดยสาธารณูปโภคด้านพลังงานของบริษัทอยู่แล้วครึ่งหนึ่งที่รองรับความต้องการไฟฟ้าที่เกี่ยวข้องกับ AI ในไอโอวา ศูนย์ข้อมูลตอนนี้ได้คิดบัญชี

GateNews11 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น