ข้อความจาก Gate News วันที่ 24 เมษายน — DeepSeek V4 ได้เผยแพร่ผลการประเมินการให้เหตุผลทางคณิตศาสตร์อย่างเป็นทางการ โดยทำคะแนนสมบูรณ์แบบ 120/120 บน Putnam-2025 เสมอกับ Axiom สำหรับอันดับที่หนึ่ง
ในโหมดปฏิบัติการที่ใช้ LeanExplore และการสุ่มแบบมีข้อจำกัด V4-Flash-Max ได้คะแนน 81.00 ในเกณฑ์มาตรฐาน Putnam-200 Pass@8 ซึ่งเหนือกว่า Seed-2.0-Prover (35.50) อย่างมีนัยสำคัญ, Gemini 3 Pro (26.50), และ Seed-1.5-Prover (26.50) ผลลัพธ์ในโหมดแนวหน้าแสดงให้เห็นว่า V4 นำหน้า Seed-1.5-Prover (110/120) และ Aristotle (100/120).
V4 ใช้วิธีการให้เหตุผลแบบผสมผสานระหว่างแบบไม่เป็นทางการและแบบเป็นทางการ: การให้เหตุผลแบบไม่เป็นทางการสร้างวิธีแก้ปัญหาในรูปภาษาธรรมชาติที่เป็นผู้สมัคร, การตรวจสอบตนเองคัดกรองผลลัพธ์, และเอเจนต์แบบเป็นทางการทำการพิสูจน์อย่างเข้มงวดใน Lean ผลลัพธ์ในโหมดแนวหน้าใช้การขยายการคำนวณขนาดใหญ่ ในขณะที่คะแนนในโหมดปฏิบัติการสะท้อนขีดความสามารถในการใช้งานจริงมาตรฐานได้ดีกว่า
btc.bar.articles
รายงานผลประกอบการ Arm ดีกว่าคาด โดยซีอีโอเตือนว่าตลาดสมาร์ทโฟนยังซบเซา พร้อมเปิดตัว “AGI CPU” เพื่อขยายส่วนแบ่งในตลาด AI
Arm เปิดเผยผลประกอบการ เผยกำลังเปลี่ยนผ่านจากอุปกรณ์มือถือไปสู่ดาต้าเซ็นเตอร์สำหรับ AI โดยไตรมาส 4 มีรายได้ 1.49 พันล้านดอลลาร์ เพิ่มขึ้น 20% YoY, EPS 0.60; ค่าลิขสิทธิ์ 671 ล้านดอลลาร์ ต่ำกว่าที่คาดไว้ หุ้นอ่อนแรงในช่วงหลังปิดตลาด โดยคาดการณ์ไตรมาสถัดไปรายได้ 1.26 พันล้านดอลลาร์ และ EPS 0.40 ตลาดมือถือยังซบเซา ทำให้ Arm จะย้ายโฟกัสไปที่ยานยนต์ ระบบ IoT และโครงสร้างพื้นฐานคลาวด์ พร้อมเปิดตัว AGI CPU คาดว่าจะสร้างรายได้มากกว่า 200 ล้านดอลลาร์ในช่วงปี 2027–2028 ขณะที่ SoftBank ถือหุ้นราว 90% เพื่อผลักดันความร่วมมือและการวางรากฐานระบบนิเวศด้าน AI
ChainNewsAbmedia5 นาที ที่แล้ว
ผู้รับผิดชอบ Claude Code Boris: เอเจนต์ AI ยกระดับประสิทธิผลของมนุษย์ เปลี่ยนโฉมประวัติศาสตร์การพัฒนาซอฟต์แวร์
ผู้รับผิดชอบ Claude Code อย่าง Boris Cherny ในการให้สัมภาษณ์กับ CNBC ระบุว่าเครื่องมือเอเจนต์ AI เช่น Co-Work สามารถมอบงานที่ยุ่งยากให้ AI จัดการได้ ทำให้วิศวกรจากผู้ลงมือปฏิบัติกลายเป็นผู้คอยชี้นำ สามารถสั่งงานเอเจนต์หลายตัวเพื่อทำการดีบักพร้อมกันได้ ซึ่งช่วยเพิ่มผลผลิตอย่างมีนัยสำคัญ องค์กรจำเป็นต้องปรับโครงสร้างกระบวนการโดยให้ AI เป็นแกนกลาง โดย AI แสดงให้เห็นคุณค่าในทุกอุตสาหกรรม การพัฒนาซอฟต์แวร์จะเปลี่ยนจากการเขียนโค้ดไปสู่การทำงานร่วมกันที่ใช้ตรรกะและการชี้นำผ่านการสนทนา ลดระดับเกณฑ์ด้านเทคโนโลยี และจะเกิดการเติบโตแบบก้าวกระโดดของนวัตกรรมและการเริ่มต้นธุรกิจใหม่
ChainNewsAbmedia14 นาที ที่แล้ว
Reid Hoffman: NFTs อาจกลับมาอีกครั้งเมื่อ AI Agents จำเป็นต้องใช้ความเชื่อถือด้านคริปโท
เรด ฮอฟฟ์แมน พาร์ทเนอร์ของ Greylock และผู้ร่วมก่อตั้ง LinkedIn กล่าวว่า เอเจนต์อัตโนมัติจะต้องมีระบบความน่าเชื่อถือที่ใช้คริปโทเพื่อทำธุรกรรมข้ามอินเทอร์เน็ตสาธารณะ โดยเขาแนะนำว่า NFT อาจกลับมาอีกครั้ง จากคำกล่าวของเขา
เอเจนต์ AI และโครงสร้างพื้นฐานด้านความน่าเชื่อถือ
คำพูดของฮอฟฟ์แมนชี้ไปที่ความเป็นไปได้
CryptoFrontier1 ชั่วโมง ที่แล้ว
Scale AI ได้รับสัญญา $500M จากเพนตากอนสำหรับการประมวลผลข้อมูล AI
ตามรายงานของ ChainCatcher กระทรวงกลาโหมสหรัฐได้มอบสัญญามูลค่า 500 ล้านดอลลาร์สหรัฐให้กับ Scale AI ซึ่งได้รับการสนับสนุนโดย Meta Platforms เพื่อช่วยประมวลผลข้อมูลและสนับสนุนการตัดสินใจทางทหาร โดยมูลค่ารางวัลดังกล่าวสูงกว่าสัญญา 100 ล้านดอลลาร์สหรัฐที่บริษัทซึ่งตั้งอยู่ในซานฟรานซิสโกได้รับใน
GateNews2 ชั่วโมง ที่แล้ว
xAI ของ Elon Musk จะปรับแบรนด์เป็น SpaceXAI เนื่องจากสถานะบริษัทอิสระสิ้นสุดลง
ตามรายงานของ Odaily อีลอน มัสก์ประกาศว่า xAI จะถูกรีแบรนด์เป็น SpaceXAI เนื่องจากบริษัทจะไม่ดำเนินงานในฐานะองค์กรอิสระอีกต่อไป
GateNews2 ชั่วโมง ที่แล้ว
IBM ขยายชุดซอฟต์แวร์ AI สำหรับองค์กรด้วยเครื่องมือใหม่แบบเอเจนต์ในงาน Think 2026
ตามที่ IBM ระบุ บริษัทได้ประกาศการขยายขีดความสามารถด้าน AI สำหรับองค์กรที่งาน Think 2026 ในบอสตัน โดยเปิดตัวเครื่องมือใหม่แบบใช้เอเจนต์เพื่อช่วยให้องค์กรนำปัญญาประดิษฐ์ไปผนวกเข้ากับการปฏิบัติงานประจำวัน Context Studio ซึ่งขณะนี้พร้อมใช้งานทั่วไป ช่วยให้องค์กร
GateNews2 ชั่วโมง ที่แล้ว