Gate News消息,4月24日——DeepSeek的V4技术报告显示,V4-Flash和V4-Pro分别在32T和33T tokens上进行了预训练,相当于用于V3的约15T tokens的两倍。该报告承认在训练过程中遇到了“显著的不稳定性挑战”,并且由于Mixture-of-Experts (MoE)层中的异常,loss多次反复出现尖峰;路由机制本身会加剧这些异常,而简单的回滚无法解决该问题。
DeepSeek目前已在实际训练中应用两项解决方案:先行路由(Anticipatory Routing),将路由索引计算与主干网络更新解耦,并且仅在检测到loss尖峰时自动触发 (adding approximately 20% overhead);以及SwiGLU钳制(SwiGLU Clamping),通过将激活值直接钳制到固定范围内来抑制异常。该报告称这两种方法都有效,但也承认“底层原理仍未被充分理解”。
Susan Zhang,谷歌DeepMind研究员,曾在Meta AI和OpenAI工作,她评论称,由于训练数据翻倍触发的不稳定性“解释了延迟”。她将这两项解决方案描述为“补丁”,同时也承认DeepSeek的技术透明度。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
شركة ناشئة في مجال تصميم المباني بالذكاء الاصطناعي، Illoca، تجمع تمويلاً بقيمة 13 مليون دولار، كيف يعيد المؤسس التايواني الإبداع إلى المهندسين المعماريين؟
أعلنت شركة Illoca، وهي شركة ناشئة أمريكية لتصميم هندسي تعتمد الذكاء الاصطناعي ومقرها أسسها مؤسسان من أصول تايوانية، في 6 مايو 2026 عن إتمام جولة تمويل أولي بقيمة 13 مليون دولار، بقيادة Bessemer Venture Partners، مع مشاركة AIX Ventures وRoot Ventures وAlt Ventures. تتموضع Illoca حول “محرك تصميم أصلي للذكاء الاصطناعي”، وتهدف إلى إعادة زمام عملية الإبداع إلى المهندسين المعماريين، لمعالجة فجوة الإنتاجية التي ابتلي بها القطاع منذ عقود.
(Claude
ChainNewsAbmediaمنذ 4 د
تعمل Google وNaver على دفع الإعلانات إلى أدوات البحث بالذكاء الاصطناعي؛ ارتفاع إيرادات Naver في الربع الأول بنسبة 16.3% إلى 2.22 مليار دولار
وفقاً لصحيفة The Korea Times، ينقل كل من Google وNaver الإعلانات إلى أدوات بحث بالذكاء الاصطناعي مع إعادة تشكيل الذكاء الاصطناعي التوليدي لسلوك البحث ورفع تكاليف الحوسبة. تشير Google إلى انفتاحها على الإعلانات داخل Gemini، بينما يعتزم Naver اختبار إعلانات بأسلوب الإجابات ضمن منتج AI Briefing في الربع الثاني.
Naver
GateNewsمنذ 17 د
توقف سامسونغ مبيعات الأجهزة المنزلية في الصين تمهيداً لتحولها نحو الذكاء الاصطناعي
أعلنت شركة سامسونغ للإلكترونيات في 6 مايو أنها ستوقف بيع الأجهزة المنزلية في البر الرئيسي للصين، وفقاً لصحيفة ساوث تشاينا مورنينغ بوست. ويشمل الانسحاب أجهزة التلفزيون والثلاجات ومكيفات الهواء والغسالات ومجففات الملابس وأجهزة التنظيف بالمكنسة الكهربائية وأجهزة تنقية الهواء، في ظل قيام الشركة بتحويل تركيزها الاستراتيجي إلى
CryptoFrontierمنذ 17 د
ريد هوفمان: ستحتاج وكلاء الذكاء الاصطناعي إلى أنظمة ثقة مبنية على التشفير
صرّح ريد هوفمان، الشريك في شركة Greylock والمؤسس المشارك لمنصة LinkedIn، بأن الوكلاء الذاتيّين سيحتاجون إلى نظم ثقة قائمة على التشفير لإجراء المعاملات عبر الإنترنت المفتوح، مشيراً إلى أن هذا التطور قد يتيح عودة محتملة للـNFTs.
يربط تصريح هوفمان ظهور الوكلاء الذاتيّين بـ
CryptoFrontierمنذ 18 د
قفزت أسهم SoftBank بنسبة 16.5% مع تعزيز موجة صعود رقائق الذكاء الاصطناعي للأسواق اليابانية في 7 مايو
وبحسب CNBC، ارتفعت مجموعة SoftBank Group بنسبة 16.5% في 7 مايو بعد إعادة فتح أسواق اليابان من عطلة Golden Week. جاءت هذه المكاسب بينما سعى المستثمرون وراء موجة صعود عالمية في أسهم الذكاء الاصطناعي والشرائح، ما دفع مؤشر Nikkei 225 إلى مستوى قياسي جديد. وارتفع Advantest بنسبة 7.8%، وارتفعت Tokyo Electron بنسبة 9.2%، وارتفعت Renesas
GateNewsمنذ 37 د
المدير التنفيذي لـ Anthropic يؤكد شخصيًا نمو الربع الأول بمقدار 80 ضعفًا: شرح سبب الاستحواذ على كامل قدرات الحوسبة لدى SpaceX
صرّح الرئيس التنفيذي لشركة Anthropic، Dario Amodei، في مؤتمر Code with Claude، بأن توقعات إيرادات الربع الأول السنوية واستخدامه كانت تنطوي على نمو بمقدار 10 أضعاف، لكنها في الواقع بلغت 80 ضعفًا؛ وقال إنها «مجنونة، وصعبة للغاية على المواكبة»، لكنه سيسارع في توفير المزيد من القدرة الحاسوبية وتخفيف حدود الاستخدام للمستخدمين. كما أعلن في اليوم نفسه عن الحصول على كامل القدرة الحاسوبية لمنظومة SpaceX Colossus 1 (بحوالي 300+ ميغاواط و220 ألف وحدة معالجة GPU من إنفيديا)، مع توقع تشغيلها خلال شهر واحد، كخلفية تجارية وراء هذا النمو. لم يتم الكشف بعد عن المبالغ المحددة، وسيتم تأكيد الأرقام في التقارير المالية اللاحقة.
ChainNewsAbmediaمنذ 43 د