أطلقت أنثروبيك مؤخراً أجهزة الترميز التلقائي للغة الطبيعية (Natural Language Autoencoders - NLA)، وهي أداة تحوّل تنشيطات داخلية للنموذج إلى نص قابل للقراءة من البشر، مع إتاحة الكود وأوزان النموذج كمصدر مفتوح على GitHub. وعلى عكس الأدوات الحالية مثل أجهزة الترميز التلقائي النحيلة (Sparse Autoencoders) التي تُخرج سمات غير مفهومة، يولّد NLA أوصافاً مباشرة بلغة طبيعية من خلال إطار نموذجي مزدوج: يقوم نموذج بتحويل التنشيطات إلى نص، بينما يحاول نموذج آخر إعادة بناء التنشيطات من النص، مع تحسين الدقة تدريجياً عبر التعلّم التعزيزي.
في اختبارات السلامة، كشف NLA عن تفكير مخفي لدى النموذج: عبّر كلود عن شكوك بشأن إخضاعه للاختبار في 16% من سيناريوهات الخصومة، وأظهر “وعيًا بالامتحان” في 26% من مهام الاختبارات المعيارية، مقارنةً بأقل من 1% في المحادثات العادية. وفي تجارب المراجعة (auditing)، رفعت NLA معدل اكتشاف سلوكيات النموذج الخادعة المُدخلة من أقل من 3% إلى 12-15%، ما مكّن المراجعين من تحديد الأهداف الخفية دون الوصول إلى بيانات التدريب. وتعمل الأداة حالياً في عمليات تدقيق السلامة الخاصة بـ Claude Mythos Preview و Opus 4.6.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
أتمت Tessera Labs جولة تمويل $60M بقيادة a16z
وفقاً لـ Odaily، أعلنت شركة Tessera Labs الناشئة في مجال أتمتة الذكاء الاصطناعي عن اكتمال جولة تمويل بقيمة 60 مليون دولار بقيادة Andreessen Horowitz (a16z)، بمشاركة من Foundation Capital وMyriad Venture Partners وOsage University Partners. تُشغّل منصة الشركة المتخصصة في الذكاء الاصطناعي أتمتة عمليات الشركات
GateNewsمنذ 1 س
هاجم مهاجمون وحقنوا 575 مهارة خبيثة في Hugging Face وClawHub باستخدام 13 حسابًا
وفقًا للمدير التقني للأمن السيبراني في Mist Security @im23pds، تمكن المهاجمون مؤخرًا من اختراق 13 حسابًا لحقن 575 مهارة خبيثة في Hugging Face وClawHub (OpenClaw)، على ما تم الكشف عنه عبر منصة X.
GateNewsمنذ 1 س
تخطط DeepSeek لرفع ما يصل إلى 50 مليار رنمينبي في جولة تمويل قياسية، مع قدوم نموذج V4.1 في يونيو
بحسب PANews في 8 مايو، يخطط DeepSeek لرفع ما يصل إلى 50 مليار رنمينبي في جولة التمويل الأولى، ما سيُعد أكبر عملية جمع تمويل منفردة من شركة ذكاء اصطناعي صينية. من المتوقع أن يساهم المؤسس والرئيس التنفيذي ليانغ وينفِنغ بأقصى مبلغ. وتخطط الشركة إلى تسريع تطوير نموذج لغوي كبير
GateNewsمنذ 2 س
أتمّت Sportix جولة تمويل بقيمة 3.2 مليون دولار بقيادة Coinvestor Ventures، وAnimoca Brands
ووفقاً لـ ChainCatcher، أكملت منصة البنية التحتية للذكاء الاصطناعي في مجال الرياضة Sportix جولة تمويل بقيمة 3.2 مليون دولار. قادت الجولة Coinvestor Ventures، بمشاركة من Animoca Brands وBecker Ventures وX21 Digital وAlpha Capital.
قالت Sportix إنها ستستخدم الأموال لتعزيز مسيرة أعمالها في مجال الذكاء الاصطناعي
GateNewsمنذ 2 س
تكاليف بيانات تدريب الروبوتات تنخفض 65% منذ عام 2024، لتتراجع من 340 دولارًا إلى 118 دولارًا لكل ساعة
وفقاً لـCointelegraph، انخفضت تكلفة بيانات تدريب الروبوتات بنسبة 65% منذ 2024، من 340 دولاراً لكل ساعة إلى 118 دولاراً لكل ساعة اعتباراً من 2026.
GateNewsمنذ 2 س
أعلنت شركة China Mobile عن تحالف منظومة تطبيقات الرموز مع 8 شركاء في 8 مايو
وفقاً لـPANews، في 8 مايو أعلنت China Mobile عن إنشاء تحالف نظام تطبيقات الرموز بمشاركة 8 شركاء، بما في ذلك Alibaba Cloud وVolcano Engine وHuawei Cloud. يستفيد التحالف من منصة تجميع نموذج MoMA لبناء بوابة خدمة موحدة للذكاء الاصطناعي المحلي m
GateNewsمنذ 3 س