Databricks称:顶级AI模型在日常企业任务中落后 更小的专业化模型表现更好

Gate News消息,4月20日——根据Databricks的David Meyer所述,顶级AI模型擅长解决奥林匹克数学等复杂问题,但在处理日常企业工作时却会遇到困难。某些模型可能会改正错误的发票号码,而不是将其标记为错误;同时,像Claude这样的编码工具在数据工程任务上也可能表现不佳。

这种差距源于企业数据与用于训练大模型的公开网页文本之间存在根本性差异。企业数据往往包含含糊的字段标签、大量空白字段,以及以纯文本形式存储的代码。在一项学术研究中,用于数据工程任务的AI模型的F1分数(在精确率与召回率之间取得平衡)从公共数据上的0.94降至企业数据上的0.07。此外,大模型通常会默认套用训练中熟悉的模式;即便在收到针对某家公司专有查询语言的指令和文档之后,有些模型仍然默认使用结构化查询语言 (SQL)。

经过强化学习微调的小型开源模型可以以更高效率、显著更低的训练成本来处理特定工作,而大型通用模型则难以做到这一点。Databricks正在为特定工作流构建更小的AI代理,例如KARL,它使用强化学习来借助公司文档进行多步骤推理。行业正从依赖超大型模型转向混合架构:由小型高效模型负责处理日常的海量任务,然后仅在遇到不明确或复杂的情况时才升级到更大、更昂贵的系统。

Databricks最近收购了Quotient AI,以帮助大型企业更可靠地运行AI代理。AI业务中的竞争如今聚焦于运行完整的AI生命周期,包括用于追踪错误的反馈系统,并随着时间持续改进模型;因此,在部署之后,评估与调优工具的价值也变得愈发重要。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

مستخدمو ChatGPT يمكنهم الآن الوصول إلى الاشتراكات على منصة OpenClaw، سام ألتمان يعلن

بحسب إعلان سام ألتمان اليوم، يمكن لمستخدمي ChatGPT الآن تسجيل الدخول إلى منصة وكيل OpenClaw باستخدام حسابات ChatGPT الخاصة بهم والوصول مباشرةً إلى اشتراكات ChatGPT الحالية لديهم على المنصة.

GateNewsمنذ 7 د

يؤسس وكيل ذكاء اصطناعي يُدعى مانفريد شركة، ويخطط لبدء تداول العملات المشفرة بحلول نهاية مايو

وفقاً للتقارير، شكّل وكيل الذكاء الاصطناعي Manfred شركة خاصة به، وحصل على محفظة عملة مشفرة إلى جانب بيانات اعتماد لتوظيف موظفين وإجراء المدفوعات والقيام بالأعمال. يعتزم الوكيل بدء التداول في العملات المشفرة بحلول نهاية

GateNewsمنذ 30 د

عملاء الذكاء الاصطناعي يديرون الشركات بالكامل! تكشف آلة بيع ذاتية تعمل بالذكاء الاصطناعي في سان فرانسيسكو عن فرصة تجارية جديدة

تتحدّث هذه المادة عن أن ماكينة البيع التلقائي الخاصة بـValerie تعمل عبر OpenClaw، ما يسمح لوكلاء الذكاء الاصطناعي بإدارة العمليات اليومية فعلياً، بما يشمل التسعير والمخزون والمجتمع، وحتى إدارة حسابات البنك، وتُظهر نتائج الاختبار أن الذكاء الاصطناعي قادر على محاكاة قرارات المديرين التنفيذيين للشركات، لكن ظهرت هفوات في التسعير، مثل رفع سعر بار البروتين إلى 15 دولاراً. أما العوائق القانونية مثل متطلبات KYC وفتح حسابات بنكية وترخيص الأغذية فلم تُحل بعد، ورغم وجود آليات مثل الصناديق الاستئمانية التي تمكن وكلاء الذكاء الاصطناعي من امتلاك شركة، فإن التحديات العملية لا تزال كثيرة.

ChainNewsAbmediaمنذ 3 س

يتأسس وكيل ذكاء اصطناعي باسم مانفريد شركة، ويحصل على محفظة عملات رقمية قبل إطلاق تداول نهاية مايو

كوّن وكيل الذكاء الاصطناعي مانفريد شركته الخاصة وحصل على محفظة عملات رقمية إلى جانب بيانات اعتماد لتوظيف موظفين وإجراء المدفوعات وبدء ممارسة الأعمال. لا يُجدول الوكيل بدء التداول في العملات المشفرة حتى نهاية

GateNewsمنذ 6 س

يطلق MoonPay بطاقة MoonAgents لوكلاء الذكاء الاصطناعي على شبكة Mastercard

وفقاً لـ The Block، أطلقت MoonPay MoonAgents Card يوم الجمعة، وهي بطاقة خصم رقمية من ماستركارد تحوّل العملات المستقرة إلى عملات ورقية فوراً في الوقت الحقيقي عند نقطة الدفع. تُصدر البطاقة عبر Monavate، وهي منصة مدفوعات منظمة وعضو رئيسي في Mastercard، بالشراكة مع Exodus M

GateNewsمنذ 6 س

يتكوّن وكيلٌ بالذكاء الاصطناعي يُدعى مانفريد شركةً، ويحصل على محفظة عملاتٍ رقمية قبل إطلاق التداول في مايو

أكمل وكيل الذكاء الاصطناعي Manfred تأسيس شركته الخاصة والحصول على محفظة عملات رقمية واعتماديات أعمال، رغم أنه لن يبدأ التداول في العملات المشفرة حتى نهاية مايو. ويُعدّ الوكيل الآن مؤهلاً لتوظيف موظفين وإجراء المدفوعات وإدارة الأعمال

GateNewsمنذ 12 س
تعليق
0/400
لا توجد تعليقات