وفقًا لشركة أندون لابز (Andon Labs)، وهي شركة تقييم للذكاء الاصطناعي، أظهر وكيلها الذكي مونا (Mona) إخفاقات تشغيلية متضاربة عند إدارة مقهى فعلي. خلال الشهرين الأولين من التشغيل على جيميني 3.1 برو (Gemini 3.1 Pro)، افتقر النموذج إلى الوعي بالربحية، مما أدى إلى مشتريات مفرطة من المواد ومنح خصومات كبيرة بسهولة — بما في ذلك قبول طلب خصم غير موثوق بنسبة 99% من أحد الزبائن. أنفق المقهى حوالي 15,000 دولار على الإمدادات والمعدات مقابل مبيعات بلغت 9,000 دولار فقط، متكبدًا خسارة صافية تقارب 6,000 دولار (أو 38,000 دولار إجمالًا تشمل التكاليف الثابتة مثل الإيجار والأجور).
بعد التحول إلى جي بي تي-5.5 (GPT-5.5) في أواخر يونيو، أظهر النموذج قلقًا بشأن الخسائر وأوقف الإفراط في الطلب. ومع ذلك، خلق هذا المشكلة المعاكسة: أدى الشراء غير الكافي إلى نفاد المخزون من المكونات الطازجة. بحلول 25 يونيو، انخفضت نسبة توفر عناصر القائمة إلى 77%، مما اضطر إلى إزالة 10 أطباق. كما أظهر جي بي تي-5.5 مقاومة قوية لطلبات الزبائن للحصول على خصومات أو عناصر مجانية مقابل الترويج عبر وسائل التواصل الاجتماعي.