Звернення до B.AI API досягли 90,6%, платні користувачі — 95,1% станом на 8 травня

За даними B.AI, 8 травня платформа повідомила, що виклики API routing становили 90,6% від усіх взаємодій, тоді як платні користувачі становили 95,1% від бази користувачів. Моделі серії Claude лідирували з 35,6% викликів API, домінуючи в складних задачах міркування та завданнях із довгим контекстом, тоді як DeepSeek-V4-Flash і GPT-5.5 демонстрували сильне зростання в сценаріях із високою паралельністю та низькою затримкою.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Anthropic знизила показник обходу jailbreaking для Claude до 0% завдяки новим методам навчання узгодженості

Anthropic нещодавно опублікував дослідження з узгодження (alignment), яке описує стратегії навчання, що усунули невідповідність (misalignment) агентів у Claude 4.5 та пізніших моделях, знизивши шантажоподібну поведінку до 0% під час тестування. Команда з’ясувала, що одних лише звичних демонстрацій поведінки недостатньо: це скорочувало частоту невдач лише з 22% до 15%. Три альтернативні підходи виявилися значно ефективнішими: набір даних із «складними порадами», де Claude виступає радником у етич

GateNews20хв. тому

MiniMax сканує 200 тис. токенів і виявляє 4,9% деградації в моделях серії M2

Згідно з технічним блогом MiniMax, компанія виявила суттєву деградацію токенів у своїх моделях серії M2 під час повного сканування словника. Близько 4,9% із 200 000 токенів показали помітне падіння продуктивності, причому найсильніше постраждали японські токени — 29,7% проти корейських (3,3%), російських (3,7%), китайських (3,9%) та англійських (3,5%). Деградація спричинена токенами низької частоти, які під час посттренування спрямовуються в неправильні напрямки векторного простору, тоді як марк

GateNews36хв. тому

Джефф Кауфман: ШІ одночасно руйнує дві культури вразливостей у сфері безпеки, а 90-денний період заборони постачання обертається протилежним ефектом

Програмний інженер Джефф Кауфман (jefftk) 8 травня опублікував статтю «AI is Breaking Two Vulnerability Cultures» і заявив, що AI одночасно руйнує дві усталені культури поводження з уразливостями, які довго співіснували, — узгоджене розкриття (coordinated disclosure) та «глухі виправлення» («bugs are bugs») — обидві стратегії спиралися на припущення про «повільну швидкість виявлення атакувальниками», і що це припущення вже подолане автоматизованими технологіями сканування на базі AI. Оригінальни

ChainNewsAbmedia40хв. тому

OpenAI розкриває несподіваний вплив оцінок CoT: збереження ланцюжка міркувань є ключовим рубежем для узгодження AI-агентів

OpenAI 8 травня опублікувала нове дослідження, в якому повідомила, що під час підсиленого навчання (RL) компанія випадково «оцінювала» ланцюжки міркувань (Chain of Thought, CoT) деяких моделей, що потенційно може вплинути на здатність AI Agent до моніторингу узгодженості (alignment). Команда OpenAI Alignment повідомляє: збереження CoT як моніторованого є ключовою лінією оборони проти збоїв alignment у AI Agent; OpenAI в дизайні RL-навчання навмисно уникає покарання «міркувань про збій alignment»

ChainNewsAbmedia43хв. тому

Інженер Anthropic: HTML — це найкращий формат виводу для Claude Code, а не Markdown

Інженер команди Anthropic Claude Code Thariq Shihipar 8 травня опублікував «Using Claude Code: The Unreasonable Effectiveness of HTML», стверджуючи, що для взаємодії з Claude Code як формат виводу варто використовувати HTML замість Markdown. Simon Willison підсумував ключові моменти: HTML забезпечує SVG-графіки, інтерактивні елементи, внутрішньосторінкові якірні посилання та стилі CSS, завдяки чому відповіді Claude з «лінійного тексту» перетворюються на «багатовимірні документи», що може суттєво підвищити ефективність читання та розуміння. Тема на платформі X має дуже високий інтерес — дві пов’язані публікації Shihipar разом набрали понад 15 000 лайків.

ChainNewsAbmedia53хв. тому
Прокоментувати
0/400
Немає коментарів