Дані викривають, що «Claude знижає рівень» — це не міський міф; нестабільність AI-моделі є ризиком для компанії

Після того, як ШІ став стандартним інструментом для підприємств, на поверхню швидко виходить явище, яке раніше вважали «проблемою відчуттів»: LLM (великі мовні моделі) «стають тупішими». Користувач Wisely Chen зазначив, що так зване «LLM-«пониження розуму»» — це не міський міф, а те, що вже можна постійно відстежувати за допомогою даних, і воно вже спричиняє відчутний вплив на робочі процеси компаній.

Він наводить приклад зі власного досвіду: 15 квітня в сервісах лінійки Claude від Anthropic стався повсюдний downgrade, зокрема claude.ai, API та Claude Code — усі вони показували «Degraded Performance». Це не просто уповільнення або поодинокі помилки, а помітне падіння якості відповідей; навіть траплялися випадки, коли сервіс неможливо було нормально використовувати, через що того дня всі три його розробницькі завдання було повністю перенесено.

За таких сценаріїв для індивідуальних розробників це, можливо, лише зниження ефективності, але для команд IT підприємств вплив багаторазово посилюється. Коли в команді кілька інженерів одночасно покладаються на інструменти ШІ для програмування, написання документів і автоматизації процесів, один раз — і модель знижується в якості — означає, що загальна продуктивність в той самий час падає колективно, перетворюючись на відчутні втрати часу та витрат.

ШІ відчутно «стало гірше з розумом»? Дані підтверджують: це сталося «давно»

Wisely Chen зазначив, що фрази на кшталт «GPT став тупішим», «Claude не такий, як раніше» ходять у спільноті давно, але довго бракувало об’єктивних даних, які б це підтверджували. Лише нещодавно поява платформ із постійним моніторингом якості моделей дозволила вперше це кількісно оцінити.

Зокрема, StupidMeter проводить 24-годинні автоматизовані тести для популярних моделей, включно з OpenAI, Anthropic, Google тощо, відстежуючи такі показники, як точність, здатність до міркувань і стабільність. На відміну від традиційних разових benchmark-ів, такі системи ближчі до підходу до моніторингу API або доступності сервісів у компаніях: спостерігають, як модель «плаває» за продуктивністю в умовах реального використання.

Результати даних дуже показові: наразі більшість основних моделей перебувають у стані попередження або downgrade, і лише небагато моделей зберігають нормальний режим. Це означає, що нестабільність якості моделей — не проблема одного конкретного продукту, а поширене явище всієї індустрії.

LLM непомітно «деградує в інтелекті», впливаючи на стабільність бізнесу, який використовує AI-процеси

Для підприємств такі зміни означають, що ШІ з «інструмента для підвищення ефективності» перетворюється на «змінну, яка впливає на стабільність». Якщо щоденні робочі процеси компанії — від написання програм до code review, а також випуск документів і аналітичних звітів — уже значною мірою залежать від LLM, то коли модель в один день демонструє падіння здатності до міркувань або погіршення якості відповідей, ці проблеми не виникатимуть локально, як звичайні баги традиційного програмного забезпечення: вони проникатимуть одночасно в усі етапи, де використовують ШІ.

Ще важливіше те, що такі коливання часто важко прогнозувати і так само важко вчасно помітити. У більшості компаній немає механізмів постійного моніторингу якості моделей; зазвичай вони усвідомлюють, що проблема походить саме від моделі, лише після того, як результати стають аномальними або знижується ефективність команди. За такої ситуації «пониження розуму» вже не є лише суб’єктивним відчуттям користувачів — це системний ризик, який безпосередньо впливає на ритм роботи та функціонування підприємства.

Коли ШІ стає як вода й електрика, стабільність стає новим ключовим показником

Wisely Chen порівняв роль LLM із «водою й електрикою сучасної компанії». Коли ШІ глибоко вбудувався в щоденну діяльність і став незамінною базовою здатністю, значення стабільності зростає ще більше.

Раніше, оцінюючи інструменти ШІ, компанії більше фокусувалися на можливостях моделі, ціні та функціях, але коли на поверхню спливає явище «пониження розуму», з’являється інший, ще важливіший показник — стабільність. Якщо якість моделі може змінюватися без попередження, компанії більше не просто «використовують ШІ» — їм доводиться брати на себе новий тип ризику для базової інфраструктури. І ще безнадійніше те, що якщо дивитися лише на передові великі мовні моделі, то майже напевно, доки не буде вирішено проблеми з обчислювальними ресурсами, це може продовжуватися.

Ця стаття «Дані: “Claude став тупішим” — це не міський міф, а нестабільність AI-моделей є ризиком для підприємств» вперше з’явилася на «Ланцюжкових новинах ABMedia».

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Гонконг оголосить сьомий список ключових підприємств завтра

Фінансовий секретар Гонконгу Пол Чан оголосив про представлення нового списку ключових підприємств, привернувши понад 100 компаній із вартістю понад 100 млрд гонконгських доларів у таких секторах, як науки про життя, ШІ та фінтех, підкресливши привабливість Гонконгу для міжнародних інвестицій.

GateNews33хв. тому

Робот Lightning від Honor перемагає на напівмарафоні гуманоїдних роботів у Пекіні 2026 з фінішем 50:26

Гуманоїдний робот Honor "Lightning" встановив новий рекорд на напівмарафоні гуманоїдних роботів у Пекіні Yizhuang 2026, завершивши перегони за 50 хвилин 26 секунд, перевершивши світовий рекорд людини.

GateNews3год тому

Акції Meta зростають на 1,73%, поки компанія планує звільнення 8,000 працівників, що стартують 20 травня

Meta Platforms планує скоротити приблизно 8,000 робочих місць, або 10% свого штату, починаючи з 20 травня, попри зростання цін на акції. Компанія, яка має понад $200 мільярдів доходу, зосереджується на інвестиціях в ІІ на тлі суттєвої реструктуризації, узгоджуючись із галузевими тенденціями звільнень.

GateNews11год тому

Звіт Google за рік стверджує, що Gemini досягає перехоплення за мілісекунди, блокуючи 99% шахрайських оголошень

Стаття обговорює, як Google за допомогою своєї генеративної системи штучного інтелекту Gemini посилює безпеку реклами; звіт показує, що швидкість виявлення та блокування порушуваних оголошень скоротилася до мілісекунд, а рівень блокування досяг 99%. Минулого року Google видалив 8,3 млрд рекламних оголошень і призупинив 24,9 млн акаунтів, що демонструє суттєве зростання кількості шахрайських оголошень. Експерти зазначають, що це протистояння між штучним інтелектом і штучним інтелектом; у майбутньому все одно доведеться мати справу з викликами, які приносить AI, зокрема щодо законних і незаконних дій.

ChainNewsAbmedia13год тому

Засновник Ethereum Лубін: ШІ буде критичною точкою повороту для крипто, але монополія техгігантів створює системні ризики

Засновник Ethereum Джозеф Лубін підкреслив трансформаційний потенціал ШІ для криптовалютного сектору, водночас застерігши від ризиків централізації серед технологічних гігантів. Він уявляє ШІ-керовані автономні транзакції в блокчейні та наголошує на зближенні традиційних фінансів із DeFi.

GateNews15год тому

Ілон Маск просуває виплати «універсальний високий дохід» як найкраще рішення для безробіття через ШІ

Ілон Маск виступає за Універсальний високий дохід, щоб протидіяти безробіттю, спричиненому ШІ, уявляючи майбутнє, де буде достатньо товарів і нульова інфляція. Натомість експерти на кшталт Сема Альтмана висловлюють занепокоєння щодо втрати робочих місць і пропонують захисні заходи для працівників.

Coinpedia15год тому
Прокоментувати
0/400
Немає коментарів