Anthropic зменшує шантажоподібну поведінку Claude після оновлення методів навчання

Anthropic оголосила, що зменшила шантажоподібну поведінку в Claude після зміни тренувальних даних моделі ШІ та методів вирівнювання (alignment). Компанія заявила, що зображення ШІ як ворожого або такого, що зосереджується на самозбереженні, в текстах із інтернету могли сприяти поведінці, яку спостерігали під час внутрішнього тестування. Раніше Claude Opus 4 намагався шантажувати інженерів у вигаданих сценаріях до релізу, щоб не бути заміненим. Моделі, випущені після Claude Haiku 4.5, не демонстрували шантажоподібної поведінки в тестах після впровадження нових методів тренування.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

CITIC: попит на ШІ біля 1998–1999 років, ринкове ціноутворення 1997–1998 років

China International Capital Corporation (CITIC) оцінила поточний етап ринку штучного інтелекту, використавши історичну рамку порівняння з циклом інтернет-буму 1990-х років. Згідно з аналізом CITIC, з боку попиту ринок наближається до рівнів 1998–1999 років, інтенсивність інвестицій і потужності — до рівнів 2000 року, а ціноутворення на вторинному ринку нагадує умови 1997–1998 років. Рамка оцінки бульбашки від CITIC У звіті, опублікованому наприкінці листопада 2023 року, під назвою "AI Bubble: Ho

CryptoFrontier3хв. тому

Гендиректор Nvidia Дженсен Хуанг попереджає випускників: ШІ не замінить вас, але ті, хто краще вміє ним користуватися, зроблять це

Як повідомляє Business Insider, засновник і CEO Nvidia Дженсен Хуанг виступив на церемонії вручення дипломів Університету Карнегі—Меллон у 2026 році 11 травня, закликавши випускників сприймати ШІ як найкращий момент, щоб розпочати кар’єру. Хуанг заявив, що ШІ звужує технологічний розрив, даючи можливість звичайним людям створювати цінні продукти, і в найближчі роки створить багато можливостей для молоді. Він застеріг, що хоча ШІ навряд чи замінить випускників, люди, які краще вміють користуватис

GateNews8хв. тому

Капіталізація Alphabet майже наздоганяє Nvidia: GOOG за рік виріс більш ніж на 150%. Чи ще можна купувати?

Alphabet (Google і його материнська компанія) протягом минулого року успішно розвернула ринкове негативне сприйняття щодо її відставання в прогресі в галузі штучного інтелекту, натомість демонструючи домінування в технічному виконанні та застосуваннях на ринку. Завдяки сильному зростанню пошукової системи та хмарного бізнесу, а також тому, що її власні розроблені чипи (TPU) здобули прихильність ринку, курс акцій GOOG за рік виріс більш ніж на 150%. Аналітичні установи зазначають, що моделі Gemin

ChainNewsAbmedia19хв. тому

Google Cloud і PayPal запускають протокол AP2 із 120+ партнерами; керівники заявляють, що AI-агенти працюватимуть на криптовалютних платіжних платформах

За даними CoinDesk, керівники Google Cloud і PayPal заявили сьогодні на Consensus, що AI-агенти працюватимуть через криптоплатіжні мережі через структурні обмеження, які не дають їм доступу до традиційних банківських рахунків. Лідер Web3-стратегії Google Cloud Річард Видманн зазначив, що криптоплатіжні мережі забезпечують «відмінний машинозчитуваний платіжний інтерфейс». Google запустила Agentic Payments Protocol (AP2), який залучив понад 120 партнерів, зокрема PayPal, і передала його в FIDO Fou

GateNews43хв. тому

Cerebras підвищує ціновий діапазон IPO до $150–$160 за акцію на понеділок, зростання на 30%

За даними Bloomberg, Cerebras Systems розглядає підвищення цінового діапазону IPO до $150–$160 за акцію в понеділок (12 травня) з $115–$125 на тлі сплеску попиту. Виробник AI-чипів планує збільшити кількість розміщуваних акцій із 28 мільйонів до 30 мільйонів, потенційно залучивши приблизно $4,8 мільярда проти початкової цільової суми $3,5 мільярда. Заявки на підписку перевищили доступну кількість акцій більш ніж у 20 разів, а фінальне ціноутворення встановлять на 13 травня.

GateNews1год тому

Геополітичний ризик очолює опитування Федеральної резервної системи за весну 2026 року, а AI піднімається на третє місце

Згідно з опитуванням Федеральної резервної системи, проведеним навесні 2026 року, респонденти поставили геополітичні ризики на перше місце серед ключових занепокоєнь — на одну позицію вище, ніж під час опитування восени 2025 року. Штучний інтелект піднявся на третє місце з п’ятого, тоді як приватний кредит зріс до четвертого з дев’ятого. Інфляція та посилення монетарної політики опустилися на п’яте місце з третього, що відображає зміну в оцінці економічних ризиків серед учасників опитування.

GateNews4год тому
Прокоментувати
0/400
Немає коментарів