Anthropic выпустила 80-страничную «Конституцию Claude» — обновленную рамочную структуру для выравнивания ИИ

PANews 23 января: компания AI-моделей Anthropic недавно обнародовала новую версию «Конституции Claude» и выпустила ее под лицензией Creative Commons CC0 1.0, как «высший авторитет» для обучения, используемый для генерации синтетических обучающих данных и обратной связи по ранжированию; вместо «перечня принципов» теперь объясняется «почему так», чтобы повысить обобщение в новых ситуациях. Документ структурирован по принципам: безопасность > этика > следование руководствам > искренняя помощь, в нем перечислены «жесткие ограничения» (, такие как отказ в предоставлении существенной помощи в создании биологического оружия ), а также добавлены разделы о добродетелях, психологической безопасности и самосознании модели, подчеркивая прозрачность и постоянные итерации.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев