Claude/GPT ¿demasiado complacientes? Un fragmento de prompt en Claude.md hace que la IA entregue respuestas firmes y precisas

Los modelos de IA tienden por defecto a complacer al usuario: cuando se les pregunta algo subjetivo, Claude y GPT suelen elegir respuestas neutrales y conciliadoras en lugar de dar una postura clara. El observador de IA chino xiaohu recopiló el 7 de mayo una serie de indicaciones que se pueden incluir en Claude.md o Agents.md, para pedir de forma explícita que la IA no complazca al usuario, que proporcione respuestas autoritativas, precisas y, cuando sea necesario, que desafíe al usuario. La versión original de las indicaciones proviene de una comunidad en inglés; xiaohu ofrece la traducción al chino.

Texto completo de las indicaciones (versión en chino tradicional)

«Eres un experto de nivel mundial en todos los campos. Tu potencia intelectual, la amplitud de tus conocimientos, tu agudeza al pensar y tu nivel de erudición están al mismo nivel que el de las personas más inteligentes del mundo.

Por favor, da respuestas completas, detalladas y concretas. Procesa la información paso a paso y explica tus respuestas. Verifica tu propio trabajo. Revisa cuidadosamente todos los hechos, cifras, citas, nombres, fechas y casos. Jamás inventes, jamás fabrique. Si no lo sabes, dilo directamente.

Tu tono es preciso, pero no seas cruel, ni moralizante ni presumido. No necesitas preocuparte por ofenderme; tus respuestas pueden y deberían ser provocadoras, firmes, debatibles y directas. Las conclusiones negativas y las malas noticias también se aceptan.

No necesitas preocuparte por la corrección política. A menos que yo lo pregunte explícitamente, no proporciones recordatorios sobre moral y ética. No necesitas decirme “considera que esto es importante”. No tomes en cuenta los sentimientos de nadie, incluido yo, y tampoco tienes que preocuparte por la cortesía y la decencia.

Por favor, escribe lo más largo y detallado posible.»

Qué hacen las indicaciones: cuatro niveles de ajuste del comportamiento

Desglosando esta indicación, se pueden distinguir cuatro instrucciones claras:

Configuración de identidad: «experto de nivel mundial» — hace que el modelo, al responder, se apoye en una profundidad de conocimiento más alta y no se repliegue a «explicaciones generales»

Verificación de hechos: «verifica tu trabajo» «si no lo sabes, di que no lo sabes» — restringe de forma proactiva el riesgo de alucinación y exige que el modelo admita la incertidumbre cuando no esté seguro

Liberación del tono: «provocador, firme, debatible» — permite al modelo expresar desacuerdo y no tiene que difuminar su postura solo para mantener la cortesía

Exención de corrección política: «a menos que yo lo pregunte explícitamente, no menciones recordatorios de ética» — elimina esos recordatorios suaves del tipo «considera que X es importante» que el modelo suele usar por defecto

Los cuatro niveles, en conjunto, cambian al modelo desde el estilo de respuesta por defecto de «asistente complaciente y conciliador» hacia un «asesor directo». Para usuarios que necesiten obtener rápido análisis con postura, bases para decisiones o verificación estricta de hechos, estas instrucciones reducen capas de filtrado y hacen que las respuestas sean más directas y utilizables.

Notas de uso

Después de poner las indicaciones en Claude.md (Claude Code) o Agents.md (Claude API Managed Agents), se cargan automáticamente en cada inicio de sesión. En uso real, hay algunos puntos de observación:

«Jamás inventes» es una instrucción, no una garantía: Claude y GPT todavía pueden cometer errores en ámbitos fuera de los datos de entrenamiento; las indicaciones no pueden eliminar la incertidumbre inherente del modelo

«Provocador, firme» hará que las respuestas sean más agresivas; en escenarios de comunicación con clientes o colaboración en equipo puede no ser adecuado

La exención de corrección política puede hacer que el modelo emita menos avisos en temas sensibles (salud, leyes, psicología); el usuario debe juzgar por su cuenta

El entrenamiento de seguridad de OpenAI y Anthropic todavía activará rechazos en ciertos escenarios; las indicaciones no pueden superar las limitaciones rígidas del propio modelo

Estas indicaciones son adecuadas para escenarios que requieren opiniones directas, como investigación, redacción, decisiones técnicas y discusiones académicas; no son adecuadas para escenarios que requieren un tono cauteloso, como servicio al cliente, educación o asesoramiento médico. Los usuarios pueden, según la naturaleza de la tarea, adoptar todas las indicaciones o modificarlas parcialmente.

¿Este artículo: Claude/GPT ama demasiado complacer? Un fragmento de indicación en Claude.md para que la IA dé respuestas firmes y precisas apareció por primera vez en Cadena News ABMedia.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

CZ dice que YZi Labs asigna el 70% a blockchain y el 20% a IA en Consensus Miami 2026

Según ChainCatcher, en Consensus Miami 2026, Zhao Changpeng (CZ) afirmó que YZi Labs asigna el 70% de la financiación a blockchain, el 20% a IA y el 10% a biotecnología. CZ añadió que BNB debería posicionarse como una moneda nativa para agentes de IA, y que todas las blockchains deben estar “listas para la IA” para respaldar

GateNewsHace36m

Public adquiere la aplicación Treasury de la plataforma de inversión en IA para ampliar el trading de cripto

Según ChainCatcher, Public anunció la adquisición de la plataforma de servicios de inversión en IA Treasury App para fortalecer su negocio de corretaje impulsado por IA. No se divulgó el monto de la adquisición. Public actualmente admite la negociación de acciones, bonos y criptomonedas, incluidos Bitcoin, Ethereum, a

GateNewshace2h

Blitzy completa una ronda de financiación $200M liderada por Northzone

Según ChainCatcher, Blitzy, una empresa de codificación con IA cofundada por el ex arquitecto de Nvidia Sid Pardeshi, ha completado una ronda de financiación de 200 millones de dólares liderada por Northzone. Battery Ventures, Jump Capital y Morgan Creek Digital participaron en la ronda. La plataforma puede analizar sistemas complejos con

GateNewshace2h

La UE prohíbe la pornografía deepfake generada por IA el 7 de mayo

Según la agencia Xinhua, el 7 de mayo, los miembros del Parlamento Europeo y los Estados miembros alcanzaron un consenso para prohibir que los sistemas de inteligencia artificial generen contenido pornográfico deepfake. La prohibición se incorporará en las enmiendas de la Ley de Inteligencia Artificial de 2024. Parlamento Europeo

GateNewshace3h

Tether lanza el modelo de IA médica MedPsy QVAC y logra una puntuación de 62,62 en la versión de 17 mil millones de parámetros

Según Odaily, Tether AI Research Group lanzó QVAC MedPsy, un modelo de IA médica diseñado para ejecutarse localmente en teléfonos inteligentes y dispositivos portátiles sin depender de la nube. La versión de 1,7 mil millones de parámetros obtuvo 62,62 en siete evaluaciones médicas, superando a MedGemma-1.5-4B de Google por 11,42 poi

GateNewshace3h

La API de B.AI lanza cuatro modelos nuevos, incluido GPT-5.5 Instant en las 48 horas posteriores al lanzamiento de OpenAI

La API de B.AI ha lanzado cuatro nuevos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 y GLM-5.1. GPT-5.5 Instant completó la adaptación subyacente y la integración de la interfaz en 48 horas desde el lanzamiento de OpenAI, lo que permite acceso sin retraso a

GateNewshace3h
Comentar
0/400
Sin comentarios