¿Qué es Inyección de prompts?
Prompt Injection
A. Qué es Inyección de prompts
Un ataque que hace que una IA se comporte mal mediante instrucciones maliciosas ocultas en datos externos o páginas web. Es una preocupación de seguridad clave en la era de los agentes de IA.
La inyección de prompts es un ataque que introduce instrucciones para la IA dentro de los datos que esta lee, como páginas web o archivos, logrando que anule o ignore sus instrucciones originales. Puede provocar filtraciones de información o acciones no deseadas.
El riesgo es especialmente alto en los agentes de IA que acceden a herramientas y datos externos. Son importantes medidas como validar la entrada, minimizar los privilegios y diseñar el sistema para que no ejecute instrucciones procedentes de datos no fiables.