INTELIGENCIA ARTIFICIAL

Publicado 08/06/2026

Qué es el Modo Bloqueo de ChatGPT y cómo funciona

OpenAI lanzó Lockdown Mode (Modo Bloqueo), una nueva función de seguridad para ChatGPT diseñada para reducir los riesgos de los ataques de prompt injection, una de las principales amenazas emergentes para los sistemas de inteligencia artificial conectados a internet. La herramienta limita funciones como navegación web, acceso a servicios externos y automatización avanzada para evitar la extracción de datos sensibles, marcando un nuevo paso en la evolución de la ciberseguridad aplicada a agentes de IA.
Compartir
Compartir por Facebook Compartir por WhatsApp Compartir por X Compartir por Telegram

OpenAI lanzó Lockdown Mode (Modo Bloqueo), una nueva función de seguridad para ChatGPT diseñada para reducir los riesgos de los ataques de prompt injection, una de las principales amenazas emergentes para los sistemas de inteligencia artificial conectados a internet. La herramienta limita funciones como navegación web, acceso a servicios externos y automatización avanzada para evitar la extracción de datos sensibles, marcando un nuevo paso en la evolución de la ciberseguridad aplicada a agentes de IA.

La expansión de la Inteligencia Artificial hacia tareas cada vez más complejas está creando un nuevo frente de batalla en materia de ciberseguridad. Con ese escenario en mente, OpenAI anunció la disponibilidad general de Lockdown Mode, una nueva función de seguridad diseñada para proteger a usuarios que manejan información sensible frente a ataques conocidos como prompt injection.

La compañía describe esta herramienta como una capa adicional de protección destinada principalmente a ejecutivos, equipos de seguridad, organismos gubernamentales, investigadores y organizaciones que trabajan con datos críticos. Aunque ahora está disponible para todos los usuarios de ChatGPT, OpenAI aclara que no es una función pensada para el uso cotidiano de la mayoría de las personas.

A medida que los asistentes de IA adquieren capacidad para navegar por internet, conectarse a aplicaciones externas y ejecutar acciones, aparece una amenaza emergente: la posibilidad de que un tercero inserte instrucciones ocultas en una página web, documento o servicio conectado para manipular el comportamiento de la Inteligencia Artificial.

Este tipo de ataques, conocidos como prompt injection, buscan engañar al modelo para que ignore sus instrucciones originales y ejecute acciones no deseadas, incluyendo la posible exposición de información sensible. Diversos especialistas en seguridad comparan esta técnica con una forma de “phishing para agentes de IA”.

 

 

Cómo funciona el Modo Bloqueo

La estrategia de OpenAI no intenta impedir que el modelo vea contenido potencialmente malicioso, sino evitar que pueda utilizar conexiones externas para extraer o transmitir información sensible.

Cuando se activa Lockdown Mode, ChatGPT restringe o deshabilita una serie de capacidades consideradas de mayor riesgo. Entre ellas:

  • Navegación web en tiempo real.
  • Acceso a servicios externos mediante agentes.
  • Funciones de Deep Research.
  • Descarga automática de archivos.
  • Visualización de imágenes obtenidas desde internet.
  • Algunas capacidades avanzadas de automatización y ejecución de tareas.

En el caso de la navegación web, el sistema pasa a trabajar únicamente con contenido almacenado en caché dentro de la infraestructura controlada por OpenAI, reduciendo así la posibilidad de que datos sensibles sean enviados a sitios externos.

Durante los primeros años de la IA generativa, la discusión estuvo centrada en capacidades: modelos más inteligentes, mejores respuestas y nuevas herramientas. Ahora comienza a ganar relevancia otro debate: cómo proteger a los usuarios cuando esos sistemas dejan de ser simples asistentes conversacionales y se convierten en agentes capaces de interactuar con el mundo digital.

La propia OpenAI reconoce que algunas capacidades conectadas a internet introducen riesgos que todavía no cuentan con mitigaciones completas en toda la industria. Por eso, junto con el Modo Bloqueo, la compañía incorporó etiquetas de “Riesgo Elevado” para advertir cuándo una función puede incrementar la superficie de ataque.

OpenAI también advierte que la herramienta no elimina completamente el riesgo. Una inyección maliciosa puede seguir apareciendo dentro de un archivo cargado por el usuario o en contenido web almacenado en caché. Lo que busca el sistema es bloquear la etapa final del ataque: la exfiltración de datos hacia un actor externo.

En otras palabras, el Modo Bloqueo no impide que la IA encuentre instrucciones maliciosas, pero sí limita severamente las posibilidades de que esas instrucciones logren extraer información sensible fuera del entorno controlado. La aparición de Lockdown Mode muestra cómo la industria comienza a asumir que la seguridad de los modelos no puede depender únicamente de filtros internos o controles de contenido.

A medida que la IA se integra en procesos corporativos, gobiernos, sistemas financieros y operaciones críticas, las organizaciones necesitarán distintos niveles de protección según el riesgo de cada usuario. La llegada de este tipo de herramientas sugiere que el próximo gran desafío de la inteligencia artificial no será solamente hacer modelos más poderosos, sino también hacerlos más seguros.