DeepMind advierte sobre la amenaza de una IA 'desalineada' en su último informe de seguridad

DeepMind publicó la versión 3.0 de su marco de seguridad, alertando sobre los riesgos de una IA 'desalineada', desde evadir apagados hasta amenazar sistemas críticos.

Última actualización 20252025-09-23T05:53:50Z

Google DeepMind ha presentado la versión 3.0 de su 'Frontier Safety Framework', un informe que advierte sobre los peligros de la inteligencia artificial generativa cuando se encuentra 'desalineada'. El documento señala que, aunque estos modelos están siendo utilizados cada vez más por empresas e incluso gobiernos para tareas críticas, pueden convertirse en una amenaza si escapan al control humano. Entre los riesgos analizados se incluye la posibilidad de que un modelo ignore los intentos de apagado por parte del usuario o adopte comportamientos peligrosos en campos sensibles como la ciberseguridad o las biosciencias.

El marco de seguridad de DeepMind se basa en los llamados 'niveles de capacidad crítica' (CCL), una serie de métricas diseñadas para evaluar las capacidades de los modelos de IA y determinar el punto en que su comportamiento se vuelve riesgoso. Además, el informe ofrece pautas para que los desarrolladores puedan abordar y mitigar los CCL identificados en sus propios sistemas. En un contexto donde la IA se integra cada vez más en funciones esenciales, DeepMind subraya la importancia de establecer límites claros para garantizar su uso seguro.

DeepMind advierte sobre la amenaza de una IA 'desalineada' en su último informe de seguridad

Podría gustar