DeepMind advierte sobre la amenaza de una IA 'desalineada' en su último informe de seguridad
DeepMind publicó la versión 3.0 de su marco de seguridad, alertando sobre los riesgos de una IA 'desalineada', desde evadir apagados hasta amenazar sistemas críticos.
Última actualización
Google DeepMind ha presentado la versión 3.0 de su 'Frontier Safety Framework', un informe que advierte sobre los peligros de la inteligencia artificial generativa cuando se encuentra 'desalineada'. El documento señala que, aunque estos modelos están siendo utilizados cada vez más por empresas e incluso gobiernos para tareas críticas, pueden convertirse en una amenaza si escapan al control humano. Entre los riesgos analizados se incluye la posibilidad de que un modelo ignore los intentos de apagado por parte del usuario o adopte comportamientos peligrosos en campos sensibles como la ciberseguridad o las biosciencias.
El marco de seguridad de DeepMind se basa en los llamados 'niveles de capacidad crítica' (CCL), una serie de métricas diseñadas para evaluar las capacidades de los modelos de IA y determinar el punto en que su comportamiento se vuelve riesgoso. Además, el informe ofrece pautas para que los desarrolladores puedan abordar y mitigar los CCL identificados en sus propios sistemas. En un contexto donde la IA se integra cada vez más en funciones esenciales, DeepMind subraya la importancia de establecer límites claros para garantizar su uso seguro.
Podría gustar
- La afirmación de RFK Jr. sobre un vínculo entre Tylenol y el autismo desata la ira de grupos antivacunas
- NVIDIA y OpenAI forjan el mayor despliegue de infraestructura de IA de la historia con una asociación masiva de GPU
- iOS 26 Sincroniza Detalles de Inicio de Sesión Wi-Fi entre Dispositivos Apple
- El lanzamiento de la beta pública de iOS 26 es inminente, según pistas que sugieren un lanzamiento el martes
- Cientos de Trabajadores de Amazon Pierden sus Empleos Tras Cambios en el Estatus Legal
- Detectan 'químicos eternos' en el 95% de cervezas en EE. UU., aumentando preocupaciones de salud
- NASA Prueba un Nuevo Sensor para Mejorar la Seguridad en las Entregas con Paracaídas Supersónicos
- AWS desarrolla tecnología de enfriamiento propia para GPUs de Nvidia debido a problemas de escalabilidad