El lunes, Amazon Web Services (AWS), la principal plataforma de nube de Amazon, sufrió una caída que afectó a millones de usuarios en todo el mundo. Según Downdetector, se registraron hasta 8,1 millones de reportes de problemas en cuestión de horas. Aunque muchos servicios se restablecieron en pocas horas, algunos continuaron con fallos durante todo el día. Para la noche, Amazon confirmó que AWS había vuelto a operar con normalidad.
El problema comenzó a las 3:11 a.m., hora de la costa este de EU, en la región US‑EAST‑1 (Virginia del Norte), afectando la resolución de nombres de dominio (DNS) y provocando errores en plataformas como Snapchat, Fortnite, Duolingo, Canva y Alexa. La causa principal fue un fallo en los puntos de acceso a DynamoDB, una base de datos interna de AWS.
“Cuando una de las salidas clave de estas autopistas se interrumpe, no afecta a un solo vehículo sino a todos los que necesitan tomar esa salida y se forman atascos en cadena. Eso fue lo que pasó cuando cayó AWS”, explicó Hervé Lambert, de Panda Security.
AWS: pilar de Internet
Lanzado en 2006, AWS es el proveedor de servicios en la nube más usado del mundo, con 70 millones de sitios web dependiendo de él. Su modelo permite que empresas y gobiernos utilicen infraestructura bajo demanda, evitando la necesidad de mantener servidores propios. El mercado global de computación en la nube alcanzó 752.000 millones de dólares en 2024.
La interrupción del lunes evidencia la alta dependencia de unos pocos proveedores y regiones concretas, lo que genera vulnerabilidades críticas:
- Dependencia de un solo proveedor: muchas empresas dependen exclusivamente de AWS.
- Concentración regional: gran parte de los servicios críticos se alojan en la costa este de EE. UU.
- Fallos en cadena: problemas en un componente pueden paralizar múltiples servicios simultáneamente.
“Una de las vulnerabilidades más críticas son las piezas comunes que todos comparten. Si se rompe la pieza que controla los accesos, puede pararse medio Internet a la vez”, coincidió Lambert.
Reacciones y perspectivas
Expertos debaten sobre cómo mitigar riesgos:
- Diversificación de proveedores: usar múltiples nubes, como Google o Microsoft, aunque esto es costoso y complejo.
- Resiliencia regional: distribuir los datos en distintas regiones para evitar concentración de fallos.
- Control local: según Cori Crider, de The Future Institute, la concentración de poder en monopolios estadounidenses es un riesgo económico y democrático.
Al mismo tiempo, algunos expertos destacan que el desempeño de AWS sigue siendo confiable:
“Recuperar un tercio de Internet en pocas horas es notable y debería servir de lección sobre resiliencia”, dijo Jake Moore, de ESET.
“Este patrón no es inédito: incidentes regionales breves ocurren regularmente y la nube pública sigue siendo la mejor opción si se invierte en resiliencia desde el principio”, añadió Lydia Leong, analista de Gartner.
La caída de AWS del lunes evidencia que Internet depende cada vez más de unos pocos operadores centrales, lo que genera riesgos de interrupciones masivas. La solución, según los especialistas, pasa por diversificación, respaldo local y ensayos regulares, así como una planificación estratégica que equilibre eficiencia y seguridad.
“La lección principal es que la resiliencia nace de la diversidad y del control local”, concluye Crider, enfatizando la importancia de un Internet más equilibrado y seguro.



