Pilar 2 (Fiabilidad)

Pilar 2 (Fiabilidad)

¿En qué consiste el Pilar 2 (Fiabilidad) de AWS?

La habilidad de un sistema para recuperarse de desconexiones e interrupciones así como la habilidad de adquirir dinámicamente recursos de procesamiento para cumplir las necesidades en demanda.

¿Cuáles son los principios del Pilar 2 de AWS?

  • Herramientas de prueba de procesos de recuperación.
  • Recuperación automática de fallos.
  • Escalamiento horizontal para incrementar la disponibilidad del sistema.
  • Dejar de adivinar la capacidad.

¿Cuál es la definición del concepto de fiabilidad?

La fiabilidad en la nube consiste de 3 capas:

  • Cimientos.
  • Administración de cambios.
  • Administración de fallos.

¿Cuáles son los cimientos del Pilar 2 de AWS?

Antes de diseñar la arquitectura de cualquier sistema, es necesario que se asegura que tiene previamente los requerimientos de los cimientos.

AWS maneja dichos cimientos por usted. La nube esta diseñada para no tener un limite, AWS maneja los requerimientos de conectividad y procesamiento por si mismo. Sin embargo define unos limites para los usuarios que accidentalmente sobre provisionan recursos.

¿Cuáles son las preguntas que se deben hacer para verificar la fiabilidad de un sistema?

¿Cómo se están manejando los limites de su cuenta?
Hay alguien a cargo de ello?.
Hay alguien quien tiene que ir y levantar los tickets?
Como esta planeada la topología de su red en AWS?
Tiene una ruta de scaling para lidiar con issues?

Administración de cambios

  • Es necesario estar alerta de como los cambios afectan al sistema de tal forma que se pueda planear de manera proactiva alrededor de estos cambios.
  • El monitoreo permite detectar cualquier cambio en el ambiente y reaccionar a dicho cambio.

Usted puede utilizar CloudWatch para monitorear su ambiente y servicios como auto-escalamiento y automatización de cambios en respuesta los cambios en su ambiente de producción.

Preguntas sobre la administración de fallos (failures)

  • ¿Cómo se están respaldando los datos?
  • ¿Cómo resiste su sistema a los fallos en los componentes?
  • ¿Cómo esta planeado el proceso de recuperación?

Servicios Clave AWS

Cimientos
IAM
VPC
Administración de cambios
AWS CloudTrail
Administración de fallos
AWS CloudFormation