🥇 Pilar 5 (Excelencia Operacional)

🍿 En qué consiste el Pilar 5 Excelencia Operacional de AWS?

El pilar de excelencia operacional incluye las practicas y procedimientos operacionales utilizados para manejar las cargas de trabajo en producción.

Esto incluye como los cambios planificados son ejecutados, asi como respuestas a eventos operacionales no esperados.

La ejecución de cambios y las respuestas deben ser automatizadas. Todos los procesos y procedimientos de excelencia operacional deben estar documentados, probados y regularmente revisados.

🍿 Cuáles son los Principios de Diseño?

🍿 Cúale son los elementos del Principio de Diseño?

🍿 Cómo se lleva acabo la preparación?

🍿 Cuáles son las mejores prácticas para la preparación?

Existen varios métodos y características que pueden ser utilizadas para para tener lista el soporte operacional, y la habilidad de preparar para la operación normal del dia a dia, asi como los eventos operacionales inesperados.

CloudFormation puede ser utilizado para asegurarse que los ambientes contienen todos los recursos cuando se despliega a producción, y que la configuracion del ambiente esta basada en un las mejores prácticas que han sido probadas, lo que reduce la oportunidad de error humano.

AutoScaling permite responder a las cargas de trabajo cuando los eventos relacionados al negocio afectan las necesidades operacionales.

Servicios como AWS Config con las características de las reglas de AWS Config crean mecanismos para monitorear automaticamente y responder a cambios en las cargas de trabajo de AWS y sus ambientes.

Tambien es importane utilizar caracteristicas como tags para asegurarse que todos los recursos en una carga de trabajo puede ser facilmente identificados cuando sea necesario durante operaciones y respuestas.

🍿 Cémo determinar si se lleva acabo una correcta preparación?

🍿 Mejores practicas para la Preparación

Este seguro que la documentación no se vuelva viciada u obsoleta conforme los procedimientos cambian. Sin disenos de la aplicación, configuración del ambiente, configuración de los recursos, planes de respuesta, planes de mitigación, la documentación no esta completa. Si la documentación no esta actualizada y probada regularmente, no sera útil cuando operaciones inesperadas ocurran. Si las cargas de trabajo no son revisadas antes de ir a producción, las operaciones serán afectadas cuando errores no detectados ocurran. Si los recursos no son documentados, cuando los eventos operacionales ocurran, determinar cuanto tomara en responder sera difícil mientra que los recursos correctos son identificados.

Las operaciones deben ser estandarizadas y manejables en una rutina base. El foco debe ser la automatización, pequeños cambos frecuentes, verificación regular de la calidad de pruebas y mecanismos definidos de monitoreo, auditoría, roll backs, y revisión de cambios. Los cambios no deben ser largos y esporádicos, no deben requerir que se apague el sistema, no deben requerir ejecución manual. Un amplio rango de errores y metricas que estan basdas on indicadores operacionales para cargas de trabajo deben ser recolectadas y revisadas para asegurarse de la operación continua.

En AWS se puede utilizar integracion continua para despliegues en pipelines. El proceso de despliegeue sea manual o automatizado, debe ser probado y estar basado en pequeños cambios incrementales, y versiones monitoreadas. Usted debe ser capaz de revertir cambios que han sido introducidos por errores operaciones sin causar impactos operacionales.

🍿 Cuáles son las Mejores prácticas para Operaciones

Cómo se esta evolucionar con las cargas de trabajo mientras de minimizan los impactos de un cambio?

Cómo se mantienen las cargas de trabajo para garantizar que se esta operando como se desea?
Las operaciones de rutinas asi coom las respuestas a eventos no planeados deben ser automatizadas.
Los procesos manuales de despliegue, liberación, cambios y rollbacks deben ser evitados.
La libreacion (releases) no debe ser largos bloques de son realizados infrecuentemente.
Los rollbacks son mas dificiles en grandes cambios, el no tener un plan de contingencia para los rollbacks detendrá la ejecución de las operaciones.
Alinee el monitoreo con las necesidades del negocio, de tal manera que las respuestas sea efectivas y se mantenga la continuidad del negocio.
El monitoreo general y no centralizado, con respuestas que son manuales causara impacto en las operaciones durante eventos inesperados.

🍿 Respuestas

En AWS hay varios mecanismos para asegurarse que alertas y notificaciones en respues a eventos operaciones no planeados existan asi como respuestas automatizadas:

Preguntas enfocadas en consideraciones de operaciones para la excelencia operacional:

🍿 Preparación

🍿 Servicios de AWS para el manejo de Operaciones

Utilice AWS SDK’s a una libreria de terceros para automatizar los cambios operacionales. Utilice CloudTrail para auditar y monitorear los cambios realizados al ambien de de AWS.

🍿 Respuestas

Tome ventaja de todos las características de Amazon CloudWatch para respuestas efectivas y automatizadas. Las alarmas pueden ser definidas con una tolerancia para alertar y notificar, y los eventos pueden disparar notifciaciones y respuestas automáticas.

Pilar 4 (Optimización del costo) Temas adicionales para el examen de Certificación de AWS
comments powered by Disqus