Redshift (Análisis de datos escalable en AWS)

☀ ¿Cuáles son las características de Amazon RedShift?
- Es una base de datos rápida, fully managed (administrada), peta-scale (soporta enormes cantidades de datos) y data warehouse (en data centers).
- Puede iniciar desde $0.25 dlls por hora sin contratos a tiempo específico.
- Puede escalar hasta petabytes o mas por $1000 por terabyte por año.
- Cuesta menos que un décimo de la mayoría de los servicios similares de warehousing.
- Columnar, es decir organiza los datos en forma de columnas.
- Utiliza compresión avanzada.
- Procesamiento en paralelo masivo (distribuye queries a través de diferentes nodos).
☆ Online Analytic Processing (OLA)
Con redshift es posible iniciar con un simple nodo de 160G.
☀ Multinodo
- Leader Node (Nodo Líder)
-
Maneja las conexiones de los clientes y recibe los queries.
- Compute Node (Nodo de Computo)
-
Almacena y ejecuta queries y computo (Hasta 128 nodos de computo).
Redshift a diferencia de las bases de datos relacionales comunes, no organiza los datos en forma de filas sino de columnas. Los sistemas basados en columnas son ideales para data ware housing y análisis de datos, en donde las queries involucran consultas realizadas en largos bloques de datos.
☆ ¿Cuáles son los costos del uso de Amazon RedShift?
- Nodos de computo por horas (el número de horas que se realice computo por parte de los nodos por el periodo de cobro).
- No se cobran cargos por el nodo leader, solo por los nodos de computo.
- Cargos por backups.
- Cargos por transferencia de datos (solo dentro del VPC no hacia afuera).
☆ ¿Cuáles son los criterios de seguridad en Amazon RedShift?
- Encriptación para el transito con SSL.
- Encriptación para el destino de los datos con AES-256.
- RedShift se hace cargo del manejo de las llaves.
- También es posible manejar sus propias llaves con KSM (AWS Key Service Manager).
☆ ¿En dónde se encuentra disponible Amazon RedShift?
Actualmente solo esta disponible en un Availability Zone.
Puede ser restaurado a un nuevo Availability Zone cuando sucede un outage.