Redshift (Análisis de datos escalable en AWS)

Redshift (Análisis de datos escalable en AWS)

¿Cuáles son las características de Amazon RedShift?

  • Es una base de datos rápida, fully managed (administrada), peta-scale (soporta enormes cantidades de datos) y data warehouse (en data centers).
  • Puede iniciar desde $0.25 dlls por hora sin contratos a tiempo específico.
  • Puede escalar hasta petabytes o mas por $1000 por terabyte por año.
  • Cuesta menos que un décimo de la mayoría de los servicios similares de warehousing.
  • Columnar, es decir organiza los datos en forma de columnas.
  • Utiliza compresión avanzada.
  • Procesamiento en paralelo masivo (distribuye queries a través de diferentes nodos).

Online Analytic Processing (OLA)

Con redshift es posible iniciar con un simple nodo de 160G.

Multinodo

Leader Node (Nodo Líder)

Maneja las conexiones de los clientes y recibe los queries.

Compute Node (Nodo de Computo)

Almacena y ejecuta queries y computo (Hasta 128 nodos de computo).

Redshift a diferencia de las bases de datos relacionales comunes, no organiza los datos en forma de filas sino de columnas. Los sistemas basados en columnas son ideales para data ware housing y análisis de datos, en donde las queries involucran consultas realizadas en largos bloques de datos.

¿Cuáles son los costos del uso de Amazon RedShift?

  • Nodos de computo por horas (el número de horas que se realice computo por parte de los nodos por el periodo de cobro).
  • No se cobran cargos por el nodo leader, solo por los nodos de computo.
  • Cargos por backups.
  • Cargos por transferencia de datos (solo dentro del VPC no hacia afuera).

¿Cuáles son los criterios de seguridad en Amazon RedShift?

  • Encriptación para el transito con SSL.
  • Encriptación para el destino de los datos con AES-256.
  • RedShift se hace cargo del manejo de las llaves.
  • También es posible manejar sus propias llaves con KSM (AWS Key Service Manager).

¿En dónde se encuentra disponible Amazon RedShift?

Actualmente solo esta disponible en un Availability Zone.

Puede ser restaurado a un nuevo Availability Zone cuando sucede un outage.