Redshift (Análisis de datos escalable en AWS) de Redshift (Análisis de datos escalable en AWS)

Redshift (Análisis de datos escalable en AWS)

☀ ¿Cuáles son las características de Amazon RedShift?

  • Es una base de datos rápida, fully managed (administrada), peta-scale (soporta enormes cantidades de datos) y data warehouse (en data centers).
  • Puede iniciar desde $0.25 dlls por hora sin contratos a tiempo específico.
  • Puede escalar hasta petabytes o mas por $1000 por terabyte por año.
  • Cuesta menos que un décimo de la mayoría de los servicios similares de warehousing.
  • Columnar, es decir organiza los datos en forma de columnas.
  • Utiliza compresión avanzada.
  • Procesamiento en paralelo masivo (distribuye queries a través de diferentes nodos).

☆ Online Analytic Processing (OLA)

Con redshift es posible iniciar con un simple nodo de 160G.

☀ Multinodo

Leader Node (Nodo Líder)

Maneja las conexiones de los clientes y recibe los queries.

Compute Node (Nodo de Computo)

Almacena y ejecuta queries y computo (Hasta 128 nodos de computo).

Redshift a diferencia de las bases de datos relacionales comunes, no organiza los datos en forma de filas sino de columnas. Los sistemas basados en columnas son ideales para data ware housing y análisis de datos, en donde las queries involucran consultas realizadas en largos bloques de datos.

☆ ¿Cuáles son los costos del uso de Amazon RedShift?

  • Nodos de computo por horas (el número de horas que se realice computo por parte de los nodos por el periodo de cobro).
  • No se cobran cargos por el nodo leader, solo por los nodos de computo.
  • Cargos por backups.
  • Cargos por transferencia de datos (solo dentro del VPC no hacia afuera).

☆ ¿Cuáles son los criterios de seguridad en Amazon RedShift?

  • Encriptación para el transito con SSL.
  • Encriptación para el destino de los datos con AES-256.
  • RedShift se hace cargo del manejo de las llaves.
  • También es posible manejar sus propias llaves con KSM (AWS Key Service Manager).

☆ ¿En dónde se encuentra disponible Amazon RedShift?

Actualmente solo esta disponible en un Availability Zone.

Puede ser restaurado a un nuevo Availability Zone cuando sucede un outage.