AWSREDSHIFT - TUTORIEL AWS

Redshift est un service d'entrepôt de données rapide et puissant, entièrement géré, à l'échelle du pétaoctet, dans le cloud.
Les clients peuvent utiliser Redshift pour seulement 0,25 $ par heure, sans engagement ni frais initiaux, et évoluer jusqu'à un pétaoctet ou plus pour 1 000 $ par téraoctet et par an.

OLAP

OLAP est un Système de traitement d'analyse en ligne utilisé par le Redshift .

Exemple de transaction OLAP :

Supposons que nous souhaitions calculer le bénéfice net pour la région EMEA et Pacifique pour le produit radio numérique. Cela nécessite d'extraire un grand nombre d'enregistrements. Voici les enregistrements requis pour calculer un bénéfice net :

Somme des radios vendues dans la région EMEA.
Somme des radios vendues dans le Pacifique.
Coût unitaire de la radio dans chaque région.
Prix de vente de chaque radio
Prix de vente - coût unitaire

Les requêtes complexes sont nécessaires pour récupérer les enregistrements indiqués ci-dessus. Les bases de données d'entreposage de données utilisent différents types d'architecture, à la fois du point de vue de la base de données et de la couche d'infrastructure.

Configuration du décalage rouge

Redshift se compose de deux types de nœuds :

Nœud unique Multi-nœuds

Nœud unique : Un seul nœud stocke jusqu'à 160 Go.

Multi-nœuds : Un multi-nœud est un nœud composé de plusieurs nœuds. Il est de deux types :

Comprenons le concept de nœud leader et de nœuds de calcul à travers un exemple.

L'entrepôt Redshift est un ensemble de ressources informatiques appelées nœuds, et ces nœuds sont organisés en un groupe appelé cluster. Chaque cluster s'exécute dans un moteur Redshift qui contient une ou plusieurs bases de données.

Lorsque vous lancez une instance Redshift, elle démarre avec un seul nœud de taille 160 Go. Lorsque vous souhaitez vous développer, vous pouvez ajouter des nœuds supplémentaires pour profiter du traitement parallèle. Vous disposez d'un nœud leader qui gère les multiples nœuds. Le nœud leader gère la connexion client ainsi que les nœuds de calcul. Il stocke les données dans les nœuds de calcul et exécute la requête.

Pourquoi Redshift est 10 fois plus rapide

Redshift est 10 fois plus rapide pour les raisons suivantes :

Fonctionnalités de Redshift

Les fonctionnalités de Redshift sont indiquées ci-dessous :

types d'arbres binaires

TechCodeview

Qu’est-ce que Redshift ?

Configuration du décalage rouge

Fonctionnalités de Redshift