Apache Cassandra est la base de données NoSQL de reference pour les architectures qui doivent absorber des volumes massifs de donnees avec une disponibilite maximale. Cette formation vous donne les cles pour installer, configurer et administrer un cluster Cassandra en production. Vous apprendrez le langage CQL, les strategies de partitionnement et de replication, ainsi que les bonnes pratiques de modelisation orientee colonnes.
Public visé
Chefs de projets, administrateurs de bases de données, développeurs et architectes.
Objectifs pédagogiques
À l’issue de cette formation, vous serez capable de :
- Installer et administrer des bases de données NoSQL Apache Cassandra
- Décrire l’architecture de Cassandra et ses avantages comparatifs
- Installer et configurer le SGBD
- Administrer et sécuriser un cluster
- Définir et utiliser le CQL (Cassandra Query Language)
- Créer une base de données et manipuler ses objets
- Expliquer la notion de grappe dans la base de données
Programme
Découvrir l’architecture de NoSQL Apache Cassandra et ses apports par rapport aux autres solutions
- Introduction
- Historique, fonctionnalités de Cassandra, licence
- Format des données, “key-value”, traitement de volumes importants, haute disponibilité, système réparti de base de données…
Installer et configurer le SGBD NoSQL Apache Cassandra
- Installation et configuration
- Prérequis
- Plateformes supportées
- Etude du fichier de configuration : conf/cassandra.yaml
- Répertoire de travail, de stockage des données, gestion de la mémoire
Travaux pratiques
- Ateliers : démarrage d’un noeud et test de l’interface cliente “cqlsh”
Appréhender le CQL (Cassandra Query Language)
- Commandes de base :
- Connexion au système de base de données
- Création de colonnes
- Insertion
- Modification
- Recherche
- Le CQL : Cassandra Query Language
- Limitations du CQL
Créer une base de données et manipuler ses objets
- Utilisation de Cassandra
- Création de bases et interrogation avec CQL
- Définition de la notion de consistance
- Eléments en jeu :
- Commit.log
- Memtable
- Quorum
- Comment écrire des requêtes ?
- Approches
Travaux pratiques
- Ateliers : premiers pas avec une base de données Cassandra pré-chargée et mise à disposition sur l’infrastructure de travaux pratiques
Connaître la notion de grappe au sein de la base de données
- Gestion de la grappe
- Principe et configuration des noeuds
- Notion de bootstrapping et de token
- Paramètres de démarrage des noeuds
- Réplication : topologie du réseau et “endpoint snitch”
- Stratégie de réplication
- Méthode d’ajout de noeuds et suppression
- Architecture de stockage mémoire et disque dur, gestion des tombstones, bloom filter
Travaux pratiques
- Atelier : mise en place d’une configuration de production (multi Data Centers, multi-racks)
Administrer et sécuriser un cluster Cassandra
- Exploitation
- Gestion des noeuds Cassandra
- Sauvegardes, snapshots et export au format JSON
- Principe de cohérence, hinted_handoff, digest request et read repair
- Sécurité
- Gestion des rôles et des autorisations sur une application standard
Travaux pratiques
- Ateliers : paramétrage, authentification et sécurisation de la base system_auth
Support Hadoop et Spark
- Principe de map/reduce
- Implémentation Hadoop et intégration Hadoop / Cassandra
- Support Spark : description rapide de l’architecture Spark
Travaux pratiques
- Ateliers :
- Mise en oeuvre depuis Cassandra
- Exécution d’application Spark s’appuyant sur une grappe Cassandra
Supervision et performances
- Prometheus : apports et particularité de Prometheus pour la supervision Cassandra
- Supervision avec nodetool
- Principe des accès JMX, exports JMX vers des outils de supervision
- Performance : présentation de l’outil de test de performance Cassandra-stress
Travaux pratiques
- Ateliers :
- Démonstration avec Prometheus et Grafana
- Mise en place d’un plan de stress et paramétrage
Modalités d’évaluation des acquis
En cours de formation, par des études de cas ou des travaux pratiques. En fin de formation, par un questionnaire d’auto-évaluation.
Voir aussi
Vous serez peut-être intéressés par les formations suivantes :
- MongoDB - Mise en œuvre et administration
- MongoDB - Pour les developpeurs
- Neo4j - Initiation
- Redis - Base de données en mémoire
Formation DBS-CASSANDRA-100 — Cassandra - Initiation. Domaine : Base de données. Niveau : Initiation. Durée : 3 jours (21 heures). Mots-clés : cassandra, base-de-données, nosql, initiation, administration, colonne. Cylian Formation, Dijon.