Stockage et traitement des données

  • Augustin Nollevaux

Student thesis: Master typesMaster en ingénieur de gestion à finalité spécialisée en data science

Résumé

L’objectif de ce cours est de fournir une présentation globale du Big Data. Il se différencie de la Business Intelligence traditionnelle par les données qu’il traite : des données très volumineuses (Volume), très variés et non-structurées (Variété) à une plus grande vitesse (Vélocité), on appelle ce nouveau paradigme de données les 3V du Big Data. L’objectif du Big Data est de pouvoir stocker, traiter et analyser les données du 3V pour en extraire des connaissances qui apportent de la valeur à une entreprise. La gestion de ces nouveaux types de données implique l’utilisation de nouvelles méthodes et outils tout le long du cycle de la donnée.
L’architecture du Big Data consiste un système distribué sur un très large clusters de machines qui repose sur une infrastructure physique distribué, un système de fichiers distribués (HDFS) , des bases de données distribuées (NoSQL) et un système de traitement de la donnée distribué (calculs parallèles : MapReduce). Cette distribution des données a plusieurs objectifs : stocker de plus grandes quantités de données, améliorer la performance des opérations (répartition de la charge de calcul à travers plusieurs noeuds) et l’amélioration de différents besoins non-fonctionnels (disponibilité, résilience, etc.).
Nous avons présenté les quatre grandes familles de bases de données NoSQL : clé-valeur, colonnes, document et graphe; les implications de celles-ci (modèle de consistance ACID vs BASE, théorème du CAP, extensibilité horizontale, etc.) ainsi qu’un tableau de comparaison permettant d’aider dans la prise de décision du choix d’une base de données
la date de réponse2022
langue originaleFrançais
L'institution diplômante
  • Universite de Namur
SuperviseurStephane Faulkner (Jury)

mots-clés

  • Big Data
  • NoSQL
  • Hadoop
  • MapReduce
  • architecture Big Data
  • stockage Big Data

Contient cette citation

'