L’extraction de données pour refléter les activités du marché immobilier namurois en temps réel et l’intégrer dans un système de support à la décision pour aider les collectivités locales à prendre des décisions informées

  • Félix BARZIN

Student thesis: Master typesMaster en sciences informatiques

Résumé

La récolte de données grâce aux méthodes de scraping est un procédé incontournable pour les études et la recherche en général. En effet, il permet de réaliser ce qu’aucune autre méthode ne propose : récolter des informations non structurées, de manière automatisée, en grand nombre, à un coût dérisoire et en temps réel. Nous verrons que la qualité des données peut parfois être questionnable, mais qu’il existe des moyens pour leur donner une certaine légitimité. Pour y parvenir, il est important de procéder à un traitement humain efficace tout au long du processus de récolte ainsi qu’une validation des résultats sur base d’une comparaison avec des sources conventionnelles et officielles. De plus, nous verrons que l’analyse exploratoire permet de comprendre les données, détecter les anomalies et les valeurs aberrantes. Après certaines étapes d’analyse et de conception rigoureuse, nous serons en possession d’un jeu de données très complet et reflétant la réalité. Nous verrons alors qu’il existe de nombreuses applications pratiques comme, par exemple, la conception d’un système d’aide et de support à la décision utilisable et efficace. Le scraping pose néanmoins des questions éthiques qui sont toujours en suspens. Il existe des éléments à prendre en considération afin de ne nuire à personne lorsqu’on souhaite procéder à une récolte de données. Nous aborderons cette thématique au cours de ce mémoire et évoquerons le besoin de définir un cadre légal explicite.
la date de réponse20 juin 2023
langue originaleFrançais
L'institution diplômante
  • Universite de Namur
SuperviseurWim Vanhoof (Promoteur) & Gonzague Yernaux (Copromoteur)

mots-clés

  • web scraping
  • data mining
  • big data
  • traitement des données
  • analyse statistique
  • machine learning
  • temps réel
  • qualité des données
  • éthiques
  • système d’aide à la décision.

Contient cette citation

'