Activités par an
Résumé
Web scraping (or Web crawling), a technique for automated data extraction from websites, has emerged as a valuable tool for scientific research and data analysis. This paper presents a comprehensive exploration of Web scraping, its methodologies and challenges.The discussion revolves around a concrete application, namely the automatic extraction of data concerning the Belgian real estate market. We introduce a real-time Web scraper called \scrimmo~and tailored to collect data from websites containing real estate classified ads. The tool is developed in a continuous iterative process and based on an innovative cloud architecture. The paper also briefly addresses the ethical aspects of Web scraping. By integrating insights from previous research and ethical guidelines, this study provides researchers with a comprehensive understanding of Web scraping and its potential benefits, while promoting responsible and ethical practices in data collection and analysis.
langue originale | Anglais |
---|---|
titre | Proceedings - 2023 22nd IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology, WI-IAT 2023 |
Pages | 335-338 |
Nombre de pages | 4 |
ISBN (Electronique) | 9798350309188 |
Les DOIs | |
Etat de la publication | Publié - oct. 2023 |
Evénement | The 22nd IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology - Venise, Italie Durée: 26 oct. 2023 → 29 oct. 2023 https://www.wi-iat.com/wi-iat2023/index.html |
Série de publications
Nom | Proceedings - 2023 22nd IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology, WI-IAT 2023 |
---|
Une conférence
Une conférence | The 22nd IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology |
---|---|
Titre abrégé | WI-IAT 2023 |
Pays/Territoire | Italie |
La ville | Venise |
période | 26/10/23 → 29/10/23 |
Adresse Internet |
Empreinte digitale
Examiner les sujets de recherche de « ScrImmo: A Real-time Web Scraper Monitoring the Belgian Real Estate Market ». Ensemble, ils forment une empreinte digitale unique.-
The 22nd IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology
Yernaux, G. (Participant)
26 oct. 2023 → 29 oct. 2023Activité: Participation ou organisation d'un événement › Participation à une conférence, un congrès
-
ScrImmo: A Real-time Web Scraper Monitoring the Belgian Real Estate Market
Yernaux, G. (Orateur)
2023Activité: Discours ou présentation › Présentation orale
Thèses de l'étudiant
-
L’extraction de données pour refléter les activités du marché immobilier namurois en temps réel et l’intégrer dans un système de support à la décision pour aider les collectivités locales à prendre des décisions informées
BARZIN, F. (Auteur) Vanhoof, W. (Promoteur) & Yernaux, G. (Copromoteur), 20 juin 2023Student thesis: Master types › Master en sciences informatiques
Fichier