L'Expertise Informatique, Simplifiée

Web scraping avec Python

Récoltez les données du web, automatiquement.

La collecte automatisée de données web est un levier stratégique pour la veille concurrentielle, l’analyse de marché et l’alimentation de pipelines data. Cette formation couvre l’ensemble du spectre du web scraping en Python, des outils simples comme BeautifulSoup aux frameworks complets comme Scrapy, en passant par Selenium pour les sites dynamiques. Vous apprendrez aussi à gérer les aspects techniques avancés : parallélisation, authentification et CAPTCHAs.

Public visé

Développeurs, Data Scientists, Data Analysts, Data Engineers, chefs de projets.

Prérequis

Avoir suivi cette formation, ou en maîtriser les thèmes abordés :

Objectifs pédagogiques

À l’issue de cette formation, vous serez capable de :

Programme

Jour 1

Les fondamentaux du Web scraping

Travaux pratiques

Analyse HTML avancée

Travaux pratiques

Introduction à Scrapy

Travaux pratiques

Jour 2

Scraping avancé

Travaux pratiques

Crawling à travers des formulaires et interfaces de login

Travaux pratiques

Scraping sur du code JavaScript

Jour 3

Scraping sur des API

Gérer les CAPTCHA avec la reconnaissance d’images et de texte

Travaux pratiques

Parallélisation du Web scraping

Travaux pratiques

Modalités d’évaluation des acquis

En cours de formation, par des travaux pratiques. En fin de formation, par un questionnaire d’auto-évaluation.

Voir aussi

Vous serez peut-être intéressés par les formations suivantes :

Formation DEV-PYTHON-310 — Web scraping avec Python. Domaine : Développement. Niveau : Avancé. Durée : 3 jours (21 heures). Mots-clés : python, web-scraping, beautifulsoup, scrapy, selenium, data. Cylian Formation, Dijon.