Contenu du cours
Extraction de Données Web avec Python
Extraction de Données Web avec Python
3. Travailler avec les Attributs d'Élément dans Beautiful Soup
Qu'est-ce Que HTML?
Avant de continuer, il est essentiel de comprendre le concept de HTML et son fonctionnement.
Par exemple, jetez un œil à la page web affichée ci-dessous, accessible via le lien suivant.
La structure HTML de la page est la suivante:
index.html
Approfondissons quelques explications. Chaque balise HTML est encadrée par des chevrons, avec un crochet gauche <
et un crochet droit >
. La plupart des balises HTML sont conçues par paires, comprenant à la fois une balise ouvrante et une balise fermante. Les balises fermantes sont précédées d'une barre oblique /
.
Dans le schéma fourni ci-dessus, nous avons utilisé les balises suivantes:
<html>
- définit un document html (balise obligatoire pour chaque document);<title>
- définit un titre de page (affiché dans la barre d'onglets);<body>
- définit le corps du document;<h2>
- définit le deuxième niveau du titre (6 niveaux sont disponibles :<h1>
-<h6>
);<p>
- définit un paragraphe.
Tout était clair ?
Merci pour vos commentaires !
Section 1. Chapitre 2