Contenu du cours
Extraction de Données Web avec Python
Extraction de Données Web avec Python
3. Travailler avec les Attributs d'Élément dans Beautiful Soup
Structure HTML
Repassons en revue le chapitre précédent dans lequel nous avons abordé une page HTML basique ainsi que son code correspondant.
index.html
Contrairement à Python, l'indentation n'est pas obligatoire en HTML, mais elle est fortement recommandée. Dans le code fourni ci-dessus, vous pouvez observer plusieurs niveaux d'imbrication des balises. Par exemple, les éléments <h2>
et <p>
sont imbriqués à l'intérieur de l'élément <body>
. Dans ce contexte, les balises <h2>
et <p>
sont considérées comme enfants de l'élément <body>
, qui sert de parent <body>
. Nous pouvons représenter la structure de ce document comme suit.
Tout était clair ?
Merci pour vos commentaires !
Section 1. Chapitre 3