Åpning av HTML-fil
Du er allerede kjent med det grunnleggende om HTML, så nå skal du utforske den første metoden for å arbeide med det i Python.
Et av modulene du kan bruke for å håndtere HTML-filer i Python er urllib.request. Du må import metoden urlopen for å få tilgang til nettsider. Oppgi ganske enkelt URL-en til siden du ønsker å åpne som en parameter til denne metoden.
1234567# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) print(page)
Som vist i eksemplet ovenfor, er resultatet et http.client.HTTPResponse-objekt, som ikke er ønsket utdata. For å hente ut HTML-strukturen, bruk metodene .read() og .decode('utf-8') på objektet du mottok.
Delen decode("utf-8") brukes for å konvertere rå binærdata til en lesbar streng, forutsatt at nettsidens innhold er kodet med UTF-8. Denne konverteringen gjør det mulig å arbeide med tekstdataen på nettsiden på en meningsfull måte, for eksempel ved å analysere eller tolke innholdet.
1234567891011# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") print(type(web_page)) print(web_page)
Som et resultat av å bruke metodene .read() og .decode(), får du en streng. Denne strengen inneholder HTML-strukturen på en godt formatert måte, noe som gjør den lett å lese og lar deg bruke strengmetoder på den.
Hvis ikke .decode()-metoden ble brukt, ville du motta et bytes-objekt med hele HTML-siden representert som én streng med spesifikke tegn. Prøv gjerne å eksperimentere med dette!
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 4.35
Åpning av HTML-fil
Sveip for å vise menyen
Du er allerede kjent med det grunnleggende om HTML, så nå skal du utforske den første metoden for å arbeide med det i Python.
Et av modulene du kan bruke for å håndtere HTML-filer i Python er urllib.request. Du må import metoden urlopen for å få tilgang til nettsider. Oppgi ganske enkelt URL-en til siden du ønsker å åpne som en parameter til denne metoden.
1234567# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) print(page)
Som vist i eksemplet ovenfor, er resultatet et http.client.HTTPResponse-objekt, som ikke er ønsket utdata. For å hente ut HTML-strukturen, bruk metodene .read() og .decode('utf-8') på objektet du mottok.
Delen decode("utf-8") brukes for å konvertere rå binærdata til en lesbar streng, forutsatt at nettsidens innhold er kodet med UTF-8. Denne konverteringen gjør det mulig å arbeide med tekstdataen på nettsiden på en meningsfull måte, for eksempel ved å analysere eller tolke innholdet.
1234567891011# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") print(type(web_page)) print(web_page)
Som et resultat av å bruke metodene .read() og .decode(), får du en streng. Denne strengen inneholder HTML-strukturen på en godt formatert måte, noe som gjør den lett å lese og lar deg bruke strengmetoder på den.
Hvis ikke .decode()-metoden ble brukt, ville du motta et bytes-objekt med hele HTML-siden representert som én streng med spesifikke tegn. Prøv gjerne å eksperimentere med dette!
Takk for tilbakemeldingene dine!