Datoer og Tidspunkter
Stryg for at vise menuen
Ved arbejde med datasæt fra den virkelige verden vil du ofte støde på dato- og tidsinformation, der er gemt som almindelig tekst. For at analysere eller manipulere disse datoer skal du konvertere dem til et datetime-format, som Polars kan forstå. I dette kapitel lærer du, hvordan du parser release_date-strenge til datetime og udtrækker udgivelsesåret ved hjælp af .dt-navnerummet.
Antag, at du har en DataFrame med en kolonne kaldet release_date, hvor hver værdi er en streng som "2015-07-14". For at arbejde med disse som datoer skal du først konvertere kolonnen til en datetime-type. Derefter kan du udtrække nyttig information, såsom året, ved hjælp af Polars' kraftfulde .dt-adgang.
12345678910111213141516171819import polars as pl # Sample DataFrame with string dates df = pl.DataFrame({ "title": ["Movie A", "Movie B", "Movie C"], "release_date": ["2015-07-14", "2018-03-22", "2020-11-05"] }) # Convert 'release_date' to datetime df = df.with_columns( pl.col("release_date").str.strptime(pl.Date, "%Y-%m-%d").alias("release_date_dt") ) # Extract the release year as a new column df = df.with_columns( pl.col("release_date_dt").dt.year().alias("release_year") ) print(df)
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat