Skrive og Kjøre Python-kode
Sveip for å vise menyen
Python er et hovedspråk i Databricks som brukes til datamanipulering, maskinlæring og automatisering. Databricks-notatbøker gir et interaktivt miljø hvor Python-kode skrives i celler og kjøres mot en tilkoblet klynge.
Nå som notatboken din er opprettet og koblet til en klynge, kan du begynne å skrive og kjøre kode. Fordi Databricks-notatbøker er inspirert av Jupyter, vil opplevelsen føles kjent hvis du har brukt andre kodeomgivelser.
Forståelse av celler
Byggeklossen i en notatbok er cellen. Du kan ha så mange celler du ønsker i en enkelt notatbok. For å opprette en ny celle, hold musepekeren over toppen eller bunnen av en eksisterende celle og klikk på "+"-ikonet ved siden av enten Kode- eller Tekst-alternativet, og opprett en celle etter eget valg.
- Inndata: du skriver Python-koden din i den grå boksen;
- Utdata: når koden er kjørt, vises resultatene (for eksempel datatabeller, utskrevet tekst eller feilmeldinger) rett under den aktuelle cellen.
Kjøre kode
Det finnes tre hovedmåter å kjøre en Python-celle i Databricks på:
- Spill-ikonet: klikk på "Kjør celle" (trekanten) øverst til høyre i cellen;
- Shift + Enter: dette kjører den gjeldende cellen og flytter automatisk markøren til neste celle (eller oppretter en ny);
- Ctrl + Enter (Cmd + Enter på Mac): dette kjører den gjeldende cellen og lar markøren bli i cellen. Dette er nyttig når du tester og retester samme kodeblokk.
En enkel Python-øvelse
Du så hvordan du kan arbeide med variabler i videoen. Her er et mer interessant eksempel for å teste at miljøet ditt fungerer: kjøre en enkel beregning. Kopier følgende kode inn i en celle:
12345678910# Defining the variables price = 100 quantity = 5 tax_rate = 0.1 # Performing the calculation total_cost = (price * quantity) * (1 + tax_rate) # Printing the result print(f"The total cost of the items is: ${total_cost}")
Når du kjører denne cellen, vil klyngen behandle variablene og vise teksten: The total cost of the items is: $550.0.
Arbeide med variabler på tvers av celler
En sentral funksjon i Databricks er tilstandsbevaring. Dette betyr at hvis du definerer en variabel i én celle, vil den være tilgjengelig i alle påfølgende celler i notatboken så lenge klyngen kjører.
For eksempel, hvis du oppretter en ny celle under den forrige og bare skriver print(total_cost), vil den fortsatt huske at verdien var 550.0. Hvis du starter klyngen på nytt eller "Clear State", må du kjøre cellene på nytt fra toppen for å initialisere variablene igjen.
Kommentarer og dokumentasjon
I Python-celler er enhver linje som starter med # en kommentar. Disse ignoreres av klyngen, men er viktige for å forklare logikken din til teammedlemmer. Ved å bruke kommentarer kan du opprettholde profesjonelle kodestandarder i det samarbeidsbaserte miljøet i Workspace.
1. Hvilken hurtigtast lar deg kjøre en celle og forbli i samme celle?
2. Hva skjer med en variabel definert i Celle 1 når du prøver å bruke den i Celle 2?
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår