Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Skrive og Kjøre Python-kode | Notebook-opplevelsen
Databricks Grunnleggende: En Nybegynnerguide

Skrive og Kjøre Python-kode

Sveip for å vise menyen

Note
Definisjon

Python er et hovedspråk i Databricks som brukes til datamanipulering, maskinlæring og automatisering. Databricks-notatbøker gir et interaktivt miljø hvor Python-kode skrives i celler og kjøres mot en tilkoblet klynge.

Nå som notatboken din er opprettet og koblet til en klynge, kan du begynne å skrive og kjøre kode. Fordi Databricks-notatbøker er inspirert av Jupyter, vil opplevelsen føles kjent hvis du har brukt andre kodeomgivelser.

Forståelse av celler

Byggeklossen i en notatbok er cellen. Du kan ha så mange celler du ønsker i en enkelt notatbok. For å opprette en ny celle, hold musepekeren over toppen eller bunnen av en eksisterende celle og klikk på "+"-ikonet ved siden av enten Kode- eller Tekst-alternativet, og opprett en celle etter eget valg.

  • Inndata: du skriver Python-koden din i den grå boksen;
  • Utdata: når koden er kjørt, vises resultatene (for eksempel datatabeller, utskrevet tekst eller feilmeldinger) rett under den aktuelle cellen.

Kjøre kode

Det finnes tre hovedmåter å kjøre en Python-celle i Databricks på:

  • Spill-ikonet: klikk på "Kjør celle" (trekanten) øverst til høyre i cellen;
  • Shift + Enter: dette kjører den gjeldende cellen og flytter automatisk markøren til neste celle (eller oppretter en ny);
  • Ctrl + Enter (Cmd + Enter på Mac): dette kjører den gjeldende cellen og lar markøren bli i cellen. Dette er nyttig når du tester og retester samme kodeblokk.

En enkel Python-øvelse

Du så hvordan du kan arbeide med variabler i videoen. Her er et mer interessant eksempel for å teste at miljøet ditt fungerer: kjøre en enkel beregning. Kopier følgende kode inn i en celle:

12345678910
# Defining the variables price = 100 quantity = 5 tax_rate = 0.1 # Performing the calculation total_cost = (price * quantity) * (1 + tax_rate) # Printing the result print(f"The total cost of the items is: ${total_cost}")

Når du kjører denne cellen, vil klyngen behandle variablene og vise teksten: The total cost of the items is: $550.0.

Arbeide med variabler på tvers av celler

En sentral funksjon i Databricks er tilstandsbevaring. Dette betyr at hvis du definerer en variabel i én celle, vil den være tilgjengelig i alle påfølgende celler i notatboken så lenge klyngen kjører.

For eksempel, hvis du oppretter en ny celle under den forrige og bare skriver print(total_cost), vil den fortsatt huske at verdien var 550.0. Hvis du starter klyngen på nytt eller "Clear State", må du kjøre cellene på nytt fra toppen for å initialisere variablene igjen.

Kommentarer og dokumentasjon

I Python-celler er enhver linje som starter med # en kommentar. Disse ignoreres av klyngen, men er viktige for å forklare logikken din til teammedlemmer. Ved å bruke kommentarer kan du opprettholde profesjonelle kodestandarder i det samarbeidsbaserte miljøet i Workspace.

1. Hvilken hurtigtast lar deg kjøre en celle og forbli i samme celle?

2. Hva skjer med en variabel definert i Celle 1 når du prøver å bruke den i Celle 2?

question mark

Hvilken hurtigtast lar deg kjøre en celle og forbli i samme celle?

Velg det helt riktige svaret

question mark

Hva skjer med en variabel definert i Celle 1 når du prøver å bruke den i Celle 2?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 2

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 3. Kapittel 2
some-alt