Scrittura ed Esecuzione di Codice Python
Scorri per mostrare il menu
Python è un linguaggio principale in Databricks utilizzato per la manipolazione dei dati, il machine learning e l'automazione. I notebook di Databricks offrono un ambiente interattivo in cui il codice Python viene scritto nelle celle ed eseguito su un cluster connesso.
Ora che il tuo notebook è stato creato e collegato a un cluster, puoi iniziare a scrivere ed eseguire codice. Poiché i notebook di Databricks sono ispirati a Jupyter, l'esperienza sarà familiare se hai già utilizzato altri ambienti di sviluppo.
Comprendere le celle
L'elemento fondamentale di un notebook è la cella. Puoi avere tutte le celle che desideri in un singolo notebook. Per creare una nuova cella, passa il mouse sopra o sotto una cella esistente e fai clic sull'icona "+" accanto all'opzione Code o Text, creando così una cella a tua scelta.
- Input: digitazione del codice Python nella casella grigia;
- Output: una volta eseguito, i risultati (come tabelle di dati, testo stampato o messaggi di errore) appaiono direttamente sotto quella specifica cella.
Esecuzione del codice
Esistono tre modi principali per eseguire una cella Python in Databricks:
- Icona Play: clic sull'icona "Esegui cella" (triangolo) nell'angolo in alto a destra della cella;
- Shift + Invio: esegue la cella corrente e sposta automaticamente il cursore sulla cella successiva (o ne crea una nuova);
- Ctrl + Invio (Cmd + Invio su Mac): esegue la cella corrente e mantiene il cursore al suo interno. Utile durante test e ripetute esecuzioni dello stesso blocco di codice.
Un semplice esercizio Python
Hai visto come lavorare con le variabili nel video. Ecco un esempio più interessante per verificare che il tuo ambiente funzioni: eseguire un semplice calcolo. Copia il seguente codice in una cella:
12345678910# Defining the variables price = 100 quantity = 5 tax_rate = 0.1 # Performing the calculation total_cost = (price * quantity) * (1 + tax_rate) # Printing the result print(f"The total cost of the items is: ${total_cost}")
Quando esegui questa cella, il cluster elabora le variabili e visualizza il testo: The total cost of the items is: $550.0.
Utilizzo delle variabili tra le celle
Una caratteristica fondamentale di Databricks è la persistenza dello stato. Questo significa che se si definisce una variabile in una cella, essa rimane disponibile in tutte le celle successive di quel notebook finché il cluster è attivo.
Ad esempio, se si crea una nuova cella sotto quella precedente e si digita semplicemente print(total_cost), il valore sarà ancora 550.0. Se si riavvia il cluster o si seleziona "Clear State", sarà necessario eseguire nuovamente le celle dall'inizio per re-inizializzare tali variabili.
Commenti e documentazione
Nelle celle Python, qualsiasi riga che inizia con # è un commento. Questi vengono ignorati dal cluster ma sono fondamentali per spiegare la logica ai colleghi. L'utilizzo dei commenti consente di mantenere standard professionali del codice all'interno dell'ambiente collaborativo del Workspace.
1. Quale scorciatoia da tastiera permette di eseguire una cella e restare all'interno della stessa cella?
2. Cosa succede a una variabile definita nella Cella 1 quando provi a usarla nella Cella 2?
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione