Escrevendo e Executando Código Python
Deslize para mostrar o menu
Python é uma linguagem principal no Databricks utilizada para manipulação de dados, aprendizado de máquina e automação. Os notebooks do Databricks oferecem um ambiente interativo onde o código Python é escrito em células e executado em um cluster conectado.
Agora que seu notebook foi criado e está conectado a um cluster, você pode começar a escrever e executar código. Como os notebooks do Databricks são inspirados no Jupyter, a experiência será familiar caso você já tenha utilizado outros ambientes de programação.
Compreendendo as Células
O bloco fundamental de um notebook é a célula. Você pode ter quantas células desejar em um único notebook. Para criar uma nova célula, passe o mouse sobre a parte superior ou inferior de uma célula existente e clique no ícone "+" ao lado das opções Código ou Texto, estabelecendo uma célula de sua escolha.
- Entrada: digite seu código Python na caixa cinza;
- Saída: após a execução, os resultados (como tabelas de dados, textos impressos ou mensagens de erro) aparecem diretamente abaixo daquela célula específica.
Execução de Código
Existem três principais formas de executar uma célula Python no Databricks:
- Ícone de Play: clique no ícone "Executar Célula" (triângulo) no canto superior direito da célula;
- Shift + Enter: executa a célula atual e move automaticamente o cursor para a próxima célula (ou cria uma nova);
- Ctrl + Enter (Cmd + Enter no Mac): executa a célula atual e mantém o cursor dentro dela. Útil para testar e retestar o mesmo bloco de código.
Um Exercício Simples em Python
Você viu como trabalhar com variáveis no vídeo. Aqui está um exemplo mais interessante para testar se seu ambiente está funcionando: executar um cálculo simples. Copie o código a seguir em uma célula:
12345678910# Defining the variables price = 100 quantity = 5 tax_rate = 0.1 # Performing the calculation total_cost = (price * quantity) * (1 + tax_rate) # Printing the result print(f"The total cost of the items is: ${total_cost}")
Ao executar esta célula, o cluster processa as variáveis e exibe o texto: The total cost of the items is: $550.0.
Trabalhando com Variáveis entre Células
Um recurso fundamental do Databricks é a persistência de estado. Isso significa que, se você definir uma variável em uma célula, ela permanecerá disponível em todas as células subsequentes daquele notebook enquanto o cluster estiver em execução.
Por exemplo, se você criar uma nova célula abaixo da anterior e simplesmente digitar print(total_cost), o valor ainda será lembrado como 550.0. Se você reiniciar o cluster ou "Limpar Estado", será necessário executar novamente as células desde o início para reinicializar essas variáveis.
Comentários e Documentação
Em células Python, qualquer linha iniciada com # é um comentário. Esses comentários são ignorados pelo cluster, mas são essenciais para explicar sua lógica aos colegas de equipe. O uso de comentários permite manter padrões profissionais de código dentro do ambiente colaborativo do Workspace.
1. Qual atalho de teclado permite executar uma célula e permanecer na mesma célula?
2. O que acontece com uma variável definida na Célula 1 quando você tenta usá-la na Célula 2?
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo