Operações Básicas de Dados no Polars
Deslize para mostrar o menu
Ao trabalhar com grandes conjuntos de dados, a manipulação eficiente dos dados é essencial. A biblioteca polars foi desenvolvida para operações de dados de alto desempenho, tornando-se uma escolha popular para lidar com grandes volumes de dados em Python. Neste capítulo, você aprenderá como carregar dados, selecionar colunas específicas e filtrar linhas utilizando o polars. Essas ações básicas formam a base para transformações de dados mais complexas.
A tabela abaixo resume as principais funções do polars para realizar essas operações básicas.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
Neste código, a biblioteca polars é importada e a função pl.read_csv() é utilizada para carregar dados de um arquivo chamado "data/people.csv". O DataFrame resultante é armazenado na variável df. Ao chamar df.head(), são exibidas as primeiras cinco linhas do DataFrame, o que é útil para inspecionar rapidamente os dados após o carregamento.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Aqui, o método select() é utilizado para escolher apenas as colunas "name" e "age" do DataFrame. Isso cria um novo DataFrame chamado selected contendo somente essas colunas. Selecionar colunas é uma operação comum quando se deseja focar em partes específicas dos dados para análises posteriores.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo