single
Desafio: Filtrando Grandes Conjuntos de Dados
Deslize para mostrar o menu
Imagine que você precisa analisar um arquivo CSV massivo contendo milhões de registros—grande demais para ser carregado totalmente na memória de uma só vez. O objetivo é extrair apenas as linhas em que o valor de uma coluna específica excede um determinado limite, salvando os resultados filtrados em um novo arquivo. Esse cenário é comum em análises de dados em larga escala, onde o processamento eficiente e econômico em memória é essencial.
Deslize para começar a programar
Implemente uma função que processe um arquivo CSV grande em blocos e escreva apenas as linhas em que o valor da coluna especificada seja maior que o limite fornecido em um novo arquivo.
- Ler o arquivo CSV de entrada em blocos de tamanho
chunk_size. - Para cada bloco, filtrar as linhas em que a coluna especificada por
columnseja maior quethreshold. - Escrever todas as linhas filtradas no arquivo CSV de saída, incluindo a linha de cabeçalho.
- Se nenhuma linha corresponder à condição, escrever apenas o cabeçalho no arquivo de saída.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo