Clima e Meio Ambiente¶
Dados meteorológicos e climáticos históricos e em tempo real provenientes das estações automáticas e convencionais do INMET (Instituto Nacional de Meteorologia).
O desafio¶
Recuperar e unificar dados climáticos das mais de 500 estações brasileiras apresenta dificuldades recorrentes:
- Encoding inconsistente — os arquivos anuais compactados pelo INMET usam codificação
latin-1com marcas de ordem de byte (BOM) intermitentes, gerando erros de leitura. - Cabeçalhos variáveis — o formato dos arquivos CSV gerados pelas estações varia de ano para ano, possuindo metadados extras na parte superior e separadores de coluna inconsistentes (
,vs.;). - Valores nulos ocultos — o INMET registra a ausência de leitura meteorológica usando a sentinela
-9999. É necessário substituir explicitamente este valor por nulo para evitar erros de cálculo estatístico. - Data e hora separadas — as observações registram datas e horas em colunas diferentes, exigindo parse e unificação em um campo
datetimenativo. - Tipos de estações — a rede divide-se em estações automáticas (leituras horárias) e convencionais (leituras manuais diárias/periódicas), que não devem ser misturadas sem um tratamento de reamostragem temporal.
Pacotes¶
- inmet-fetcher — Downloader e parser para o BDMEP (Banco de Dados Meteorológicos para Ensino e Pesquisa). Permite a sincronização paralela de arquivos anuais e a exportação direta em arquivos consolidados Parquet, CSV ou JSON com colunas normalizadas em
snake_casee tipos de dados limpos.
Próximos passos¶
- Para começar a baixar dados climáticos: vá para inmet-fetcher.
- Para cruzar temperatura e chuva com índices de preços agrícolas: veja o cookbook Estiagem no Nordeste × Preços.
- Para entender as vantagens de usar arquivos Parquet na análise climatológica: consulte o tutorial Parquet + Polars.