IBGE — Macroeconomia¶

O Instituto Brasileiro de Geografia e Estatística (IBGE) é a fonte oficial das estatísticas macroeconômicas do país. O SIDRA é o sistema central — milhares de séries temporais sobre PIB, inflação, emprego, comércio interno e demografia.

O desafio¶

SIDRA é a fonte mais rica do Brasil, mas consumi-la em escala enfrenta três obstáculos:

Instabilidade de rede — servidores governamentais sofrem rate limiting e downtime; HTTP 429/500 são frequentes; timeouts exigem backoff.
Complexidade paramétrica — a API usa URLs crípticas, codificadas por prefixos de letra (/t/1620/n1/all/v/116/p/all/d/m); construção manual é frágil.
Escala — 30 000+ tabelas; algumas séries cobrem 50+ anos com granularidade mensal/diária; classificações aninhadas; documentação espalhada em português.

Dois stacks: Exploração vs. Produção¶

O ecossistema fornece dois stacks complementares para SIDRA — escolha baseado em maturidade do pipeline e requisitos.

Stack 1 — Exploração (`sidra-fetcher`)¶

Para análise ad-hoc, notebooks Jupyter, lógica customizada e fetching on-demand. SDK Python com clientes sync (SidraClient) e async (AsyncSidraClient, ~3× mais rápido em multi-tabela).

graph LR
    A[API SIDRA] --> B[sidra-fetcher<br/>SDK sync/async]
    B --> C[Polars / pandas / Jupyter]

Stack 2 — Produção (`sidra-sql` + `sidra-pipelines`)¶

Para pipelines automatizados, data warehouses multi-usuário e definições declarativas. Motor ETL baseado em plugins que ingere SIDRA num star schema PostgreSQL com bulk load COPY FROM STDIN (400k+ rows/s) e SCD Type II para preservar revisões históricas.

graph LR
    A[API SIDRA] --> B[sidra-sql<br/>fetch + normalização + load]
    B --> C[(PostgreSQL<br/>star schema)]
    C --> D[Power BI / Metabase / SQL]

Dimensão	Stack 1	Stack 2
Setup	minutos (`pip install`)	~30 min (PostgreSQL + config)
Frequência	on-demand	horária / diária / semanal
Escala	uso pessoal, notebooks	multi-usuário, enterprise
Validação	manual	automatizada (constraints)
Auditoria	logging básico	SCD Type II completo
Transformação	Python (Polars)	SQL declarativo

Pacotes¶

sidra-fetcher — SDK sync/async para extração robusta, com smart caching via Last-Modified, classe Parametro para abstração de URL, e tipagem forte de metadados.
sidra-sql — motor ETL com plugins TOML (fetch.toml + transform.toml + transform.sql), bulk load COPY, schema relacional 5-tabelas, SCD Type II.
sidra-pipelines — catálogo pré-construído de pipelines production-ready (PIB, IPCA, população, agricultura). Deploy one-command via sidra-sql run std <pipeline>.

Os Princípios de Design do ecossistema — Resiliência, Performance, Reprodutibilidade, Sem Mágica — se aplicam diretamente aqui. Receitas táticas em Padrões Práticos: Concorrência para I/O, Auto-retry.

Próximos passos¶

Para análise rápida em notebook: vá para sidra-fetcher.
Para data warehouse PostgreSQL: vá para sidra-sql + sidra-pipelines.
Para combinar IBGE com outras fontes: veja a receita Análise Econômica Multi-Fonte.