Ir para o conteúdo

📓 Notebook 004 — Camada Gold (Modelagem Dimensional)

Arquivo: notebooks/004_gold.py

Objetivo

Criar o Star Schema seguindo a metodologia Ralph Kimball, populando dimensões e tabela fato a partir dos dados Silver.

Tabelas criadas

Tabela Tipo Linhas Esperadas
gold.dim_carro Dimensão 40
gold.dim_tempo Dimensão ~1.461 (2023–2026)
gold.dim_cliente Dimensão 20
gold.dim_localidade Dimensão 20
gold.fato_sinistro Fato ~80 (agrupado)

Estratégia MERGE (SCD Type 1)

Todas as dimensões são carregadas com MERGE INTO:

MERGE INTO gold.dim_cliente AS d
USING cliente_relacional    AS r
ON r.CODIGO_CLIENTE = d.CODIGO_CLIENTE

WHEN MATCHED AND (r.nome <> d.nome OR ...) THEN
  UPDATE SET ...

WHEN NOT MATCHED THEN
  INSERT (CODIGO_CLIENTE, NOME, ...)
  VALUES (r.CODIGO_CLIENTE, r.NOME, ...)

Queries analíticas incluídas

  • Top 10 localidades com mais sinistros
  • Sinistros por ano e mês