📘 Como usar o Databricks Community Edition¶

1. Criar sua conta (gratuita)¶

Acesse community.cloud.databricks.com
Clique em Sign Up → Get started with Community Edition
Preencha e-mail, senha e informações básicas
Confirme o e-mail e faça login

Importante

O Databricks Community Edition tem um cluster que é encerrado automaticamente após 2 horas de inatividade. Sempre inicie o cluster antes de executar os notebooks.

2. Criar o Cluster¶

No menu lateral, clique em Compute
Clique em Create compute
Preencha:
Cluster name: lakehouse-cluster
Databricks Runtime: 13.3 LTS ou superior
Deixe o resto no padrão
Clique em Create compute
Aguarde o status ficar Running (verde)

3. Importar os Notebooks¶

Opção A — Via arquivo .py (upload direto)¶

No menu lateral, clique em Workspace
Navegue até sua pasta pessoal (ícone da casinha)
Clique no botão ⋮ → Import
Selecione File e faça upload do arquivo .py
Repita para cada notebook

Opção B — Via Git Repos (recomendado)¶

No menu lateral, clique em Repos
Clique em Add repo
Cole a URL do seu repositório GitHub
Clique em Create Repo
Os notebooks aparecem automaticamente na estrutura de pastas

4. Vincular o Notebook ao Cluster¶

Abra qualquer notebook
No topo, clique no dropdown de cluster (mostra "Detached")
Selecione seu cluster lakehouse-cluster
Aguarde conectar (o ícone fica verde)

5. Executar células¶

Ação	Atalho
Executar célula atual	`Shift + Enter`
Executar célula e criar nova abaixo	`Ctrl + Enter`
Executar todas as células	Clique em Run All no topo
Parar execução	Clique em Interrupt

6. Ver as tabelas no Catalog¶

No menu lateral, clique em Catalog
Expanda: workspace → bronze → Tables
Clique em uma tabela para ver o schema, amostras de dados e detalhes Delta

Visualização rápida

Para ver os dados de uma tabela sem abrir notebook, clique na tabela no Catalog e vá na aba Sample Data.

7. Solução de erros comuns¶

❌ `SCHEMA_NOT_FOUND: workspace.workspace`¶

Causa: O catálogo padrão está incorreto.
Solução: Adicione USE CATALOG workspace; no início do notebook, ou substitua workspace.landing pelo nome correto do seu catálogo.

❌ `Path does not exist: /Volumes/workspace/landing/dados/`¶

Causa: Os CSVs ainda não foram enviados para o Volume.
Solução: Siga o Guia de Upload de Arquivos.

❌ `Cluster terminated`¶

Causa: O cluster ficou inativo e foi desligado automaticamente.
Solução: Vá em Compute, clique no cluster e em Start.