📘 Como usar o Databricks Community Edition¶
1. Criar sua conta (gratuita)¶
- Acesse community.cloud.databricks.com
- Clique em Sign Up → Get started with Community Edition
- Preencha e-mail, senha e informações básicas
- Confirme o e-mail e faça login
Importante
O Databricks Community Edition tem um cluster que é encerrado automaticamente após 2 horas de inatividade. Sempre inicie o cluster antes de executar os notebooks.
2. Criar o Cluster¶
- No menu lateral, clique em Compute
- Clique em Create compute
- Preencha:
- Cluster name:
lakehouse-cluster - Databricks Runtime:
13.3 LTSou superior - Deixe o resto no padrão
- Clique em Create compute
- Aguarde o status ficar Running (verde)
3. Importar os Notebooks¶
Opção A — Via arquivo .py (upload direto)¶
- No menu lateral, clique em Workspace
- Navegue até sua pasta pessoal (ícone da casinha)
- Clique no botão ⋮ → Import
- Selecione File e faça upload do arquivo
.py - Repita para cada notebook
Opção B — Via Git Repos (recomendado)¶
- No menu lateral, clique em Repos
- Clique em Add repo
- Cole a URL do seu repositório GitHub
- Clique em Create Repo
- Os notebooks aparecem automaticamente na estrutura de pastas
4. Vincular o Notebook ao Cluster¶
- Abra qualquer notebook
- No topo, clique no dropdown de cluster (mostra "Detached")
- Selecione seu cluster
lakehouse-cluster - Aguarde conectar (o ícone fica verde)
5. Executar células¶
| Ação | Atalho |
|---|---|
| Executar célula atual | Shift + Enter |
| Executar célula e criar nova abaixo | Ctrl + Enter |
| Executar todas as células | Clique em Run All no topo |
| Parar execução | Clique em Interrupt |
6. Ver as tabelas no Catalog¶
- No menu lateral, clique em Catalog
- Expanda:
workspace → bronze → Tables - Clique em uma tabela para ver o schema, amostras de dados e detalhes Delta
Visualização rápida
Para ver os dados de uma tabela sem abrir notebook, clique na tabela no Catalog e vá na aba Sample Data.
7. Solução de erros comuns¶
❌ SCHEMA_NOT_FOUND: workspace.workspace¶
Causa: O catálogo padrão está incorreto.
Solução: Adicione USE CATALOG workspace; no início do notebook, ou substitua workspace.landing pelo nome correto do seu catálogo.
❌ Path does not exist: /Volumes/workspace/landing/dados/¶
Causa: Os CSVs ainda não foram enviados para o Volume.
Solução: Siga o Guia de Upload de Arquivos.
❌ Cluster terminated¶
Causa: O cluster ficou inativo e foi desligado automaticamente.
Solução: Vá em Compute, clique no cluster e em Start.