Habilidades Técnicas
Linguagens de Programação
Python
Nível: Avançado
Linguagem principal para engenharia de dados, utilizada diariamente em construção de pipelines, ETL, automações e análise de dados.
Bibliotecas e frameworks:
- Pandas - Manipulação e análise de dados
 - Numpy - Computação numérica
 - DuckDB - Analytics in-process SQL OLAP
 - Great Expectations - Validação e qualidade de dados
 - Streamlit - Aplicações de dados interativas
 - Requests - Integração com APIs
 - SQLAlchemy - ORM para bancos de dados
 
SQL
Nível: Avançado
Expertise em múltiplos dialetos SQL para modelagem, transformação e análise de dados.
Bancos de dados:
- PostgreSQL (principal)
 - MySQL / MariaDB
 - Microsoft SQL Server
 - DuckDB
 - Google BigQuery
 - Amazon Redshift
 
Competências:
- Modelagem dimensional (star schema, snowflake)
 - Otimização de queries e índices
 - CTEs (Common Table Expressions)
 - Window functions
 - Procedures e triggers
 
Ferramentas de Dados Modernas
dbt (Data Build Tool)
Nível: Avançado
Ferramenta principal para transformação de dados, utilizada em todos os projetos recentes.
Competências:
- Modelagem de dados com Jinja e SQL
 - Testes automatizados (unique, not_null, relationships)
 - Documentação automática
 - Versionamento de modelos
 - Macros customizadas
 - Configuração de CI/CD para dbt
 
Experiência: Implementação de dbt em 3 empresas diferentes (Oby Capital, Bravium, Falconi)
Great Expectations
Validação e qualidade de dados com testes automatizados e documentação de expectativas.
Cloud Computing
Google Cloud Platform (GCP)
Nível: Avançado
Plataforma cloud principal, utilizada em projetos de produção.
Serviços dominados:
- BigQuery - Data warehouse serverless
 - Cloud Storage - Armazenamento de objetos
 - Cloud Functions - Serverless computing
 - Cloud Build - CI/CD
 - IAM & Security - Gerenciamento de acesso
 - Cloud Run - Containers serverless
 
Amazon Web Services (AWS)
Nível: Intermediário
Experiência com principais serviços de dados da AWS.
Serviços utilizados:
- S3 - Armazenamento de objetos
 - RDS - Bancos de dados relacionais gerenciados
 - Redshift - Data warehouse
 - Athena - Queries SQL em S3
 - CloudWatch - Monitoramento e logs
 - ECS - Container orchestration
 
Railway
Plataforma PaaS para deploy de aplicações e bancos de dados com foco em developer experience.
Versionamento e DevOps
Git
Nível: Avançado
Controle de versão essencial para todos os projetos de dados.
Plataformas:
- GitHub (principal) - CI/CD com Actions
 - GitLab - CI/CD pipelines
 - Azure Repos - DevOps integrado
 
Práticas:
- Branching strategies (Git Flow, GitHub Flow)
 - Code review e pull requests
 - Conventional commits
 - Git hooks para automação
 
CI/CD
Implementação de pipelines de integração e deploy contínuo para projetos de dados:
- GitHub Actions
 - Azure DevOps Pipelines
 - Cloud Build (GCP)
 
Business Intelligence e Visualização
Looker (Google Data Studio)
Criação e manutenção de dashboards interativos conectados ao BigQuery.
Power BI
Desenvolvimento de relatórios e dashboards corporativos.
Competências:
- Power Query (M language)
 - DAX para métricas calculadas
 - Modelagem de dados
 - Row-level security
 
Streamlit
Desenvolvimento de aplicações de dados interativas com Python.
Ferramentas de Produtividade
- Excel Avançado - Fórmulas complexas, tabelas dinâmicas, Power Query
 - Google Sheets - Automação com Apps Script
 - Microsoft Word - Documentação técnica
 - SharePoint - Colaboração e gestão documental
 - Azure DevOps - Gestão de projetos e work items
 
Metodologias e Práticas
DataOps
- Automação de pipelines de dados
 - Versionamento de código e dados
 - Testes automatizados
 - Monitoramento e observabilidade
 - Documentação como código
 
Engenharia de Software
- Clean Code
 - SOLID principles
 - Design patterns
 - Code review
 - Testes unitários
 
Metodologias Ágeis
- Scrum
 - Kanban
 - Sprints e cerimônias ágeis
 
Stack Técnico por Categoria
| Categoria | Tecnologias | 
|---|---|
| Linguagens | Python, SQL, Jinja | 
| Bancos de Dados | PostgreSQL, MySQL, BigQuery, Redshift, DuckDB | 
| Cloud | GCP (BigQuery, Cloud Functions, Cloud Storage), AWS (S3, RDS, Athena) | 
| Data Tools | dbt, Great Expectations, Pandas, Numpy | 
| Orquestração | GitHub Actions, Cloud Build, Azure DevOps | 
| BI & Viz | Looker, Power BI, Streamlit, Power Query | 
| DevOps | Git, GitHub, GitLab, Docker | 
| Produtividade | Excel, Sheets, Word, SharePoint | 
Soft Skills
- Comunicação técnica - Tradução de requisitos de negócio para soluções técnicas
 - Trabalho em equipe - Colaboração com times multidisciplinares
 - Autonomia - Capacidade de aprender novas tecnologias rapidamente
 - Mentoria - Ensino de tecnologias para analistas e desenvolvedores
 - Resolução de problemas - Abordagem analítica e estruturada
 - Documentação - Criação de documentação técnica clara e completa