Habilidades Técnicas
Linguagens de Programação
Python
Nível: Avançado
Linguagem principal para engenharia de dados, utilizada diariamente em construção de pipelines, ETL, automações e análise de dados.
Bibliotecas e frameworks:
- Pandas - Manipulação e análise de dados
- Numpy - Computação numérica
- DuckDB - Analytics in-process SQL OLAP
- Great Expectations - Validação e qualidade de dados
- Streamlit - Aplicações de dados interativas
- Requests - Integração com APIs
- SQLAlchemy - ORM para bancos de dados
SQL
Nível: Avançado
Expertise em múltiplos dialetos SQL para modelagem, transformação e análise de dados.
Bancos de dados:
- PostgreSQL (principal)
- MySQL / MariaDB
- Microsoft SQL Server
- DuckDB
- Google BigQuery
- Amazon Redshift
Competências:
- Modelagem dimensional (star schema, snowflake)
- Otimização de queries e índices
- CTEs (Common Table Expressions)
- Window functions
- Procedures e triggers
Ferramentas de Dados Modernas
dbt (Data Build Tool)
Nível: Avançado
Ferramenta principal para transformação de dados, utilizada em todos os projetos recentes.
Competências:
- Modelagem de dados com Jinja e SQL
- Testes automatizados (unique, not_null, relationships)
- Documentação automática
- Versionamento de modelos
- Macros customizadas
- Configuração de CI/CD para dbt
Experiência: Implementação de dbt em 3 empresas diferentes (Oby Capital, Bravium, Falconi)
Great Expectations
Validação e qualidade de dados com testes automatizados e documentação de expectativas.
Cloud Computing
Google Cloud Platform (GCP)
Nível: Avançado
Plataforma cloud principal, utilizada em projetos de produção.
Serviços dominados:
- BigQuery - Data warehouse serverless
- Cloud Storage - Armazenamento de objetos
- Cloud Functions - Serverless computing
- Cloud Build - CI/CD
- IAM & Security - Gerenciamento de acesso
- Cloud Run - Containers serverless
Amazon Web Services (AWS)
Nível: Intermediário
Experiência com principais serviços de dados da AWS.
Serviços utilizados:
- S3 - Armazenamento de objetos
- RDS - Bancos de dados relacionais gerenciados
- Redshift - Data warehouse
- Athena - Queries SQL em S3
- CloudWatch - Monitoramento e logs
- ECS - Container orchestration
Railway
Plataforma PaaS para deploy de aplicações e bancos de dados com foco em developer experience.
Versionamento e DevOps
Git
Nível: Avançado
Controle de versão essencial para todos os projetos de dados.
Plataformas:
- GitHub (principal) - CI/CD com Actions
- GitLab - CI/CD pipelines
- Azure Repos - DevOps integrado
Práticas:
- Branching strategies (Git Flow, GitHub Flow)
- Code review e pull requests
- Conventional commits
- Git hooks para automação
CI/CD
Implementação de pipelines de integração e deploy contínuo para projetos de dados:
- GitHub Actions
- Azure DevOps Pipelines
- Cloud Build (GCP)
Business Intelligence e Visualização
Looker (Google Data Studio)
Criação e manutenção de dashboards interativos conectados ao BigQuery.
Power BI
Desenvolvimento de relatórios e dashboards corporativos.
Competências:
- Power Query (M language)
- DAX para métricas calculadas
- Modelagem de dados
- Row-level security
Streamlit
Desenvolvimento de aplicações de dados interativas com Python.
Ferramentas de Produtividade
- Excel Avançado - Fórmulas complexas, tabelas dinâmicas, Power Query
- Google Sheets - Automação com Apps Script
- Microsoft Word - Documentação técnica
- SharePoint - Colaboração e gestão documental
- Azure DevOps - Gestão de projetos e work items
Metodologias e Práticas
DataOps
- Automação de pipelines de dados
- Versionamento de código e dados
- Testes automatizados
- Monitoramento e observabilidade
- Documentação como código
Engenharia de Software
- Clean Code
- SOLID principles
- Design patterns
- Code review
- Testes unitários
Metodologias Ágeis
- Scrum
- Kanban
- Sprints e cerimônias ágeis
Stack Técnico por Categoria
| Categoria | Tecnologias |
|---|---|
| Linguagens | Python, SQL, Jinja |
| Bancos de Dados | PostgreSQL, MySQL, BigQuery, Redshift, DuckDB |
| Cloud | GCP (BigQuery, Cloud Functions, Cloud Storage), AWS (S3, RDS, Athena) |
| Data Tools | dbt, Great Expectations, Pandas, Numpy |
| Orquestração | GitHub Actions, Cloud Build, Azure DevOps |
| BI & Viz | Looker, Power BI, Streamlit, Power Query |
| DevOps | Git, GitHub, GitLab, Docker |
| Produtividade | Excel, Sheets, Word, SharePoint |
Soft Skills
- Comunicação técnica - Tradução de requisitos de negócio para soluções técnicas
- Trabalho em equipe - Colaboração com times multidisciplinares
- Autonomia - Capacidade de aprender novas tecnologias rapidamente
- Mentoria - Ensino de tecnologias para analistas e desenvolvedores
- Resolução de problemas - Abordagem analítica e estruturada
- Documentação - Criação de documentação técnica clara e completa