Saltar para o conteúdo
Disciplina 13 — de 14

A infraestrutura sem o pager às 3 da manhã.

Fundações cloud concebidas para noites tranquilas — entrega automatizada, observabilidade e segurança que deixam a sua equipa de produto implementar todos os dias sem prender a respiração.

40+Países servidos pela nossa infra
DiáriosDeploys, não trimestrais
3 d → 4 hPreparação de auditoria automatizada
A disciplina

A sua infraestrutura devia ser a coisa mais aborrecida que possui.

Disciplina13 / 14
FocoInfraestrutura cloud
Prova40+ países servidos pela nossa infra
CompromissoLiderado por seniores · Suporte vitalício

Só reparamos na infraestrutura quando ela falha — no pico de tráfego, durante a demonstração, às 3 da manhã. As causas nunca são exóticas: servidores alterados à mão, deploys que dependem de uma única pessoa, alertas que ninguém lê e custos pelos quais ninguém responde.

Tornamo-la aborrecida de propósito. Tudo em código, cada deploy automatizado e reversível, cada sistema observável antes de descarrilar. As plataformas que operamos servem clientes em mais de quarenta países — e o maior orgulho delas é que quase nunca pensamos nelas.

O que recebe

Concebido para a calma.

As seis camadas de uma cloud de produção que deixa toda a gente dormir.

01

Arquitetura cloud (AWS)

Fundações AWS multi-ambiente, bem dimensionadas — pensadas para a sua carga, não para um diagrama de referência.

02

CI / CD

Pipelines que testam, constroem e entregam a cada merge — com deploys progressivos e rollback num clique.

03

Segurança & monitorização

IAM de menor privilégio, gestão de segredos, trilhos de auditoria e alertas afinados para só acordar humanos quando um humano pode ajudar.

04

Infrastructure as Code

Terraform para cada recurso — revisível, reproduzível e reconstruível de raiz numa tarde.

05

Auto-scaling & controlo de custos

Capacidade que acompanha a procura e orçamentos com responsáveis — desempenho e fatura ambos sob controlo.

06

Resposta a incidentes

Runbooks, escalonamento de on-call e post-mortems sem culpa — para o raro dia em que o aborrecido falha.

Como entregamos

Estabilizar, automatizar, esquecer.

Um caminho de migração que nunca aposta a sua disponibilidade num fim de semana de bascula.

01Auditar & mapear

Cada recurso, dependência e ponto único de falha documentado — incluindo aqueles que só um engenheiro conhecia.

02Codificar a verdade

A infraestrutura existente importada para Terraform. A partir daí, a mudança passa pela revisão, não pelo SSH.

03Automatizar a entrega

CI/CD com testes, staging e rollback. Os deploys passam de eventos temidos a não-eventos, diários.

04Observar & robustecer

Dashboards, alertas, testes de carga e revisão de segurança — depois uma operação vitalícia pela mesma equipa.

Provas, não promessas

Já o entregámos.

A infraestrutura por detrás de uma plataforma aeronáutica de confiança em 40+ países — onde uma falha mantém aviões reais no chão.

Estudo de caso — SaaS · Infraestrutura

Aviatize

Uma plataforma aeronáutica crítica em conformidade, cuja preparação de auditoria passou de três dias para quatro horas — porque a infraestrutura documenta-se e prova-se a si própria.

3 d → 4 hPrep. de auditoria
1.000+Aeronaves
40+Países
As ferramentas que usamos

Escolhidas para o problema, não para o currículo.

AWS primeiro, tudo automatizado — a cadeia de ferramentas que a sua próxima contratação já conhece.

AWSTerraformDockerKubernetes / ECSGitHub ActionsGrafanaPrometheusCloudFrontSentryVault
Antes mesmo da pergunta

Perguntas, respostas.

O que os compradores de DevOps & cloud mais nos perguntam. Para o resto — descreva-o num brief, um engenheiro sénior responde no prazo de um dia útil.

Ficou algo por dizer?

Coloque-o num briefing. Um engenheiro sénior — não um vendedor — responde no prazo de um dia útil.

Q.01Conseguem assumir uma infraestrutura que já exploramos?

Sim — é o trabalho mais comum. Auditamos, importamos tudo para Terraform e estabilizamos antes de mudar o que quer que seja. Sem migração big-bang: a sua disponibilidade nunca está em jogo na aposta.

Q.02Isto vai reduzir a nossa fatura AWS?

Em geral, e muitas vezes de forma notória — o dimensionamento correto, o agendamento e a higiene do armazenamento poupam regularmente 20–40%. Sobretudo, os custos tornam-se visíveis e atribuídos: a fatura deixa de ser uma surpresa mensal.

Q.03Continuamos a precisar da nossa própria contratação DevOps?

Não necessariamente. Muitos clientes funcionam inteiramente sobre a nossa operação; outros mandam-nos construir a plataforma e depois formam a sua contratação sobre ela. Em ambos os casos, o código e as contas pertencem-lhe — somos uma alavanca, não um lock-in.

Q.04Como lidam com a conformidade — RGPD, SOC 2, ISO?

A infraestrutura em código torna a conformidade demonstrável: trilhos de auditoria, revisões de acesso e provas geradas automaticamente. Num cliente, a preparação de auditoria passou de três dias para quatro horas — é o padrão habitual, não a exceção.

Q.05Precisamos de Kubernetes?

Provavelmente não. A maioria das equipas com menos de 50 engenheiros é melhor servida por um PaaS gerido (Vercel, Fly, Railway, ECS, Cloud Run). Adotamos Kubernetes quando a sua complexidade operacional é justificada por uma escala real ou por exigências de conformidade.

Q.06E a recuperação de desastres?

Concebemos os objetivos RTO/RPO para corresponder à necessidade de negócio (não ao maximalismo do fornecedor), implementamos backups automatizados com procedimentos de restauro testados, e conduzimos exercícios de DR trimestrais para clientes em setores regulados.

Q.07Como é, na realidade, uma boa observabilidade?

Os três pilares feitos deliberadamente: logs estruturados, métricas e traces distribuídos correlacionados por um ID de pedido, com OpenTelemetry como camada de instrumentação para não ficar preso a um único fornecedor. O teste: consegue um engenheiro de on-call passar de um alerta à causa raiz em minutos sem fazer SSH a uma máquina? Os dashboards que ninguém vê não são observabilidade.

Q.08Como tornam os deploys suficientemente seguros para os fazer várias vezes por dia?

Desenvolvimento trunk-based, testes automatizados como porta de merge, e entrega progressiva — canary ou blue-green com rollback automático perante regressão da taxa de erro ou de latência. As feature flags desacoplam o deploy da release, para que entregar código e ativá-lo sejam decisões separadas. Deploys pequenos e frequentes são mais seguros do que os grandes e raros, o que é o oposto da intuição da maioria das equipas.

Vamos enquadrar o projeto

Quando foi o último deploy
sem prender a respiração?

Fale-nos do seu stack, dos seus dias de deploy e do seu último incidente. Um engenheiro de infraestrutura sénior responde no prazo de um dia útil com uma leitura honesta.