Estamos em busca de um(a) Especialista de Compute para integrar o time de Storage & Compute da PWS Cloud e atuar diretamente na construção e operação da camada de virtualização da plataforma. Trata-se de uma posição altamente técnica, voltada para um profissional que domina KVM e CloudStack em profundidade — não apenas como operador de ferramentas, mas como engenheiro(a) capaz de entender o funcionamento interno da stack, diagnosticar problemas em baixo nível e evoluir a plataforma de forma consistente.
A posição de Especialista de Compute é central para garantir que a camada de Compute — o serviço de instâncias e VMs oferecido aos clientes — seja provisionada, operada e evoluída com excelência técnica, alta disponibilidade e escala.
Responsabilidades e atribuições
Infraestrutura de Virtualização:
-
Operar e evoluir os hosts KVM da plataforma, garantindo estabilidade, performance e isolamento adequado entre tenants e workloads;
-
Configurar, ajustar e depurar instâncias QEMU/KVM em produção, incluindo mapeamento de vCPU, balanceamento de memória, device passthrough e otimizações de I/O;
-
Gerenciar o ciclo de vida completo de instâncias na plataforma CloudStack — provisionamento, migração, snapshot, resize e destruição — garantindo consistência e rastreabilidade operacional;
-
Executar live migration e cold migration de instâncias entre hosts com zero ou mínima interrupção, incluindo análise de pré-condições e mitigação de riscos antes de cada operação;
-
Dimensionar e planejar a capacidade dos clusters de Compute para absorver crescimento de demanda sem degradação de desempenho ou violação de SLAs.
Orquestração e Automação:
-
Administrar o CloudStack Management Server e os agentes KVM instalados nos hosts, garantindo comunicação estável, sincronização de estado e resiliência a falhas de componentes;
-
Automatizar operações recorrentes de Compute via scripts e infraestrutura como código (Terraform/OpenTofu, Ansible), reduzindo intervenção manual e garantindo reprodutibilidade;
-
Contribuir para a construção e manutenção de templates de instâncias padronizados — configuração de imagens base, cloud-init e bootstrapping de VMs para diferentes workloads;
-
Integrar os fluxos de provisionamento de Compute com as camadas de Block Storage e networking, garantindo coesão entre as camadas da plataforma.
-
Desenvolver aplicações, componentes e bibliotecas em busca do melhor gerenciamento da plataforma de Compute, maior resiliência e melhor experiência de nossos usuários.
Observabilidade e Operação:
-
Implementar e manter instrumentação de observabilidade nos hosts KVM e no CloudStack — métricas de hypervisor, utilização de vCPU/memória, latência de I/O e eventos de plataforma;
-
Participar das rotinas de on-call e resposta a incidentes de Compute, executando triagem, diagnóstico e resolução de problemas com foco em velocidade de recuperação e prevenção de recorrência;
-
Produzir runbooks operacionais, postmortems e documentação técnica de decisões relacionadas à camada de Compute, contribuindo para a memória técnica do time.
Requisitos e qualificações
Virtualização e KVM:
-
Experiência sólida com KVM/QEMU — incluindo configuração de guests, gestão de recursos, rede virtual (virtio, bridge, SR-IOV) e diagnóstico de problemas em baixo nível;
-
Conhecimento aprofundado de Linux para servidores — tuning de kernel, NUMA, hugepages, cgroups e isolamento de recursos entre processos e VMs;
-
Conhecimento em redes para virtualização, incluindo VLANs, bridges Linux, Open vSwitch, VXLAN e integração com arquiteturas BGP/EVPN.
-
Familiaridade com libvirt para gerenciamento de VMs e integração com ferramentas de orquestração.
Orquestração de Nuvem:
-
Experiência prática com CloudStack — instalação, configuração, operação e troubleshooting do Management Server e dos agentes KVM;
-
Compreensão do modelo de recursos do CloudStack: Zones, Pods, Clusters, Hosts e o fluxo de provisionamento de instâncias, redes e volumes;
-
Capacidade de diagnosticar falhas no ciclo de vida de VMs no CloudStack, incluindo análise de logs do Management Server e dos agentes de hypervisor.
Infraestrutura como Código e Automação:
-
Experiência com Terraform/OpenTofu e Ansible para provisionamento e configuração de infraestrutura de Compute;
-
Proficiência em Bash e Python para automação de tarefas operacionais, scripts de diagnóstico e integração com APIs de plataforma;
-
Familiaridade com pipelines de CI/CD para validação e entrega de mudanças de infraestrutura.
Informações adicionais
Será considerado um diferencial:
-
Experiência prévia com implantação ou operação de CloudStack em ambiente de produção multi-tenant;
-
Conhecimento de integração entre CloudStack, Ceph RBD ou Appliances de Storage para volumes de Block Storage;
-
Familiaridade com redes SDN/BGP aplicadas a clusters de Compute;
-
Conhecimento em VMWare e gestão de VMs dele por API;
-
Proficiência em uma ou mais linguagens de programação como Golang, Rust ou Python;
-
Contribuições a projetos open source relacionados a virtualização, CloudStack ou automação de infraestrutura.
A PWS Cloud é uma empresa brasileira com 15 anos de experiência em tecnologia, com atuação em cloud, infraestrutura, cibersegurança e serviços gerenciados. Reconhecida pelo atendimento consultivo e execução ponta a ponta, apoia empresas na modernização e proteção de ambientes críticos, com foco em confiabilidade e performance.
Com uma abordagem orientada ao negócio, a PWS Cloud entende os desafios específicos de cada cliente e constrói soluções sob medida, alinhadas às necessidades operacionais e estratégicas de cada organização. Seu portfólio integra tecnologias de ponta com práticas consolidadas de governança, garantindo não apenas eficiência, mas também segurança e escalabilidade.
Nós atuamos como parceira na jornada de transformação digital, viabilizando a migração e evolução de ambientes on-premises para a nuvem, a otimização de custos operacionais e o aumento da resiliência dos sistemas. Além disso, oferece suporte contínuo e monitoramento proativo, assegurando alta disponibilidade e rápida resposta a incidentes.
Com expertise em ambientes complexos e missão crítica, a PWS Cloud se posiciona como um player estratégico para empresas que não podem parar, entregando soluções robustas que sustentam crescimento, inovação e vantagem competitiva.