PGConf.Brasil 2025

João Pessoa, PB

3 a 5 de setembro


Chaos Engineering com PostgreSQL e Patroni: Resiliência em Escala no iFood


Joânio Trade Alves

ifood


O iFood usou Chaos Engineering para testar a resiliência de clusters PostgreSQL gerenciados pelo Patroni, focando em alta disponibilidade e replicação


Gostaríamos de compartilhar com a comunidade PostgreSQL Brasil nossa experiência com experimentos de chaos engineering realizados no iFood. Utilizando o AWS Fault Injection Simulator (FIS), avaliamos a resiliência de clusters PostgreSQL gerenciados pelo Patroni, com foco em failover automático e replicação síncrona para implantação em ambiente de produção com mais de 690 clusters.
No iFood, desenvolvemos a plataforma Meeseeks que gerencia automaticamente esses clusters, abstraindo ferramentas como Chef, Terraform e Git, reforçando nossa estratégia de infraestrutura como código. Nosso principal objetivo foi compreender profundamente o comportamento do PostgreSQL em cenários de falha e alta disponibilidade, preparando nossas equipes para oferecer respostas mais rápidas e seguras em um ambiente de grande escala.
Os testes também contemplaram a replicação entre diferentes regiões AWS (Virgínia e Ohio), permitindo identificar e mitigar riscos associados à latência e consistência dos dados. Compartilharemos as lições aprendidas que nos levaram a implementar este modelo de alta disponibilidade em todo o ambiente do iFood, garantindo maior proteção contra falhas, continuidade operacional e integridade dos serviços prestados de forma mais eficiente e escalável.
O que será compartilhado:
Estratégias práticas para implementar chaos engineering com PostgreSQL em ambientes de produção
Como configurar e otimizar o Patroni para alta disponibilidade em clusters PostgreSQL
Desafios e soluções para replicação entre diferentes regiões AWS
Métricas e indicadores importantes para monitorar durante falhas
Lições aprendidas e melhores práticas adotadas no iFood para garantir resiliência
Acreditamos que nossos aprendizados são relevantes para toda a comunidade PostgreSQL, oferecendo insights práticos e aplicáveis sobre alta disponibilidade em cenários reais de grande escala.

Patrocinadores Platina


Patrocinadores Ouro


Patrocinadores Prata


Patrocinadores Bronze


Apoio