Redundância e Alta Disponibilidade em Plataformas de Voz
Entenda as estratégias de redundância e alta disponibilidade para plataformas de voz e como o SipPulse SoftSwitch e SBC implementam arquiteturas carrier-grade com failover transparente.

Por que alta disponibilidade é inegociável em voz
Em telecomunicações, a voz exige um nível de disponibilidade superior ao de serviços de dados. Quando um servidor web fica fora do ar por 30 segundos, poucos usuários percebem. Quando uma plataforma de voz falha por 30 segundos, todas as chamadas em andamento caem e os usuários percebem imediatamente. Para operadoras STFC, ISPs com voz e contact centers, a interrupção de serviço de voz gera impacto direto na receita e na satisfação do cliente.
O objetivo típico é atingir 99,999% de disponibilidade (cinco noves), o que equivale a menos de 5 minutos e 15 segundos de indisponibilidade por ano. Alcançar esse nível exige uma plataforma projetada para redundância desde a arquitetura.
Como o SipPulse SoftSwitch implementa alta disponibilidade
O SipPulse SoftSwitch foi projetado para operações carrier-grade, com suporte nativo a clustering e failover. Construído sobre OpenSIPS, o SoftSwitch suporta até 1000 CAPS (chamadas por segundo) e oferece duas arquiteturas de redundância:
Ativo-Passivo
O nó primário processa todo o tráfego. O nó secundário permanece em standby, monitorando a saúde do primário via keepalived (VRRP). Em caso de falha, o secundário assume o IP virtual em menos de 3 segundos e começa a processar chamadas. As chamadas em andamento no momento da falha são perdidas, mas novas chamadas são processadas normalmente.
Esta configuração é adequada para operações de menor porte onde o custo de manter dois nós ativos não se justifica.
Ativo-Ativo
Ambos os nós do SipPulse SoftSwitch processam tráfego simultaneamente, dividindo a carga. O balanceamento SIP distribui as chamadas entre os nós. Se um nó falha, o outro absorve toda a carga automaticamente.
O SipPulse SoftSwitch utiliza o módulo usrloc do OpenSIPS com backend em banco de dados para replicar o estado de registro SIP em tempo real entre os nós. Isso significa que os endpoints registrados em um nó que falha podem ser atendidos pelo outro nó sem necessidade de re-registro.
Redundância do SipPulse SBC
O SipPulse SBC, com suporte a até 4000 chamadas simultâneas, também opera em configuração redundante. Disponível nas variantes UNI (acesso), NNI (interconexão) e NNI-CC (contact center), o SBC pode ser implantado em pares ativo-passivo com failover via VRRP.
Na borda da rede, o SBC é frequentemente o primeiro ponto de contato para o tráfego SIP. Um SBC redundante garante que a interconexão com outras operadoras e o acesso dos clientes corporativos não sejam afetados por falhas de hardware ou software.
Replicação de banco de dados
CDRs, configurações de clientes e dados de roteamento do SipPulse SoftSwitch precisam estar sincronizados entre os nós. As abordagens suportadas incluem:
- Replicação síncrona (PostgreSQL com replicação síncrona): garante que ambos os nós têm os mesmos dados, com RPO zero.
- Replicação assíncrona: menor impacto na performance, adequada quando a latência entre os sites é significativa.
O SipPulse BSS (sistema de billing) também se beneficia da replicação, garantindo que os dados de faturamento e CDRs estejam disponíveis mesmo durante uma falha.
Redundância geográfica
Para proteção contra desastres que afetem um datacenter inteiro, o SipPulse SoftSwitch pode ser implantado em localizações geográficas distintas. A configuração utiliza DNS SRV com TTL baixo para redirecionar o tráfego em caso de falha de um site.
O SIP suporta nativamente DNS SRV records. Um registro típico para failover inclui:
- Prioridade 10 apontando para o servidor primário
- Prioridade 20 apontando para o servidor secundário
Quando o primário falha, os endpoints SIP compatíveis tentam automaticamente o secundário.
Redundância de media servers
Servidores de mídia (responsáveis por transcodificação, gravação e conferência) também precisam de redundância. O SipPulse SoftSwitch distribui sessões de mídia entre múltiplas instâncias de media server. Se uma instância falha, novas chamadas são direcionadas para as instâncias restantes.
Para contact centers que utilizam o SipPulse NIVA (assistente virtual com IA) ou gravação de chamadas para o SipPulse AI (transcrição e análise), a redundância de media servers garante que essas funcionalidades permaneçam disponíveis mesmo durante falhas parciais.
Metas de RTO e RPO na plataforma SipPulse
- RTO (Recovery Time Objective): com keepalived/VRRP, o failover do SipPulse SoftSwitch e SBC ocorre em 2-5 segundos, bem abaixo do limite de 30 segundos considerado aceitável para voz.
- RPO (Recovery Point Objective): com replicação síncrona, o RPO é zero. CDRs e dados de configuração não são perdidos.
Conclusão
A alta disponibilidade em plataformas de voz não é opcional para operações profissionais. O SipPulse SoftSwitch e o SipPulse SBC foram projetados desde a arquitetura para operar em configurações redundantes, com failover transparente e replicação de estado. Para operadoras STFC, ISPs e contact centers que não podem tolerar interrupções, a plataforma SipPulse oferece a disponibilidade carrier-grade que a operação exige.
Referências
Artigos Relacionados

Como Escolher um SBC para a Sua Operação de Voz
Entenda o papel do Session Border Controller na sua rede de voz e aprenda a escolher o SBC certo com base em capacidade, protocolo e modelo de implantação.

Fim da longa distância: entenda a unificação das áreas locais
Anatel reduz áreas locais de 4.118 para 67. Veja o impacto no STFC e o cronograma.

Dimensionamento de Canais de Voz: Erlang, CPS e Capacity Planning
Aprenda a usar a fórmula de Erlang B, calcular CPS e dimensionar corretamente canais de voz, servidores de mídia e largura de banda para sua operação VoIP.