VoIP

Redundância e Alta Disponibilidade em Plataformas de Voz

Entenda as estratégias de redundância e alta disponibilidade para plataformas de voz e como o SipPulse SoftSwitch e SBC implementam arquiteturas carrier-grade com failover transparente.

SipPulse - Equipe Técnica26 de fevereiro de 20265 min de leitura

Redundância e Alta Disponibilidade em Plataformas de Voz

Por que alta disponibilidade é inegociável em voz

Em telecomunicações, a voz exige um nível de disponibilidade superior ao de serviços de dados. Quando um servidor web fica fora do ar por 30 segundos, poucos usuários percebem. Quando uma plataforma de voz falha por 30 segundos, todas as chamadas em andamento caem e os usuários percebem imediatamente. Para operadoras STFC, ISPs com voz e contact centers, a interrupção de serviço de voz gera impacto direto na receita e na satisfação do cliente.

O objetivo típico é atingir 99,999% de disponibilidade (cinco noves), o que equivale a menos de 5 minutos e 15 segundos de indisponibilidade por ano. Alcançar esse nível exige uma plataforma projetada para redundância desde a arquitetura.

Como o SipPulse SoftSwitch implementa alta disponibilidade

O SipPulse SoftSwitch foi projetado para operações carrier-grade, com suporte nativo a clustering e failover. Construído sobre OpenSIPS, o SoftSwitch suporta até 1000 CAPS (chamadas por segundo) e oferece duas arquiteturas de redundância:

Ativo-Passivo

O nó primário processa todo o tráfego. O nó secundário permanece em standby, monitorando a saúde do primário via keepalived (VRRP). Em caso de falha, o secundário assume o IP virtual em menos de 3 segundos e começa a processar chamadas. As chamadas em andamento no momento da falha são perdidas, mas novas chamadas são processadas normalmente.

Esta configuração é adequada para operações de menor porte onde o custo de manter dois nós ativos não se justifica.

Ativo-Ativo

Ambos os nós do SipPulse SoftSwitch processam tráfego simultaneamente, dividindo a carga. O balanceamento SIP distribui as chamadas entre os nós. Se um nó falha, o outro absorve toda a carga automaticamente.

O SipPulse SoftSwitch utiliza o módulo usrloc do OpenSIPS com backend em banco de dados para replicar o estado de registro SIP em tempo real entre os nós. Isso significa que os endpoints registrados em um nó que falha podem ser atendidos pelo outro nó sem necessidade de re-registro.

Redundância do SipPulse SBC

O SipPulse SBC, com suporte a até 4000 chamadas simultâneas, também opera em configuração redundante. Disponível nas variantes UNI (acesso), NNI (interconexão) e NNI-CC (contact center), o SBC pode ser implantado em pares ativo-passivo com failover via VRRP.

Na borda da rede, o SBC é frequentemente o primeiro ponto de contato para o tráfego SIP. Um SBC redundante garante que a interconexão com outras operadoras e o acesso dos clientes corporativos não sejam afetados por falhas de hardware ou software.

Replicação de banco de dados

CDRs, configurações de clientes e dados de roteamento do SipPulse SoftSwitch precisam estar sincronizados entre os nós. As abordagens suportadas incluem:

Replicação síncrona (PostgreSQL com replicação síncrona): garante que ambos os nós têm os mesmos dados, com RPO zero.
Replicação assíncrona: menor impacto na performance, adequada quando a latência entre os sites é significativa.

O SipPulse BSS (sistema de billing) também se beneficia da replicação, garantindo que os dados de faturamento e CDRs estejam disponíveis mesmo durante uma falha.

Redundância geográfica

Para proteção contra desastres que afetem um datacenter inteiro, o SipPulse SoftSwitch pode ser implantado em localizações geográficas distintas. A configuração utiliza DNS SRV com TTL baixo para redirecionar o tráfego em caso de falha de um site.

O SIP suporta nativamente DNS SRV records. Um registro típico para failover inclui:

Prioridade 10 apontando para o servidor primário
Prioridade 20 apontando para o servidor secundário

Quando o primário falha, os endpoints SIP compatíveis tentam automaticamente o secundário.

Redundância de media servers

Servidores de mídia (responsáveis por transcodificação, gravação e conferência) também precisam de redundância. O SipPulse SoftSwitch distribui sessões de mídia entre múltiplas instâncias de media server. Se uma instância falha, novas chamadas são direcionadas para as instâncias restantes.

Para contact centers que utilizam o SipPulse NIVA (assistente virtual com IA) ou gravação de chamadas para o SipPulse AI (transcrição e análise), a redundância de media servers garante que essas funcionalidades permaneçam disponíveis mesmo durante falhas parciais.

Metas de RTO e RPO na plataforma SipPulse

RTO (Recovery Time Objective): com keepalived/VRRP, o failover do SipPulse SoftSwitch e SBC ocorre em 2-5 segundos, bem abaixo do limite de 30 segundos considerado aceitável para voz.
RPO (Recovery Point Objective): com replicação síncrona, o RPO é zero. CDRs e dados de configuração não são perdidos.

Conclusão

A alta disponibilidade em plataformas de voz não é opcional para operações profissionais. O SipPulse SoftSwitch e o SipPulse SBC foram projetados desde a arquitetura para operar em configurações redundantes, com failover transparente e replicação de estado. Para operadoras STFC, ISPs e contact centers que não podem tolerar interrupções, a plataforma SipPulse oferece a disponibilidade carrier-grade que a operação exige.