SIP y VoIP

Redundancia y Alta Disponibilidad en Plataformas de Voz

Entienda las estrategias de redundancia y alta disponibilidad para plataformas de voz y como SipPulse SoftSwitch y SBC implementan arquitecturas carrier-grade con failover transparente.

SipPulse - Equipo Tecnico26 de febrero de 20265 min de lectura

Redundancia y Alta Disponibilidad en Plataformas de Voz

Por que la alta disponibilidad es innegociable en voz

En telecomunicaciones, la voz exige un nivel de disponibilidad superior al de servicios de datos. Cuando un servidor web queda fuera del aire por 30 segundos, pocos usuarios lo perciben. Cuando una plataforma de voz falla por 30 segundos, todas las llamadas en curso se caen y los usuarios lo perciben inmediatamente. Para operadoras STFC, ISPs con voz y contact centers, la interrupcion del servicio de voz genera impacto directo en la facturacion y la satisfaccion del cliente.

El objetivo tipico es alcanzar 99,999% de disponibilidad (cinco nueves), lo que equivale a menos de 5 minutos y 15 segundos de indisponibilidad por ano. Alcanzar ese nivel exige una plataforma proyectada para redundancia desde la arquitectura.

Como SipPulse SoftSwitch implementa alta disponibilidad

SipPulse SoftSwitch fue proyectado para operaciones carrier-grade, con soporte nativo a clustering y failover. Construido sobre OpenSIPS, el SoftSwitch soporta hasta 1000 CAPS (llamadas por segundo) y ofrece dos arquitecturas de redundancia:

Activo-Pasivo

El nodo primario procesa todo el trafico. El nodo secundario permanece en standby, monitoreando la salud del primario via keepalived (VRRP). En caso de falla, el secundario asume la IP virtual en menos de 3 segundos y comienza a procesar llamadas. Las llamadas en curso al momento de la falla se pierden, pero las nuevas llamadas se procesan normalmente.

Esta configuracion es adecuada para operaciones de menor porte donde el costo de mantener dos nodos activos no se justifica.

Activo-Activo

Ambos nodos del SipPulse SoftSwitch procesan trafico simultaneamente, dividiendo la carga. El balanceo SIP distribuye las llamadas entre los nodos. Si un nodo falla, el otro absorbe toda la carga automaticamente.

SipPulse SoftSwitch utiliza el modulo usrloc de OpenSIPS con backend en base de datos para replicar el estado de registro SIP en tiempo real entre los nodos. Esto significa que los endpoints registrados en un nodo que falla pueden ser atendidos por el otro nodo sin necesidad de re-registro.

Redundancia del SipPulse SBC

El SipPulse SBC, con soporte a hasta 4000 llamadas simultaneas, tambien opera en configuracion redundante. Disponible en las variantes UNI (acceso), NNI (interconexion) y NNI-CC (contact center), el SBC puede ser implantado en pares activo-pasivo con failover via VRRP.

En la frontera de la red, el SBC es frecuentemente el primer punto de contacto para el trafico SIP. Un SBC redundante garantiza que la interconexion con otras operadoras y el acceso de los clientes corporativos no sean afectados por fallas de hardware o software.

Replicacion de base de datos

CDRs, configuraciones de clientes y datos de enrutamiento del SipPulse SoftSwitch necesitan estar sincronizados entre los nodos. Los enfoques soportados incluyen:

Replicacion sincrona (PostgreSQL con replicacion sincrona): garantiza que ambos nodos tienen los mismos datos, con RPO cero.
Replicacion asincrona: menor impacto en la performance, adecuada cuando la latencia entre los sitios es significativa.

SipPulse BSS (sistema de billing) tambien se beneficia de la replicacion, garantizando que los datos de facturacion y CDRs esten disponibles incluso durante una falla.

Redundancia geografica

Para proteccion contra desastres que afecten un datacenter entero, SipPulse SoftSwitch puede ser implantado en ubicaciones geograficas distintas. La configuracion utiliza DNS SRV con TTL bajo para redirigir el trafico en caso de falla de un sitio.

SIP soporta nativamente DNS SRV records. Un registro tipico para failover incluye:

Prioridad 10 apuntando al servidor primario
Prioridad 20 apuntando al servidor secundario

Cuando el primario falla, los endpoints SIP compatibles intentan automaticamente el secundario.

Redundancia de media servers

Los servidores de media (responsables por transcodificacion, grabacion y conferencia) tambien necesitan redundancia. SipPulse SoftSwitch distribuye sesiones de media entre multiples instancias de media server. Si una instancia falla, las nuevas llamadas se dirigen a las instancias restantes.

Para contact centers que utilizan SipPulse NIVA (asistente virtual con IA) o grabacion de llamadas para SipPulse AI (transcripcion y analisis), la redundancia de media servers garantiza que estas funcionalidades permanezcan disponibles incluso durante fallas parciales.

Metas de RTO y RPO en la plataforma SipPulse

RTO (Recovery Time Objective): con keepalived/VRRP, el failover del SipPulse SoftSwitch y SBC ocurre en 2-5 segundos, bien por debajo del limite de 30 segundos considerado aceptable para voz.
RPO (Recovery Point Objective): con replicacion sincrona, el RPO es cero. CDRs y datos de configuracion no se pierden.

Conclusion

La alta disponibilidad en plataformas de voz no es opcional para operaciones profesionales. SipPulse SoftSwitch y SipPulse SBC fueron proyectados desde la arquitectura para operar en configuraciones redundantes, con failover transparente y replicacion de estado. Para operadoras STFC, ISPs y contact centers que no pueden tolerar interrupciones, la plataforma SipPulse ofrece la disponibilidad carrier-grade que la operacion exige.