El día 23 de marzo de 2021, tuvimos un aumento inesperado en el tráfico a través de TalkCenter (Chat). Este aumento, fue de casi 10 veces más que el tráfico normal, provocando un colapso en el sistema.
Durante los primeros días, se investigaron diversas alternativas para recuperar rápidamente la funcionalidad de este servicio, siendo una de las más efectivas, el escalamiento vertical de la máquina que procesaba los mensajes de este sistema, lo cual permitió resolver el colapso total de la infraestructura.
Durante el periodo del 23 al 30 de marzo, se comenzó a planificar y construir los cambios de infraestructura que permitirán resolver los problemas de escalabilidad del código. Optando, finalmente, el día 4 de abril por desacoplar el manejo de websockets y pasarlos a una infraestructura mas moderna.
Durante el periodo 26 de marzo al 8 de abril, se diseñaron e implementaron ambientes de desarrollo para esta máquina, en los cuales se fueron haciendo pruebas con las nuevas piezas de este sistema. A medida que el nuevo sistema se desarrollaba y mostraba ser funcional y operativo, se fueron migrando clientes a estos nuevos ambientes.
El día 15 de abril se encuentran solo algunas empresas utilizando el nuevo sistema de Chat, con el fin de monitorear para poder finalmente aplicarlo para todas las empresas.