Monitoreo Eléctrico para Centros de Datos
Leer tu recibo de luz no es monitoreo eléctrico
Es arqueología. Llega un mes tarde y no te dice por qué.
La diferencia entre saber que tienes luz y saber cómo está tu energía
Sabes cuánto pagas de electricidad cada mes. Tal vez hasta sabes tu consumo en kWh. Pero ¿sabés cuánta energía está consumiendo cada rack? ¿Cuál es el headroom real de tus PDUs? ¿Cuál es el estado de salud de cada batería en tu UPS? ¿Cuándo fue la última vez que un sag de voltaje causó un reinicio no documentado en tus servidores?
Si la respuesta es «no estoy seguro», no estás monitoreando tu infraestructura eléctrica. Estás contando con que funcione. Y eso funciona… hasta que no funciona.
Monitoreo eléctrico en tiempo real: lo que necesitas ver
Energía por PDU y por rack
No basta con saber que un circuito está «encendido». Necesitas saber, en cada momento, cuánta energía está consumiendo cada PDU, cada rama, cada rack. Eso te permite:
- Detectar racks que se acercan a su capacidad máxima antes de que un breaker salte.
- Identificar servidores zombies que consumen energía sin hacer nada útil.
- Balancear la carga entre fases y circuitos para evitar desequilibrios.
- Planificar expansions con datos reales, no estimaciones.
Un PDU inteligente (monitoreado o gestionado) en cada rack no es un lujo —es el mínimo necesario para operación profesional.
Estado de baterías UPS
Las baterías de tu UPS son el seguro de vida de tu centro de datos. Y como todo seguro, no sabés si funciona hasta que lo necesitas. Monitoreo de baterías en tiempo real significa:
- Impedancia interna por celda — se degrada antes de que la capacidad caiga visible. Monitorear impedancia te da semanas o meses de aviso previo.
- Temperatura de la batería — cada 8 °C por encima de 25 °C reduce la vida útil a la mitad.
- Voltaje flotante y corriente de ripple — indicadores tempranos de degradación del cargador o de las celdas.
- Tiempo de autonomía real estimado — no el que calculaste hace dos años, el real, basado en la carga actual y el estado de las baterías hoy.
Una batería que falla durante un corte de energía convierte un evento manejable en un desastre total. Y las baterías fallan. La pregunta no es si, sino cuándo —y si vas a saber antes de que pase.
Generadores: combustible y salud
Tu generador es la capa de respaldo que debería funcionar cuando todo lo demás falla. Pero:
- ¿Sabés cuánto combustible tenés realmente en el tanque (no lo que marca el indicador)?
- ¿Sabés cuántas horas de operación te quedan a la carga actual?
- ¿Cuándo fue la última prueba bajo carga real, no en vacío?
- ¿Cuál es la temperatura del aceite, presión, y estado de la batería de arranque?
Un generador que no arranca cuando lo necesitas no es un respaldo —es una ilusión de respaldo.
Calidad de energía: armónicos, sags, swells y transitorios
La energía que llega a tus servidores no es tan limpia como crees. Los problemas de calidad de energía son responsables de una cantidad significativa de fallos intermitentes que normalmente se atribuyen a «software» o «hardware defectuoso»:
- Armónicos (THD): Fuentes de conmutación sin PFC generan armónicos que sobrecargan neutros y transformadores. THD > 5% en corriente ya es motivo de atención.
- Voltage sags: Caídas de voltaje de corta duración (milisegundos) que pueden reiniciar equipos sensibles sin dejar rastro en los logs.
- Voltage swells: Picos que degradan fuentes de alimentación progresivamente.
- Transitorios: Picos de alto voltaje, microsegundos de duración, que matan componentes electrónicos lentamente.
Monitorear calidad de energía con analizadores de potencia en tus tableros principales y PDU de entrada te da visibilidad sobre problemas que de otra manera serían invisibles —y muy caros.
PUE: mide lo que gestiona
El PUE (Power Usage Effectiveness) es la métrica fundamental de eficiencia energética en centros de datos. Pero hay un problema: la mayoría de los PUE que se reportan se calculan con datos estimados, mediciones parciales, o lecturas mensuales.
Un PUE real se calcula así:
PUE = Energía Total del Centro de Datos / Energía de Equipos IT
Y para que sea útil, tiene que ser:
- Calculado con datos reales, no estimaciones. Mediciones directas en el tablero principal y en cada PDU de rack.
- Calculado en tiempo real, no como promedio mensual. El PUE varía con la carga, la temperatura exterior, y el estado de tus sistemas de enfriamiento.
- Segmentado por zona, si tienes salas con diferentes densidades o configuraciones.
Un PUE de 1.2 calculado con datos reales vale más que un PUE de 1.1 calculado con estimaciones. Porque el primero te dice la verdad. El segundo te dice lo que querés escuchar.
Capacity planning: ¿cuánto headroom tienes realmente?
Pregunta rápida: si mañana instalas 10 servidores más, ¿en qué rack los pones? ¿Tienes capacidad eléctrica disponible? ¿En qué circuito? ¿Con cuánto margen?
Si no podés responder esas preguntas en minutos (no en horas), no tienes visibilidad real de tu capacidad eléctrica. El capacity planning eléctrico sin monitoreo granular es adivinanza con excusas.
Con monitoreo a nivel de PDU y rack, puedes:
- Ver en tiempo real cuánto headroom tienes por circuito, por fase, por rack.
- Proyectar cuándo vas a alcanzar el 80% de capacidad en cada rama.
- Simular el impacto de nuevas cargas antes de conectarlas.
- Evitar sobrecargas que provocan trips de breaker y caídas de servicio.
La regla del 80% no es una sugerencia —es la diferencia entre operar con margen y operar al borde.
Detección de anomalías y alertas
El monitoreo eléctrico sin alertas es un archivo de log que nadie lee. Las alertas eléctricas efectivas van más allá de «algo se apagó»:
- Tendencias de consumo anómalas. Un rack que sube su consumo un 15% en una semana sin cambios en carga de trabajo es una señal temprana de degradación de componentes.
- Desequilibrio de fases. Si una fase carga 40A y otra 18A, estás desperdiciando capacidad y arriesgando sobrecarga en una fase.
- Baterías degradándose. Impedancia subiendo, temperatura fuera de rango, voltaje flotante desviado —cada una es una alerta temprana de una batería que va a fallar.
- Eventos de calidad de energía. Sags repetidos, armónicos crecientes, factor de potencia cayendo —indicadores de que algo está cambiando en tu suministro o en tu carga.
- Capacidad agotándose. No cuando ya no hay espacio, sino cuando se acerca al umbral de planificación (80%, 70% según tu política).
Las mejores alertas son las que llegan antes de que necesites reaccionar. No «se cayó el rack A3». Sino «el consumo del rack A3 ha subido un 22% en las últimas 48 horas, consistente con degradación de fuente de alimentación. Se recomienda inspección antes de las próximas 72 horas.»
Lo que hacemos en Noxtel
Implementamos monitoreo eléctrico que transforma tu infraestructura de «espero que funcione» a «sé exactamente cómo está funcionando». Desde PDU inteligentes hasta análisis de calidad de energía, desde estado de baterías hasta PUE en tiempo real —con las alertas correctas llegando a las personas correctas.
No vendemos medidores. Vendemos visibilidad eléctrica real —la que te permite tomar decisiones con datos, no con corazonadas.
Uptime Sostenible — Noxtel