Los desafíos de resiliencia y ciberseguridad en infraestructuras de alta densidad

Publicado por: Manuel Abreu Ortiz - social@manuelabreuo.com

DCD entrevistó a Arturo Marroquín, Global Director of Technology and Cybersecurity en Softtek, quien formará parte del evento DCD>Compute Latam

El crecimiento acelerado de la demanda de cómputo ha impulsado la creación de infraestructuras de alta densidad que deben responder no solo a mayores exigencias de capacidad y rendimiento, sino también a estándares cada vez más rigurosos en resiliencia y seguridad.

El próximo 1 de octubre, durante el evento DCD>Compute Latam, Arturo Marroquín, Global Director of Technology and Cybersecurity en Softtek, participará en el panel “Resiliencia y ciberseguridad en infraestructuras de alta densidad: ¿Estamos preparados?”, donde se abordarán esos desafíos estratégicos.

También participan en el panel, Gary Cornejo, Head of Infrastructure, Coca-Cola FemsaRichard Castillo, Associate IT Director, Grupo Promass; y Deni del Carmen Becerril, Head of Computer Systems Engineering, Escuela Superior de Cómputo del IPN.

El evento DCD>Compute, que se realizará en paralelo con DCD>Connect en el Barceló Maya Grand Resort los días 30 de septiembre y 1 de octubre, estará enfocado en cómputo, almacenamiento y redes. Reunirá a actores clave del ecosistema tecnológico regional: desde hyperscalers y líderes de TI corporativa hasta proveedores de soluciones especializadas.

DCD entrevistó a Arturo Marroquín antes de su participación en el evento, para conocer su visión sobre los retos actuales en resiliencia y ciberseguridad.

¿Cuáles son los principales desafíos de resiliencia y ciberseguridad en infraestructuras de alta densidad hoy en día?

Uno de los retos más grandes de hoy en día es la complejidad para operar los sistemas y mantenerlos actualizados y en línea. En entornos de alta densidad, donde se ejecutan cientos o miles de workloads de forma simultánea, cualquier falla, por mínima que sea, puede escalar rápidamente. La resiliencia actualmente no consiste únicamente en contar con redundancia o alta disponibilidad, sino en automatizar la operación lo más posible, anticiparse y predecir fallos para aislar su impacto en tiempo real.

En materia de ciberseguridad, el gran desafío de las organizaciones es mantener la visibilidad y el control sin afectar el rendimiento. Hoy las amenazas se mueven más rápido que nunca, impulsadas por la IA y la automatización, y en estos entornos de alta densidad un ataque puede comprometer múltiples sistemas si no se cuenta con una adecuada segmentación. Además, la gestión integral de la infraestructura —desde el diseño hasta la operación cotidiana— sigue siendo un área gris en la que muchas organizaciones apenas comienzan a incursionar y madurar.

¿Cómo deberían las organizaciones medir y evaluar la resiliencia de su infraestructura de alta densidad, especialmente frente a cargas de trabajo de IA y grandes volúmenes de datos?

Creo que hay que ir más allá de los tradicionales KPIs como disponibilidad, latencia y tasa de errores. Hoy en día, debemos medir la resiliencia en función de cuánto tiempo tardamos en recuperarnos de una falla o un ataque, qué tan preparados estamos para enfrentar cargas inesperadas en los workloads o incluso qué tan capaces somos de resistir múltiples fallos simultáneos. Esos son, en realidad, los indicadores que nos dirán si estamos listos o no para operar bajo presión.

Ahora bien, con cargas de IA y datos masivos, es primordial evaluar cómo responderá nuestra infraestructura ante workloads intensivos, latencia variable y demandas de recursos fluctuantes. Debemos estresar por completo la infraestructura y asegurarnos de que se incluyan escenarios reales, como el entrenamiento de modelos complejos de IA, y no solo simulaciones genéricas o de “template”.

Desde el punto de vista financiero, ¿cómo se puede equilibrar la inversión entre infraestructura de compute, almacenamiento resiliente y medidas de ciberseguridad?

Tema escabroso: este equilibrio es todo un arte. Lo que recomiendo es partir de una evaluación de prioridad y criticidad de los activos, recordando que no todo requiere el mismo nivel de disponibilidad, recuperación ni protección. Existen workloads que pueden tolerar interrupciones breves, mientras que otros requieren alta disponibilidad y monitoreo extremo.

La clave, creo, está en alinear la inversión en infraestructura con el valor que aportan al negocio. Por ejemplo, si tenemos alguna plataforma de IA que genere en tiempo real análisis e insights para la toma de decisiones estratégicas, entonces vale la pena invertir en poder de cómputo y seguridad. Pero si se trata de un entorno de desarrollo sencillo, se puede optar por soluciones mucho más flexibles y asequibles.

También ayuda bastante dejar de trabajar con modelos de infraestructura estática y comenzar a implementar modelos “As a Service”, donde puedas escalar según la demanda y las reglas que esta detone, evitando así el sobreaprovisionamiento.

Algo que siempre olvidamos es la seguridad, y la necesidad de integrarla desde el diseño —el famoso Security By Design. Esto reducirá costos y riesgos a mediano y largo plazo.

¿Qué impacto tiene la regulación de datos y la protección de información sensible en la planificación y operación de infraestructuras resilientes?

La regulación ya no es solo un tema legal; hoy en día, es un factor que influye directamente en cómo se diseña y opera nuestra infraestructura. Cuando estás planeando algo que sea resiliente, debes pensar desde el inicio dónde están los datos (lógica y geográficamente), quién puede accederlos, cómo se cifrarán y cómo se auditarán.

Normativas como GDPR en la Unión Europea, la Ley Federal de Protección de Datos en México, o regulaciones muy específicas como HIPAA o PCI-DSS, nos obligan a construir infraestructuras que no solo sean robustas y redundantes, sino que estén listas para cumplir con todos los temas de compliance. Esto impacta todo, desde la arquitectura de red hasta el tipo de almacenamiento y la encriptación que se elija.

Debemos recordar que proteger datos sensibles implica controles de acceso definidos, monitoreo constante y un plan de respuesta a incidentes para actuar ante cualquier eventualidad. Todo esto termina por afectar cómo se opera y mantiene la resiliencia, sin comprometer ni la seguridad ni el cumplimiento normativo.

Info – DataCenterDynamic

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *