IT INFRASTRUCTURE & CLOUD ENGINEER
ZAPOPAN, JALISCO, MX
OBJETIVO
Garantizar la continuidad operativa de los servicios tecnológicos mediante la administración proactiva y mejora continua de la infraestructura híbrida (cloud y on-premise), asegurando la disponibilidad de recursos, la integridad de la capacidad computacional, la implementación de controles de seguridad, el monitoreo constante del estado de los sistemas y la ejecución de planes de continuidad y recuperación ante desastres, con el fin de prevenir interrupciones y mantener la operación estable de los entornos alojados en la nube y centros de datos.
PRINCIPALES RESPONSABILIDADES
- Administrar la infraestructura híbrida compuesta por nube pública, servidores físicos y sistemas NAS, mediante la operación de servicios en modelos IaaS, PaaS y SaaS, aplicando actualizaciones, parches y políticas de seguridad, con el fin de garantizar la alta disponibilidad, el rendimiento y la protección de los sistemas de cómputo y almacenamiento.
- Gestionar los servicios de Active Directory y Entra ID, mediante la administración de dominios, estructuras organizativas (OUs), políticas de grupo (GPOs) y sincronización de identidades con Entra Connect, con el objetivo de controlar el acceso a los recursos, asegurar la conectividad entre entornos físicos y en la nube, y mantener la disponibilidad de servicios críticos como DNS y DHCP.
- Administrar la plataforma de nube vigente (AWS, Azure o GCP), gestionando organizaciones, cuentas o suscripciones, presupuestos, monitoreo y cumplimiento, con el propósito de mantener una relación efectiva con los proveedores y asegurar el cumplimiento de los niveles de servicio contratados.
- Operar el datacenter y los sitios de TI mediante la planificación de requerimientos eléctricos, la gestión de racks, energía (UPS y generadores), enfriamiento, PDUs, cableado estructurado y monitoreo ambiental, con el objetivo de asegurar la disponibilidad, estabilidad y buen funcionamiento de la infraestructura física, a través de bitácoras y coordinación de mantenimientos preventivos con proveedores especializados.
- Administrar las políticas de respaldo, recuperación y continuidad mediante la implementación del Plan de Recuperación ante Desastres (DRP), definiendo objetivos de recuperación (RPO/RTO), y utilizando herramientas como Veeam o Azure Backup para la ejecución de respaldos, réplicas, restauraciones, runbooks y ejercicios periódicos (tabletop/failover), con el fin de garantizar la recuperación oportuna y efectiva de los sistemas críticos en caso de contingencia.
- Automatizar procesos y despliegue de servicios mediante el uso de scripts en PowerShell o Bash, con el objetivo de optimizar la operación diaria, reducir errores manuales y asegurar la continuidad operativa de los sistemas.
- Implementar observabilidad en la infraestructura mediante la definición de métricas, logs y alertas, para monitorear el desempeño, detectar y gestionar incidentes mayores, ejecutar planes de mejora, administrar cambios y mantener la documentación actualizada, con el propósito de cumplir con los SLAs establecidos y garantizar la continuidad del servicio.
- Administrar y supervisar los servidores virtuales como VMware vSphere/ESXi y/o Hyper-V, mediante la gestión de recursos, monitoreo de capacidad y rendimiento, control de snapshots, y aplicación de respaldos y actualizaciones, con el fin de asegurar la disponibilidad y operación continua de los sistemas virtualizados.
- Asegurar la operación continua de las sedes asignadas como "Site Admin", mediante visitas o revisiones periódicas con personal clave, para identificar necesidades de soporte (N1 y N2) y oportunidades de mejora, en coordinación con el equipo de infraestructura, con el fin de prevenir interrupciones y mantener la estabilidad de los servicios locales.
- Mantener una estrecha relación y colaboración con la Mesa de Servicio, mediante la ejecución de los procesos de gestión de incidentes y solicitudes, con el objetivo de brindar soporte oportuno, alineado con los niveles de calidad acordados y garantizar la continuidad operativa.
Nivel Estudios/ Formación Académica
- Licenciatura/Ingeniería Terminada en Sistemas de Software o Informática
Áreas de conocimiento y experiencia
Áreas de estudio:
- Ingeniería en Sistemas
- Ingeniería en Computación
- Licenciatura en Informática
Áreas de conocimiento y experiencia:
- Gestión de plataformas cloud
- Gestión avanzada de servidores Windows y Linux
- Operación de datacenters
Años de experiencia en puesto similar
- De tres a cinco años en puestos similares.
Experiencia específica
Experiencia específica (experiencia especializada en años y conocimiento técnico):
- Servers Windows y Linux, virtualización y ambientes cloud
Conocimientos Técnicos- Especialidades:
- Administración de ambientes basados en Windows Server y Linux. - Administrar Active Directory (AD DS), DNS/DHCP, GPO y DFS, aplicar parches y hardening, automatizar con PowerShell/Bash, monitorear eventos y servicios, mantener documentación e inventario técnico al día.
- Plataformas de virtualización - Operar VMware vSphere/ESXi o Microsoft Hyper-V, configurar alta disponibilidad (HA) y migraciones en vivo, ajustar capacidad y rendimiento (CPU/RAM/IOPS), controlar cambios con pruebas y ventana.
- Gestionar AWS - Administrar cuentas y permisos, diseñar redes privadas en la nube, desplegar servidores y almacenamiento, monitorear y auditar con herramientas de AWS, y controlar costos .
- Implementar continuidad y recuperación ante desastres - Planear y probar conmutaciones por falla entre sitios/regiones, mantener guías de procedimiento y evidencias, y cumplir tiempos y puntos de recuperación acordados.
- Automatización - Crear scripts para despliegues y parches, versionar cambios y promover buenas prácticas de automatización.
- Monitoreo de plataformas - Configurar métricas, registros y alertas, construir tableros y dar seguimiento a la salud y al rendimiento de servidores y servicios.
- Operar datacenter y sitios - Coordinar energía de respaldo, enfriamiento, racks y cableado; supervisar ambiente y seguridad física. Programar y documentar mantenimientos con proveedores.
- Gestionar incidentes y cambios - Coordinar la respuesta a incidentes críticos, comunicar avances, restaurar primero y luego corregir la causa, planear cambios con pruebas, ventana y plan de reversa.
Idiomas
- INGLÉS
Paquetes de Cómputo
- PAQUETERÍA OFFICE
Comportamientos Institucionales
- Innovación
- Competencia Técnicas Principales
- Adaptación al cambio
- Cumple con los valores Clase Azul?
- Visión
- Me transformo a mí mismo y a los demás
- Competencia Técnica Relevante
- Cultura de Colaboración
- Motivación y Compatibilidad con CAM
- Competencia Técnica Complementaria
- Aspectos Técnicos
- Preparación académica
- Expectativas de desarrollo profesional
- Perfil Laboral