sábado, 1 de septiembre de 2007

Síndrome del sysadmin

Hace relativamente poco tiempo que tenemos un conocido colegio como cliente. La situación de su área de cómputos es complicada. Tenían un administrador de sistemas que por motivos personales tuvo que dejar de trabajar como tal.
Y bueno, ahí entramos nosotros.
Nos resultó increíble la diversidad de problemas que tenían, desde hardware en mal estado, hasta instalaciones de software pésimamente realizadas, pasando por configuraciones que supuestamente deberían proveer redundancia y protección contra fallos, pero que en realidad terminan generando los fallos por estar mal implementadas o por tener una base física inapropiada.
Al principio tuve un ataque de ira contra el administrador de sistemas anterior... pero después, viendo todo el panorama y los años que hacía que estába trabajando ahí, me dí cuenta de que en realidad no todo es culpa de él.
Es cierto que los administradores de sistemas, a veces, por estar cargados de trabajo, olvidamos algunos detalles y a veces dejamos cosas sin terminar de configurar para poder "apagarle el incendio" a alguien que vino con un problema más grave que el que teníamos entre manos en ese momento. Esa condición viene como parte del paquete. "Administrador de sistemas con experiencia y habilidad para trabajar bajo presión", piden algunos avisos por ahí, y no es joda. Los administradores de sistemas somos propensos a "estresarnos", sobre todo los que administramos sistemas con linux o unix. Un administrador que gestiona un servidor "windows" raramente se estresa, porque está acostumbrado a hacer una sola cosa por vez, por miedo a que su servidor no "responda" de la manera apropiada y algo explote sin él darse cuenta. Es raro ver un administrador Windows haciendo tres o cuatro cosas a la vez en el mismo servidor, a pesar de que dicho servidor debería tener la capacidad de hacerlo.
Nosotros, en cambio, gestionamos varios equipos simultáneamente, podemos darnos el lujo de abrir varias conexiones SSH a varios servidores esparcidos por todo el planeta y ejecutar varios comandos en forma casi simultánea sin que se nos mueva un pelo, porque estamos seguros de lo que manejamos y porque sabemos que nuestros sistemas funcionan y responden.
Esta forma de trabajar es apreciada por empleadores y clientes, pero convierte nuestra vida en una especie de "caída libre" o "carrera de locos". Todo pasa muy rápido, uno pierde la paciencia, se vuelve irritable y resulta dificil desacelerar cuando se adquirió inercia suficiente. Lo malo de esto es que, como uno vá "corriendo" mientras trabaja, a veces se "pasa alguna luz roja". Estas luces rojas suelen ser algo así como "...tendría que arreglar la configuración de ese CRM que no quedó del todo bien, pero como por ahora funciona, mejor lo dejo para cuando haya terminado de recuperar este respaldo urgente...", o "...tengo que copiarme estos archivos de configuración para que me queden de referencia, por si pierdo acceso a este servidor, pero lo hago más tarde porque están esperando este reporte en 5 minutos...", o "...tengo que automatizar este proceso, para no tener que entrar pasado mañana a correrlo manualmente, pero lo hago después porque ahora estoy en plena lucha con un servidor caído...", y así sigue la lista...
Y claro, cuando uno maneja una infraestructura de más de 5 servidores, montados sobre hardware que bien podría haber sido sacado de una de esas "donaciones" yankees de equipamiento obsoleto al Africa (con el pretexto de "disminuír la brecha tecnológica", pero que en realidad es un "mandemos toda esta porquería a nuestro basurero fuera del país", algo que comentaré en un futuro post) y además, tiene que lidiar con unos 50 usuarios (de esos que no saben distinguir una computadora de una cafetera), no es dificil acostumbrarse a tener el matafuegos en una mano y teclear con la otra, dejando pequeños detalles a resolver para cuando uno tenga tiempo... tiempo que nunca llega.
Entonces, razonando esto me dí cuenta que no fué mala actitud del administrador anterior, ni fué negligencia injustificada. El pobre tipo tuvo que lidiar con todo esto, con la sola compañía y apoyo del respaldo de su silla. Quien sabe qué intentó hacer con lo que le dieron (los directivos de las empresas golpean la puerta de su administrador de sistemas para quejarse de lo lento que andan los servidores, de lo mal que funcionan sus computadoras y todo lo que gastan en hacer andar esas porquerías, pero no se dan cuenta de las maravillas que ese sysadmin a veces logra con la basura a la que el "presupuesto de la empresa para el área informática" les permite acceder), y cuando no funcionó de la manera esperada, tuvo que aplicar el matafuegos y seguir adelante.
Es el maldito síndrome del sysadmin.
Si hay en la tierra algún verdadero administrador de sistemas que no sufra de esto, lo invito a postear un comentario. Pero eso sí, que no me venga con que maneja 2 o 3 servidorcitos (con webmin o cpanel) por ahí. En un día típico, puedo llegar a estar conectado vía SSH hasta a 10 servidores remotos, y tomen en cuenta que manejo más de 70 esparcidos en varios países...
Así que, te entiendo "sysadmin anterior", entiendo por lo que pasaste y sé que en el fondo hiciste todo lo que pudiste, y talvés eso te llevó a padecer la enfermedad que te "sacó de línea".
Ahora que publiqué esto, yo también me siento mejor.
Ya puedo seguir tratando de hacer funcionar ese maldito cluster que armaste y que se vive cayendo...

No hay comentarios:

 
Gustavo Castro

Crea tu insignia