Hay comandos que no arreglan nada, pero te ahorran hacer el idiota.
ls -la /etc/pve/nodes es uno de ellos.
No tiene épica. No luce bien en una charla. No impresiona a nadie. Pero cuando un cluster Proxmox empieza a ir raro y no te apetece sacar todavía la caja de herramientas pesada, esta comprobación corta me parece de las más agradecidas.
¿Por qué? Porque me enseña qué nodos sigue exponiendo pmxcfs dentro de la vista compartida de /etc/pve.
Hay comandos que parecen poca cosa hasta que una noche te ahorran una media hora de tonterías.
cat /etc/pve/.members entra de lleno en esa categoría.
No es el comando más famoso de Proxmox. No sale mucho en tutoriales para principiantes. No tiene ese aire heroico de pvecm status ni el dramatismo de journalctl -u corosync. Pero a mí me gusta muchísimo por una razón muy simple. Me da una foto corta, directa y muy útil de lo que pmxcfs cree que está pasando con el cluster.
Hay comandos que no arreglan nada, pero te ahorran media hora de estupideces.
Este es uno de ellos.
1 mount | grep "on /etc/pve " Cuando Proxmox empieza con comportamientos grises, yo no siempre salto primero a la web ni a pvecm status. Muchas veces hago esta comprobación antes que nada porque me responde una pregunta muy básica.
/etc/pve sigue siendo el filesystem del cluster o ya estoy mirando otra cosa con cara de carpeta normal.
Hay un punto en cualquier avería de Proxmox donde deja de tener sentido refrescar la web.
Si /etc/pve empieza a comportarse raro, si un nodo parece estar dentro del cluster pero no termina de convencerte, o si el servicio pve-cluster sale activo y aun así todo huele regular, yo dejo de pedirle respuestas a la interfaz. Quiero saber qué viene diciendo pmxcfs de verdad.
Ahí es donde tiro de este comando.
Hay averías de Proxmox que son bastante honestas.
Fallan, te sueltan un mensaje claro y listo. No hace falta montar una tesis.
Y luego están las otras. Las que se presentan con una consola que tarda, una tarea que responde raro, un storage que a veces sale y a veces no, o una acción desde la web que no termina de cuadrar con la sensación del nodo. Ahí es donde systemctl status pvedaemon me da una foto útil, sí, pero muchas veces se me queda corto. Quiero historia reciente. Quiero saber qué ha pasado hace cinco minutos, no solo si el servicio sigue levantado.
Hay momentos en los que Proxmox no está caído, pero tampoco transmite precisamente paz.
El panel carga a medias. Responde raro. Hace un amago extraño después de tocar certificados. O simplemente alguien te dice que hace un rato iba y ahora va distinto. En ese punto, si ya confirmé que el puerto 8006 escucha y que el nodo responde por HTTPS localmente, suelo ir a una pieza que me gusta bastante más que refrescar la web diez veces.
Hay una comprobación que hago muchísimo cuando el panel web de Proxmox se pone raro y todavía no sé si estoy delante de una avería seria o de una pérdida de tiempo con mucho teatro.
La hago desde el propio nodo.
1 curl -k -s -o /dev/null -D - https://127.0.0.1:8006/ A veces la versión corta que tengo en la cabeza es simplemente esta.
1 curl -k https://127.0.0.1:8006/ Luego le añado -s, -o /dev/null y -D - porque lo que quiero ver de verdad son las cabeceras y el código de respuesta, no el HTML entero del login. Pero la idea es la misma. Le estoy preguntando al propio nodo si su panel responde por HTTPS desde dentro.
Hay una pregunta bastante simple que, por algún motivo, mucha gente tarda demasiado en hacer cuando el panel web de Proxmox se pone tonto.
¿Hay algo escuchando en el puerto 8006 o no?
Parece una obviedad. Justamente por eso vale tanto.
Cuando la interfaz falla es muy fácil empezar por donde no toca. El navegador. El certificado. El túnel. El proxy inverso. La VPN. El firewall. El DNS. El cluster entero, ya puestos. Todo eso puede influir, sí. Pero antes de montar una novela prefiero comprobar si el propio nodo está escuchando en el puerto del panel.
Hay fallos en Proxmox que se ven clarísimos y hasta tienen algo de dignidad.
Se cae un servicio. Un nodo desaparece. El quorum se rompe. Perfecto. Molesta, pero al menos sabes que tienes un problema de verdad delante.
Luego están los otros.
Los que empiezan con detalles pequeños y bastante irritantes. Un storage que aparece intermitente. Una cifra que no cuadra. Un nodo que sigue vivo, pero transmite esa sensación fea de que por dentro hay algo torcido. La web aún carga. El SSH también. No parece una caída limpia. Parece más bien que alguna pieza del sistema sigue haciendo trabajo, pero lo hace arrastrando una zapatilla.
Hay días en Proxmox en los que el panel carga y, aun así, todo transmite una sensación terrible.
Entras. Ves los nodos. Navegas por las vistas. Parece que la web no está caída del todo. Pero cuando intentas hacer algo serio empiezan los gestos raros. Arrancar una VM tarda demasiado. Una acción queda colgada. La consola no termina de abrir. Una tarea se siente más lenta de lo razonable. Y de pronto aparece la duda incómoda.
Hay una clase de problema en Proxmox que me fastidia bastante porque invita a perder tiempo de forma absurda.
Abres la interfaz web y algo no termina de cuadrar. Tarda demasiado en cargar. Devuelve un error raro. Te echa de una vista. O sencillamente no responde como debería y te deja con la duda de siempre. ¿Se ha roto el panel web o lo que está mal es otra cosa?
Hay un tipo de avería en Proxmox que me pone de mal humor bastante rápido.
No hablo del desastre evidente, cuando un nodo se cae de verdad y todo el mundo se da cuenta. Hablo de esa capa más sutil donde la web va rara, /etc/pve tarda en responder, una configuración no aparece donde debería o el cluster transmite una sensación fea de “algo no está fino” aunque todavía no haya explotado nada serio.