Buenas,
os cuento un poco más. Para los más técnicos, explicación detallada un poco más abajo.
Hay dos tipos de caídas que estamos sufriendo. Unas "permanentes" o al menos largas y otras como esta de unos minutos.
Las permanentes o largas son más raras. Pero anoche tuvimos otra que me reportó Invi a las 22:40 y que cuando lo leí hacia las 22:55 seguía. Entré en la administración y al ver que estaba todo parado le dí "el botonazo". Es decir, reinicié el servidor.
Este tipo de caídas podrían admitirse si se dan algunas al año, pero son más que eso.
Las de "minutos" son porque el sistema se queda sin memoria. Y el proceso que está chupando demasiada es detectado, "matado" y reiniciado. Cuando el proceso es el Apache, el foro deja de responder y creo que también con el gestor de nombres.
Sobre estos ya me quejé y me dijeron que doblara la memoria. Pero he visto referencias en Internet en las que con mucha memoria da el mismo problema, por lo que lo descarté.
Lo de el uso de la memoria puede ser por mal diseño o configuración del sistema, o porque algo consume recursos en exceso. Ese algo podría ser el foro, por lo que la semana que viene me plantearé el subirlo de versión con tiempo y probar. Pero yo juraría que tienen algo de la configuración mal hecho.
Si con eso no avanzamos, la opción es buscar otro hospedaje. Cosa compleja y complicada. Complicada porque no hay ninguno bueno, ni caro ni barato. Y porque al principio todos son buenos, pero conforme empiezan a captar más clientes de los que pueden, el servicio cae bajo mínimos. Son muchos años en esto y muchas malas experiencias. Por eso me resistía, pero llegados a este punto hay que volvérselo a plantear.
Os tendré informados. Mientras tanto me siguen viniendo bien los "chivatazos" de cuándo se cae porque así voy a buscar al log a ver qué encuentro a esa hora más o menos.

Ahora para los que quieran explicaciones más técnicas.
Sobre la caída de anoche, he escrito a la gente de soporte a ver si me dicen algo. En el /var/log/messages hay una burrada de mensajes como estos:
Mar 4 22:25:57 vps named[21542]: client 62.109.4.89#462: error sending response: host unreachable
Mar 4 22:26:13 vps named[21542]: client 62.109.4.89#291: error sending response: host unreachable
Mar 4 22:26:53 vps named[21542]: client 62.109.4.89#61: error sending response: host unreachable
Mar 4 22:28:05 vps named[21542]: client 62.109.4.89#818: error sending response: host unreachable
Mar 4 22:28:56 vps named[21542]: client 62.109.4.89#439: error sending response: host unreachable
Mar 4 22:29:01 vps named[21542]: client 62.109.4.89#596: error sending response: host unreachable
Mar 4 22:29:06 vps named[21542]: shutting down
que probablemente provocaron la caída del named y puede que luego arrastrase al resto o simplemente que el sistema no puede trabajar sin él.
También me llamaron la atención estos mensajes que no se si son cosa normal o son intentos de ataques. Porque yo entro por ssh pero esa IP no es mía (y no fallo tanto).
Mar 4 14:07:06 vps sshd(pam_unix)[15819]: authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=220.175.15.217 user=root
Mar 4 14:07:12 vps sshd(pam_unix)[15967]: authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=220.175.15.217 user=root
Mar 4 14:07:15 vps sshd(pam_unix)[15997]: check pass; user unknown
Mar 4 14:07:15 vps sshd(pam_unix)[15997]: authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=220.175.15.217
Mar 4 14:07:18 vps sshd(pam_unix)[16077]: check pass; user unknown
De las caídas cortas ya hablé en su día, aunque ahora no lo encuentro. Tal vez fueran correos con los moderadores. Lo que he dicho arriba de que se queda sin memoria y eso. Es normal que Linux/Unix tienda a usar toda la memoria de que dispone y es normal también que se maten procesos y se reinicien si se queda bajo mínimos. Pero lo que no es normal es que suceda tan a menudo. Yo tengo un PIII con 760 Mb y me pilla toda igual que me lo hacía hasta hace poco con 512, pero sigue corriendo sin problemas y ahí está 24h/día sin caerse nunca.
El portátil es un dual core con 2 Gb y está ocupando 1,2 Gb. Pero ambos tienen un entorno gráfico con KDE y varias aplicaciones corriendo. Lo que no es normal es que un servidor sin entorno gráfico tenga esos problemas, más porque cuando arranca está bastante tiempo con una ocupación de unos 225 Mb.
Ah, a veces lo que se cae es el demonio de la base de datos (mysqld) y entonces llegan esos mensajes que recibís los moderadores porque el foro se queja y avisa a los administradores.
Esos mensajes se estaban dando a unas horas y días fijos antes de navidad y estaba recolectando información para enviarla al ST ya que parecía que algo externo lo provocaba. Seguramente otro servidor virtual en la misma máquina que lo hacía caer. Pero después de Navidad empezaron a venir menos y hoy prácticamente han desparecido.
Y como he dicho antes, me temo que la única solución será cambiarse a otro y empezar de nuevo. Eso lleva tiempo de encontrar uno y asegurarse de que parece fiable y tiempo para hacer copias de todo y realizar la migración que lleva una serie de tareas que deben hacerse seguidas si no quieres que el foro esté caído unas horas. Así que a partir de la semana que viene intentaré planificarme, que este finde voy a Zaragoza y no puedo.
Lo dicho, seguiremos informando.
Saludos,
Colegota