J'ai, il y a peu, migré un serveur de sauvegarde NetBackup Linux via une copie du /usr/openv (c'est pas la méthode la plus jolie ni la plus recommandée, mais j'ai plein de bonnes raisons pour avoir utilisé ce procédé, que je ne donnerai pas ici).
Bref, j'ai installé NetBackup, vidé mon /usr/openv local, puis copié le /usr/openv du serveur d'origine (qui comportait le même nom évidemment). J'ai redémarrée NetBackup, et tout fonctionnait... Presque...
Les tests de sauvegardes local au master étaient concluants, mais quand je me suis rendu dans l'interface NetBackup, dans la partie Host Properties > Clients, chacun des clients me retournait un code 48 (client hostname could not be found).
Pour y remédier, j'ai purgé le host cache NetBackup (qui existe depuis la 7.0) via la commande bpclntcmd -clear_host_cache puis tenté de contacter chacun des clients via la commande bptestbpcd -host <client>. Tous répondaient et étaient opérationnels.
Mais voilà, pendant la nuit, les clients qui étaient pourtant disponibles, sont devenus injoignables avec un code 48 (encore). Un revidage du cache a réglé le souci, mais là encore c'était temporaire.
Des sauvegardes étant en cours, je n'ai pas pu arrêter NetBackup. J'ai donc supprimé à chaud les entrées présentes dans le répertoire /usr/openv/var/host_cache (c'est encore plus radical que le bpclntcmd -clear_host_cache). Ca a permis d'accéder au clients, mais contre toute attente, les codes 48 sont réapparus plus tard dans la nuit.
Mon salut est venu de la même opération, mais NetBackup arrêté, a croire qu'il existe une version du cache en RAM qui est régulièrement flushé sur disque. Le fait est qu'en vidant ce répertoire à froid, tout est rentré dans l'ordre... ouf.
Aucun commentaire:
Enregistrer un commentaire