comment programmer des filecheck réguliers sur un serveur qu'on n'éteint jamais?

Avell Diroll avelldiroll at gmail.com
Ven 4 Mar 11:00:41 UTC 2011


On 04/03/11 11:15, Aldian wrote:
> J'administre depuis peu un serveur Ubuntu que je n'éteins jamais. Mais les
> rares fois où je l'éteins, et où je le redémarre, j'ai
> quasi-systématiquement des erreurs de disques tellement graves que le
> système me dit de lancer fsck manuellement et refuse de démarrer. Les
> disques que j'utilise sont un peu vieillots, et l'outil SMART de Palimpsest
> me dit qu'ils ont "quelques mauvais secteurs".
(snip)
> D'où ma question: comment ce problème est-il géré d'habitude?

Le plus important est de monitorer les données SMART (souvent avec 
smartmontools, ça s'utilise en ligne de commande et permet simplement 
d'envoyer des mails d'alerte), et de changer le disque au moindre hoquet 
de SMART.

Il ne faut pas lancer de filesystem check sur un disque monté, par 
contre il est possible de programmer une étape de maintenance de temps 
en temps pendant laquelle le server est coupé (tout server qui nécessite 
un uptime ne permettant pas une coupure tous les mois doit être 
redondé), en général tard dans la nuit ou a tout moment où les stats du 
service indique une faible utilisation.

Certains filesystems permettent des checks "à chaud", ZFS et BTRFS en 
particulier, mais le support de ZFS sous linux n'est pas encore idéal, 
et BRTFS est encore un peu trop jeune pour être mis en prod (je ne sais 
même pas si cette feature a été ajoutée à BTRFS, je sais juste que 
c'était dans la wishlist).

XFS est souvent sélectionné dans ce genre de situation, car il est 
robuste et permet des filesystems check très rapide, diminuant ainsi le 
downtime pour maintenance.

Finalement, il est possible de créer un snapshot temporaire d'un volume 
LVM et de réaliser un fsck sur le snapshot alors que le volume d'origine 
est toujours monté et utilisé, mais bien sûr, cela nécessite d'utiliser LVM.
Pour réaliser ce genre de choses, on peut s'inspirer de e2croncheck de 
Theodore Ts'o.
http://ftp.kernel.org/pub/linux/kernel/people/tytso/e2croncheck

Bonne continuation

Ju
-- 
Si l'oeuf tombe sur la pierre, ... malheur a l'oeuf
Si la pierre tombe sur l'oeuf, ... malheur a l'oeuf




Plus d'informations sur la liste de diffusion ubuntu-fr