comment programmer des filecheck réguliers sur un serveur qu'on n'éteint jamais?
Snarf
snarf at dahwa.fr
Ven 4 Mar 10:50:12 UTC 2011
Le vendredi 04 mars 2011 à 10:30, lunarok at gmail.com écrivait:
[SNIP Problème]
> Si l'analyse SMART remonte des erreurs faut pas laisser trainer les
> choses. Commence par changer les disques en erreur. (les problèmes de
> fsck forcés viennent surement eux mêmes de là)
Si Smart commence a se manifester oui effectivement, prevoit un
changement de disque a court terme.
En ce qui concerne le check lui même il faut savoir deux trois trucs :
- le fsck au boot se declenche quoi qu'il arrive dans deux cas :
* le fs a atteint un nombre maximum de montage
* le fs n'as pas été chécké depuis X jours
(ces deux configs sont inscrites dans les métadonnées du fs accessible
avec la commande tune2fs -l /dev/<ma_partition> pour les ext* et
/etc/fstab (champs fs_passno , le dernier plein d'info dans le man)
Tune2f permet de les modifiers
- Les metadonnées contiennent aussi des datas concernant l'etat du fs,
des dates de montages, etc... Si le fs est declaré comme mal démonté
par exemple -> fsck
- on ne peut pas la plupart du temps faire un fsck sur un fs monté. Il
faut donc le demonté. si c'est un /var ou /home c'est gerable mais
peu stable pour la production. pour le /, tu constatras qu'il est
monté (bah oui, faut bien acceder a /bin/fsck) MAIS le / est monté en
ro. Ceci permet d'être sur qu'aucune ecriture ne sera faite pendant le
fsck (si cela ce produit, tu peux commencer a pleurer tout de suite
^^)
> Ensuite pour la surveillance de tes disques ca n'est pas par faire des
> fsck qu'il faut commencer. Il existe des outils pour interroger l'état de
> tes disques via SMART. A toi de voir ce qu'il ya de mieux (crontab avec
> email, log ... mieux à mon avis en englobant dans une solution
> Nagios)
surveille smart (pacakge smartmontool) et si tu n'eprouves pas le besoin de
monter un nagios complet, tu peux utliser juste ses plugins
/usr/lib/nagios/plugins/check_ide_smart pour l'ide par exemple (lire
doc avant)
un autre indice de mort prochaine de disque ce sont les IO wait (%wa
dans le top). dans 90% des cas, ce temps passer a attendre corresponds a
un temps ou le systeme attend que les données des disques soient
lues/ecrites (ce qui peut être tres longs si le DD est en fin de vie et
que le controle passe son temps a faire des RESET de bus ou des
corrections d'erreurs)
Jete un oeuil a ton dmesg aussi pour voir si y'a pas des erreurs hards,
ou des problemes qui segfault mysterieusement.
> Ou alors un système de fichiers qui supporte le fsck à la volée à chaud
> (btrfs si je ne m'abuse)
c'est vendredi \o/
de toute facon, avec buttfs, no need de fsck, t'as plus de données avant ;)
XFS, c'est comme le gras, c'est la vie
Snarf
--
- Pourquoi la mer, bien qu'alimentée par l'eau douce des rivières, est salée ?
- C'est parce qu'il y a des morues dedans.
-- Alphonse Allais
Plus d'informations sur la liste de diffusion ubuntu-fr