L'activité de mon disque dur m'inquiète !

Lami René lami at webestrie.com
Dim 2 Déc 20:43:40 UTC 2007


Guillaume a écrit :
> Christophe Meessen a écrit :
>   
>> Bonsoir,
>>
>> super information fournie par Daniel Caillibaud. Il y a fait référence à 
>> un bug qui peut provoquer un crash disque. Regardons si cela s'applique 
>> à l'Ami René.
>>
>> 1° Installez le package permettant de voir la variable qui nous intéresse:
>> $ sudo apt-get install smartmontools
>>
>> La commande df vous donnera la liste des disques durs.
>> Vous y verrez un disque /dev/sda1 etc.
>>
>> Ensuite exécutez la commande suivante (notez qu'on n'indique pas le n°)
>> $ smartctl -a /dev/sda
>>
>> Là vous verrez plein d'informations sur l'état de santé du disque, dont 
>> les erreurs qu'il a détectées.
>> Au début des données affichées, vous verrez un tableau a plusieurs 
>> colonnes et des valeurs dans la dernière colonne.
>> La première colonne est l'intitulé de la variable. Il y en a deux qui 
>> nous intéresse tout particulièrement:
>> Load_Cycle_Count  et Power_On_Hours.
>>
>> C'est le rapport des deux valeurs Load_Cycle_Count/Power_On_Hours qui 
>> indiquera la moyenne du nombre d'arrêts par heure de votre disque dur. 
>> Si la valeur est faible, votre disque n'est pas sujet au bug du parking. 
>> Si la valeur est élevée (ex: > 15) alors vous avez la cause physique du 
>> problème. On peut désactiver cette fonction d'arrêt du disque dur et 
>> ainsi préserver la durée de vie du disque dur.
>> Chez moi j'ai 81 arrêts sur 36336 heures d'activité ! Vous l'aurez 
>> deviné, ma machine tourne 24h sur 24 avec très très peu d'arrêts.
>>
>>     
> C'est la valeur dans la colonne Value ou dans la colonne Raw_Value qu'il 
> faut prendre en compte ?
>
> Guillaume

Bonjour Guillaume et tout le monde,

Voici où j'en suis.

J'ai désinstallé pour suppression complète avec Synaptique les paquets
suivants :

postfix
mailx
network-manager
network-manager-kde
network-manager-openvpn
network-manager-vpnc
knetworkmanager
evolution
pidgin

J'utilise ThunderBird, Firefox et Konversation. Je suis sur mono-poste
branché sur un D-Linx DSS-8+ « Switch II », qui lui est branché sur mon
modem ADSL Paradyne.

Voici ce que me donne la commande tail -f /var/log/syslog (pour une
période de 7 minutes) :

Dec  2 14:58:55 PIII800 kernel: [ 1458.940000] Inbound IN=ppp0 OUT= MAC=
SRC=24.201.100.165 DST=205.205.248.233 LEN=69 TOS=0x00 PREC=0x00 TTL=48
ID=38966 PROTO=UDP SPT=36740 DPT=54045 LEN=49

Dec  2 14:58:57 PIII800 kernel: [ 1460.968000] Inbound IN=ppp0 OUT= MAC=
SRC=24.201.100.165 DST=205.205.248.233 LEN=69 TOS=0x00 PREC=0x00 TTL=48
ID=43083 PROTO=UDP SPT=36740 DPT=54045 LEN=49

Dec  2 14:59:01 PIII800 kernel: [ 1465.004000] Inbound IN=ppp0 OUT= MAC=
SRC=24.201.100.165 DST=205.205.248.233 LEN=69 TOS=0x00 PREC=0x00 TTL=48
ID=16981 PROTO=UDP SPT=36740 DPT=54045 LEN=49

Dec  2 14:59:42 PIII800 kernel: [ 1505.580000] Inbound IN=ppp0 OUT= MAC=
SRC=202.137.20.28 DST=205.205.248.233 LEN=116 TOS=0x00 PREC=0x00 TTL=114
ID=64520 PROTO=UDP SPT=49007 DPT=54045 LEN=96

Dec  2 14:59:44 PIII800 kernel: [ 1507.420000] Inbound IN=ppp0 OUT= MAC=
SRC=202.137.20.28 DST=205.205.248.233 LEN=116 TOS=0x00 PREC=0x00 TTL=114
ID=64563 PROTO=UDP SPT=49007 DPT=54045 LEN=96

Dec  2 14:59:48 PIII800 kernel: [ 1511.400000] Inbound IN=ppp0 OUT= MAC=
SRC=202.137.20.28 DST=205.205.248.233 LEN=116 TOS=0x00 PREC=0x00 TTL=114
ID=64672 PROTO=UDP SPT=49007 DPT=54045 LEN=96

Dec  2 14:59:52 PIII800 kernel: [ 1516.112000] Inbound IN=ppp0 OUT= MAC=
SRC=24.45.211.98 DST=205.205.248.233 LEN=123 TOS=0x00 PREC=0x00 TTL=112
ID=10367 PROTO=UDP SPT=62670 DPT=54045 LEN=103

Dec  2 14:59:54 PIII800 kernel: [ 1518.056000] Inbound IN=ppp0 OUT= MAC=
SRC=24.45.211.98 DST=205.205.248.233 LEN=123 TOS=0x00 PREC=0x00 TTL=112
ID=10720 PROTO=UDP SPT=62670 DPT=54045 LEN=103

Dec  2 14:59:58 PIII800 kernel: [ 1522.052000] Inbound IN=ppp0 OUT= MAC=
SRC=24.45.211.98 DST=205.205.248.233 LEN=123 TOS=0x00 PREC=0x00 TTL=112
ID=11446 PROTO=UDP SPT=62670 DPT=54045 LEN=103

Dec  2 15:00:01 PIII800 /USR/SBIN/CRON[7239]: (rene) CMD (sh
/home/rene/.start_firestarter)

Dec  2 15:00:51 PIII800 kernel: [ 1574.828000] Inbound IN=ppp0 OUT= MAC=
SRC=81.5.204.168 DST=205.205.248.233 LEN=117 TOS=0x00 PREC=0x00 TTL=102
ID=46034 PROTO=UDP SPT=59017 DPT=54045 LEN=97

Dec  2 15:00:53 PIII800 kernel: [ 1576.852000] Inbound IN=ppp0 OUT= MAC=
SRC=81.5.204.168 DST=205.205.248.233 LEN=117 TOS=0x00 PREC=0x00 TTL=102
ID=46037 PROTO=UDP SPT=59017 DPT=54045 LEN=97

Dec  2 15:00:57 PIII800 kernel: [ 1580.860000] Inbound IN=ppp0 OUT= MAC=
SRC=81.5.204.168 DST=205.205.248.233 LEN=117 TOS=0x00 PREC=0x00 TTL=102
ID=46039 PROTO=UDP SPT=59017 DPT=54045 LEN=97

Dec  2 15:01:19 PIII800 kernel: [ 1602.900000] Inbound IN=ppp0 OUT= MAC=
SRC=24.64.222.248 DST=205.205.248.233 LEN=512 TOS=0x00 PREC=0x00 TTL=67
ID=65430 PROTO=UDP SPT=17502 DPT=1027 LEN=492

Dec  2 15:01:19 PIII800 kernel: [ 1602.912000] Inbound IN=ppp0 OUT= MAC=
SRC=24.64.222.248 DST=205.205.248.233 LEN=512 TOS=0x00 PREC=0x00 TTL=67
ID=65431 PROTO=UDP SPT=17502 DPT=1028 LEN=492

Dec  2 15:02:24 PIII800 kernel: [ 1667.700000] Inbound IN=ppp0 OUT= MAC=
SRC=86.197.170.210 DST=205.205.248.233 LEN=119 TOS=0x00 PREC=0x00
TTL=110 ID=37162 PROTO=UDP SPT=59338 DPT=54045 LEN=99

Dec  2 15:02:26 PIII800 kernel: [ 1669.700000] Inbound IN=ppp0 OUT= MAC=
SRC=86.197.170.210 DST=205.205.248.233 LEN=119 TOS=0x00 PREC=0x00
TTL=110 ID=37271 PROTO=UDP SPT=59338 DPT=54045 LEN=99

Dec  2 15:02:30 PIII800 kernel: [ 1673.692000] Inbound IN=ppp0 OUT= MAC=
SRC=86.197.170.210 DST=205.205.248.233 LEN=119 TOS=0x00 PREC=0x00
TTL=110 ID=37473 PROTO=UDP SPT=59338 DPT=54045 LEN=99

Dec  2 15:02:53 PIII800 kernel: [ 1696.356000] Inbound IN=ppp0 OUT= MAC=
SRC=202.137.20.28 DST=205.205.248.233 LEN=116 TOS=0x00 PREC=0x00 TTL=114
ID=1029 PROTO=UDP SPT=49007 DPT=54045 LEN=96

Dec  2 15:02:55 PIII800 kernel: [ 1698.360000] Inbound IN=ppp0 OUT= MAC=
SRC=202.137.20.28 DST=205.205.248.233 LEN=116 TOS=0x00 PREC=0x00 TTL=114
ID=1082 PROTO=UDP SPT=49007 DPT=54045 LEN=96

Dec  2 15:02:59 PIII800 kernel: [ 1702.368000] Inbound IN=ppp0 OUT= MAC=
SRC=202.137.20.28 DST=205.205.248.233 LEN=116 TOS=0x00 PREC=0x00 TTL=114
ID=1213 PROTO=UDP SPT=49007 DPT=54045 LEN=96

Dec  2 15:03:05 PIII800 kernel: [ 1708.952000] Inbound IN=ppp0 OUT= MAC=
SRC=24.45.211.98 DST=205.205.248.233 LEN=123 TOS=0x00 PREC=0x00 TTL=112
ID=43583 PROTO=UDP SPT=62670 DPT=54045 LEN=103

Dec  2 15:03:07 PIII800 kernel: [ 1710.876000] Inbound IN=ppp0 OUT= MAC=
SRC=24.45.211.98 DST=205.205.248.233 LEN=123 TOS=0x00 PREC=0x00 TTL=112
ID=43906 PROTO=UDP SPT=62670 DPT=54045 LEN=103

Dec  2 15:03:11 PIII800 kernel: [ 1715.088000] Inbound IN=ppp0 OUT= MAC=
SRC=24.45.211.98 DST=205.205.248.233 LEN=123 TOS=0x00 PREC=0x00 TTL=112
ID=44593 PROTO=UDP SPT=62670 DPT=54045 LEN=103

Dec  2 15:04:01 PIII800 kernel: [ 1764.760000] Inbound IN=ppp0 OUT= MAC=
SRC=81.5.204.168 DST=205.205.248.233 LEN=117 TOS=0x00 PREC=0x00 TTL=102
ID=46136 PROTO=UDP SPT=59017 DPT=54045 LEN=97

Dec  2 15:04:03 PIII800 kernel: [ 1766.776000] Inbound IN=ppp0 OUT= MAC=
SRC=81.5.204.168 DST=205.205.248.233 LEN=117 TOS=0x00 PREC=0x00 TTL=102
ID=46140 PROTO=UDP SPT=59017 DPT=54045 LEN=97

Dec  2 15:04:07 PIII800 kernel: [ 1770.780000] Inbound IN=ppp0 OUT= MAC=
SRC=81.5.204.168 DST=205.205.248.233 LEN=117 TOS=0x00 PREC=0x00 TTL=102
ID=46149 PROTO=UDP SPT=59017 DPT=54045 LEN=97

Dec  2 15:05:01 PIII800 /USR/SBIN/CRON[7268]: (rene) CMD (sh
/home/rene/.start_firestarter)

Dec  2 15:06:06 PIII800 kernel: [ 1889.888000] Inbound IN=ppp0 OUT= MAC=
SRC=86.197.170.210 DST=205.205.248.233 LEN=119 TOS=0x00 PREC=0x00
TTL=110 ID=50076 PROTO=UDP SPT=59338 DPT=54045 LEN=99

Dec  2 15:06:08 PIII800 kernel: [ 1891.900000] Inbound IN=ppp0 OUT= MAC=
SRC=86.197.170.210 DST=205.205.248.233 LEN=119 TOS=0x00 PREC=0x00
TTL=110 ID=50204 PROTO=UDP SPT=59338 DPT=54045 LEN=99

Dec  2 15:06:12 PIII800 kernel: [ 1895.904000] Inbound IN=ppp0 OUT= MAC=
SRC=86.197.170.210 DST=205.205.248.233 LEN=119 TOS=0x00 PREC=0x00
TTL=110 ID=50415 PROTO=UDP SPT=59338 DPT=54045 LEN=99

Pourquoi un « /USR/SBIN/CRON[7239]: (rene) CMD (sh
/home/rene/.start_firestarter) » aux 5 minutes, est-ce normal ?

Tout le reste est du « kernel », est-ce normal, et d'en avoir à toutes
les 2 à 4 secondes, c'est normal ?

Si cela n'est pas normal, comment corriger le problème ?

Maintenant, voici ce que me donne la commande sudo smartctl -a /dev/sda :

rene at PIII800:~$ sudo smartctl -a /dev/sda
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.10 family
Device Model:     ST3250620A
Firmware Version: 3.AAE
User Capacity:    250 059 350 016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sun Dec  2 15:24:01 2007 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection:
Enabled.
Self-test execution status:      (   0) The previous self-test routine
completed
                                        without error or no self-test
has ever
                                        been run.
Total time to complete Offline
data collection:                 ( 430) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection
on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        (  74) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE     
UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   117   100   006    Pre-fail 
Always       -       128034907
  3 Spin_Up_Time            0x0003   096   095   000    Pre-fail 
Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age  
Always       -       126
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail 
Always       -       0
  7 Seek_Error_Rate         0x000f   072   060   030    Pre-fail 
Always       -       15673207
  9 Power_On_Hours          0x0032   100   100   000    Old_age  
Always       -       366
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail 
Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age  
Always       -       418
187 Unknown_Attribute       0x0032   100   100   000    Old_age  
Always       -       0
189 Unknown_Attribute       0x003a   100   100   000    Old_age  
Always       -       0
190 Temperature_Celsius     0x0022   060   047   045    Old_age  
Always       -       673644584
194 Temperature_Celsius     0x0022   040   053   000    Old_age  
Always       -       40 (Lifetime Min/Max 0/27)
195 Hardware_ECC_Recovered  0x001a   070   058   000    Old_age  
Always       -       138000012
197 Current_Pending_Sector  0x0012   100   100   000    Old_age  
Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age  
Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age  
Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age  
Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age  
Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining 
LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      
104         -
# 2  Short offline       Completed without error       00%        
4         -
# 3  Short offline       Completed without error       00%        
4         -
# 4  Short offline       Completed without error       00%        
3         -
# 5  Short offline       Completed without error       00%        
0         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

rene at PIII800:~$

De quoi dois-je m'inquiéter dans tout cela ?

Merci d'avance pour votre aide précieuse, elle l'est pour moi !

L'ami René





Plus d'informations sur la liste de diffusion ubuntu-fr