Re: υψηλό iowait, μικρή δραστηριότητα δίσκου, πάγωμα εφαρμογών ή συστήματος
Pantelis Koukousoulas
pktoss at gmail.com
Thu Apr 14 07:33:05 UTC 2011
2011/4/13 στέργιος προσινικλής <steriosprosiniklis at gmail.com>:
> Δυστυχώς σε αυτό το σύστημα δεν αισθάνομαι άνετα να πάω πέρα από την αλλαγή
> που ήδη έκανα, δηλ.
> την χρήση του πιο πρόσφατου πυρήνα 2.6.38 (natty) από το σχετικό αποθετήριο.
> Το χρησιμοποιώ για την δουλειά μου.
> Το ωραίο είναι ότι σε άλλο μηχάνημα το ίδιο στήσιμο, δεν παρουσιάζει κανένα
> ανάλογο πρόβλημα...
ίδια κάρτα γραφικών στο άλλο μηχάνημα; Σε κάποιους από τους χρήστες στο
"megathread" που αναφέρεις φαίνεται ότι το πρόβλημα είχε σχέση με τους
drivers των γραφικών (καθόλου απίθανο δεδομένης της τωρινής κατάστασης
σε αυτό τον τομέα).
Δεδομένου ότι η κάρτα γραφικών μπορεί να κάνει "όμορφα" πράγματα στο
PCI bus αν κάτι πάει στραβά, θα μπορούσε να εξηγηθεί το high latency στο
γράψιμο στο δίσκο νομίζω.
Καλό θα ήταν να εγκαταστήσεις ένα openssh server στο μηχάνημα και να
δεις αν μπορείς να κάνεις remote login όσο είναι "κολλήμενο" (αν έχεις
πρόσβαση σε κάποιο άλλο μηχάνημα τουλάχιστον). Αν remotely δουλεύει
αυτό μπορεί να σου δώσει ένα στοιχείο.
Αν είναι νέο σύστημα (και υποστηρίζει boot μέσω usb) μπορείς να στήσεις
μια διανομή σε ένα εξωτερικό δίσκο και να παίζεις με αλλαγές εκεί χωρίς
να πειράξεις τα δεδομένα σου (απλά ρύθμισε το εναλλακτικό version ώστε
να μην κάνει mount τον κανονικό σκληρό, ούτε fsck, ούτε swapon, ούτε τίποτα).
>> Το άλλο ζητούμενο είναι να καταγράψεις το υλικό (hardware), όπως αν
>> έχεις κάρτα γραφικών με κλειστό οδηγό.
Και με ανοιχτό και με ανοιχτό! Κατά τη γνώμη μου αν δεν είναι intel αυτό τον
καιρό πρέπει να προσέχεις :)
> Πάντως φαίνεται ότι αυτή η συμπεριφορά του lucid, είναι αρκετά συνηθισμένη,
> όπως δείχνει αυτό το μέγα-νήμα 174 σελίδων
> http://ubuntuforums.org/showthread.php?t=1478787
Δυστυχώς έχω την εντύπωση ότι τόσο στο kernel bug στο bugzilla όσο και
στο "megathread" στην πραγματικότητα πρόκειται για πολλά bugs με τα ίδια
συμπτώματα και όχι για ένα μόνο.
Υπάρχουν πολλά πράγματα που μπορεί να πάνε στραβά και το αποτέλεσμα
να μοιάζει με αυτό που περιέγραψες:
* Swapping / Thrashing
* Πρόβλημα με τον Ι/Ο scheduler (elevator=as αντί για cfq?)
* Πρόβλημα με την κάρτα γραφικών
* Πρόβλημα με το SATA controller
* Κάποιο high priority thread (realtime) που κάνει παραπάνω δουλειά
από όσο θά 'πρεπε
χωρίς yield
* Το ext4 λόγω barrier=1
* Κάποιο bug στο cpu scheduler, στο virtual memory ή ακόμα και στα
διάφορα locks.
* και πολλά, πολλά ακόμα.
Δυστυχώς ο μόνος τρόπος για να βρεθεί και να λυθεί το συγκεκριμένο πρόβλημα
είναι να γίνει αρκετά λιγότερο ασαφές. Π.χ., αν υπάρχει ένα testcase
που εγγυημένα
"κολλάει" το μηχάνημα σε ένα σαφώς καθορισμένο hardware/kernel που μπορεί
κάποιος developer να αναπαράγει τότε υπάρχει μια καλή ελπίδα, αλλιώς το βλέπω
δύσκολο.
Σε άλλη περίπτωση θα βοηθούσα να το δούμε πιο συστηματικά αλλά αυτό τον
καιρό δυστυχώς είμαι πολύ πιεσμένος από άποψη χρόνου ...
Χαιρετισμούς,
Παντελής
More information about the Ubuntu-gr
mailing list