<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>

<meta http-equiv="content-type" content="text/html; charset=UTF-8">
</head>
<body bgcolor="#ffffff" text="#000000">
<font face="Arial">Hi,<br>
<br>
I am using 8.04 on several (well equipped) servers and experience the
following problem on all of them:<br>
<br>
When doing larger I/O jobs like backup, I always get a very poor
interactive response of the system. Interactive in this case means
performance of database requests, web application requests and even
interactive tools like top. The usual setup looks like this:<br>
<br>
- postgres DB as database backend<br>
- apache as loadbalancer and certificate handler<br>
- several parallel zope instances using zeo<br>
- sometimes more things like vmware-server, samba, postfix<br>
<br>
When I start a backup (via network using rsync, local to another HD
using rsync, or using a USB attached external drive), I get lots of
delayed processes in top (D), the iowait percentage goes up to 10 to 20
percent, but the throughput (watched via iostat) is not very high, at
least far away from the rates I get using only one device. The load
goes up to 20 or 30, and nothing really gets done by the system. It
seams to me that the system is standing on it's own feet.<br>
<br>
I already tried the following:<br>
<br>
- using deadline/cfq scheduler (cfq using ionice for backup processes,
gives the best results for me, but is still far away from hardware
capabilities)<br>
- on USB devices, I tried different settings for
/sys/block/*/device/max_sectors<br>
<br>
The hardware is a 24 core (4x6) Opteron, Adaptec Raid with Raid 10
(getting
up to 500MB/s read performance) and 64GB Ram.<br>
Several other servers (16, 8 Cores, 32/16GB ram, Dell perc6i Raid)
behave similar.<br>
<br>
Are there any hints on getting better I/O performance / better response
times on such machines? <br>
<br>
In my opinion, the kernel should be able to schedule the ressources in
a
way that at least any of the hardware components is the restricting
factor. What I see is a more or less idle system, high load, high
iowait percentage, no throughput.<br>
<br>
Any hints welcome!<br>
<br>
    Nils<br>
</font><br>
</body>
</html>