LoadLeveler auf dem UNIX-Cluster: Tipps & Tricks
-
Seien sie geduldig!
Der LoadLeveler muß die Informationen von über hundert Rechnern verarbeiten. Einige Minuten Wartezeit sind durchaus die Regel.
-
Programme, die beim Kompilieren für einen bestimmten Prozessor optimiert wurden, können nur auf einem Rechner laufen, der diesen Prozessor eingebaut hat. Die sogenannten Requirements teilen dies dem LoadLeveler mit und er wird eine passende Maschine wählen. Das Job-Skript muß dazu wie folgt ergänzt werden:
# @ requirements = (Arch == "R6000") && (OpSys == "AIX51") && (Feature == "PWR")
-
Soll ein Programm auf einem bestimmten Rechner laufen, so kann mit den sogenannten Requirements die gewünschte Maschine ausgewählt werden:
# @ requirements = (Arch == "R6000") && (OpSys == "AIX51") && (Machine == {"rioja" "traminer"} )
-
Das Kommandozeilenprogramm llsubmit kann nur ein Job-Skript zur Verarbeitung an den LoadLeveler schicken. Hat man mehrere solcher Skripte (z. B. sample01.cmd, sample02.cmd, ... , sample20.cmd), dann können diese mit Hilfe einer Schleife abgeschickt werden:
for i in sample*.cmd; do llsubmit ${i}; done
Für den Fall, daß die Parameterliste der Shell zu lang wird, kann man mit find arbeiten:
find . -name "sample*.cmd" -exec llsubmit {} \;
-
Die Statusmeldungen von llq aufgeschlüsselt:
| C |
Completed |
| CA |
Cancelled |
| CP |
Complete Pending |
| D |
Deferred |
| H |
User Hold |
| HS |
User Hold and System Hold |
| I |
Idle |
| NR |
Not Run |
| NQ |
Not Queued |
| P |
Pending |
| R |
Running |
|
|
| RM |
Removed |
| RP |
Removed Pending |
| S |
System Hold |
| ST |
Starting |
| SX |
Submission Error |
| TX |
Terminated |
| V |
Vacated |
| VP |
Vacate Pending |
| X |
Rejected |
| XP |
Reject Pending |
|
geändert am 26. Oktober 2004 E-Mail: loadlloadl@rz.uni-frankfurt.de
|
|
Zur Navigationshilfe