|
|
SeiteninhaltLoadLeveler auf dem UNIX-Cluster: FehlersucheOder die Antwort auf die Frage: "Was tun, wenn's nicht tut?" Ein Job kann nicht abgeschickt werden Ein Job kann nicht abgeschickt werdenIst der Speicherplatz auf dem schedd_host erschöpft?Da alle Jobs auf dem schedd_host gespeichert werden, kann es durch Abschicken vieler Jobs dazu kommen, daß die Festplattenkapazität nicht ausreicht. Dies kann folgendermaßen überprüft werden: ssh traminer
df -k | grep loadl Ist die Zahl in der dritten Spalte nahe Null, muß die Festplattenkapazität erhöht werden. Ein Job wartet in der Queue, läuft aber nicht losStimmen die ausgewählten Job-Parameter?Die ausgewählten Requirements des Jobs müssen vom LoadLeveler auch zur Verfügung gestellt werden können. Z. B. kann die Klasse "c2000" nicht in Verbindung mit dem Feature "PWR" gewählt werden, da ein solcher Rechner nicht zur Verfügung steht. Die Klassen-Details sollten nochmals überprüft werden. Steht der Rechner zur Zeit zur Verfügung, der die gewählten Parameter erfüllt?Mit llstatus kan überprüft werden, ob der Rechner momentan zur Verfügung steht, der die geforderten Job-Parameter erfüllt. Falls der Rechner durch einen anderen Benutzer belegt ist, muß man warten, bis der Rechner frei wird. Wieso dürfen andere Benutzer Jobs zuerst rechnen?Andere Benutzer haben weniger Jobs oder eine höhere Klassenpriorität, so daß deren Jobs bevorzugt behandelt werden. Der Job zeigt (alloc) und geht danach in den Hold-Status?Wenn ein Job nicht zugeordnet werden kann, geht er nach einiger Zeit in den Hold-Status. Eventuell ist eine Festplatte nicht gemountet, die von dem Programm benötigt wird. Dies kann bei sogenannten shared libraries der Fall sein, die erst zur Laufzeit geladen werden. Die Shell behauptet, es stünde nicht genug Speicher zur VerfügungSoll ein Programm mehr als 256 MB Speicher verwenden, dann muß der Parameter -bmaxdata beim Kompilieren verwendet werden. Siehe hierzu "Programm-Optimierung". Für ein Programm, das 2 GB RAM verwendet, lautet der Parameter: -bmaxdata:0x80000000 Bei Programmen, die mehr als 2 GB RAM verwenden sollen, kann der Parameter entsprechend erhöht werden. Allerdings ist in diesem Fall der Stack für ein Programm im 32bit-Modus zu klein und die Shell behauptet, es stünde nicht genügend Speicher zur Verfügung. Ab 2 GB RAM sollten immer Programme im 64bit-Modus erstellt werden. Dies hat mehrere Vorteile:
Eine kurze Einführung in das Erstellen von 64bit-Programmen gibt es auf der Seite "Programm-Optimierung".
geändert am 26. Oktober 2004 E-Mail: loadlloadl@rz.uni-frankfurt.de | | Zur Navigationshilfe |
Druckversion: 26. Oktober 2004, 09:18
http://www.uni-frankfurt.de/org/hrz/services/loadl/fehlersuche.html