Jak korzystać z kolejek PBS: Różnice pomiędzy wersjami

Z KdmWiki
Przejdź do nawigacji Przejdź do wyszukiwania
Linia 38: Linia 38:
 
</pre>
 
</pre>
 
gdzie:
 
gdzie:
* '''X''' - liczba części pierwszego zbioru zasobów
+
* '''X''' - liczba części alokacji (tzw. chunków) pierwszego zbioru zasobów
 
* '''zasób1=wartość1:zasób2=wartość2''' - opis pierwszego zbioru zasobów
 
* '''zasób1=wartość1:zasób2=wartość2''' - opis pierwszego zbioru zasobów
 
* '''Y''' - liczba części drugiego zbioru zasobów
 
* '''Y''' - liczba części drugiego zbioru zasobów
 
* '''zasób3=wartość3:zasób4=wartość4''' - opis drugiego zbioru zasobów
 
* '''zasób3=wartość3:zasób4=wartość4''' - opis drugiego zbioru zasobów
 +
 
Liczba zbiorów zasobów może być różna (równa 1 lub większa). Alokowane części mogą (ale nie muszą) znaleźć się na różnych węzłach.
 
Liczba zbiorów zasobów może być różna (równa 1 lub większa). Alokowane części mogą (ale nie muszą) znaleźć się na różnych węzłach.
  
Linia 57: Linia 58:
 
*** 512 000 MB na 10 węzłach
 
*** 512 000 MB na 10 węzłach
  
Osobnym słowem kluczowym, którego używa się podczas żądania zasobów, jest liczba procesów MPI zadania:
+
Osobnym słowem kluczowym, którego używa się podczas żądania zasobów, jest liczba procesów MPI w danej części alokacji (w chunku):
 
* '''mpiprocs''' - liczba procesów MPI
 
* '''mpiprocs''' - liczba procesów MPI
 
** domyślnie: 1
 
** domyślnie: 1
 
** maksymalnie: 24 lub 28
 
** maksymalnie: 24 lub 28
  
Należy skorzystać z tego parametru, kiedy w jednej części alokacji chcemy uruchomić więcej niż jeden proces MPI.
+
Należy skorzystać z tego parametru, kiedy w jednej części alokacji chcemy uruchomić więcej niż jeden proces MPI. W takim wypadku wartość
  
 
; Przykładowe definicje wymagań
 
; Przykładowe definicje wymagań
Zadanie uruchamia 4 procesy w obrębie jednego węzła i wymaga 4096 MB RAM (po 1024 MB na proces):
+
 
 +
Zadanie uruchamia jeden zestaw, w którym jeden proces będzie mógł uruchomić 4 wątki OpenMP lub po prostu cztery procesy i wymaga 4096 MB RAM na cały zestaw. Całość uruchomi się w ramach jednego węzła:
 +
 
 
<pre>
 
<pre>
 
select=1:ncpus=4:mem=4096MB
 
select=1:ncpus=4:mem=4096MB
 
</pre>
 
</pre>
Zadanie uruchamia 8 procesów MPI, z których każdy wymaga 512 MB RAM
+
 
 +
Zadanie uruchamia 8 zestawów po jeden proces, a każdy proces wymaga 512 MB RAM. Poszczególne zestawy mogą znaleźć się na dowolnej kombinacji węzłów - jednym lub więcej:
 +
 
 
<pre>
 
<pre>
 
select=8:ncpus=1:mem=512MB
 
select=8:ncpus=1:mem=512MB
 
</pre>
 
</pre>
Zadanie uruchamia 32 procesy MPI, po 4 w każdej części alokacji (i domyślne 2000 MB na każde 4 procesy):
+
 
 +
Zadanie uruchamia 8 zestawów po 4 procesy MPI, po 4 w każdej części alokacji (i domyślne 2000 MB na każde 4 procesy):
 +
 
 
<pre>
 
<pre>
 
select=8:ncpus=4:mpiprocs=4
 
select=8:ncpus=4:mpiprocs=4
 
</pre>
 
</pre>
Zadanie wymaga 16GB RAM (i domyślnie jednego rdzenia)
+
 
 +
Zadanie wymaga 16GB RAM (i domyślnie jednego rdzenia):
 +
 
 
<pre>
 
<pre>
 
select=1:mem=16GB
 
select=1:mem=16GB
 +
</pre>
 +
 +
Zadanie wymaga 4 zestawów po 2 procesy MPI, z których każdy uruchomi po 12 wątków OpenMP i 16GB pamięci per każdy zestaw:
 +
 +
<pre>
 +
select=4:ncpus=12:mpiprocs=2:mem=16GB
 +
</pre>
 +
Alokacja w powyższym przypadku będzia wygłądać następująco:
 +
 +
<pre>
 +
węzeł pierwszy:
 +
\_
 +
  proces MPI pierwszy
 +
  \_ pierwszy proces OpenMP
 +
  \_ drugi proces OpenMP
 +
  \_ ...
 +
  \_ 12-ty proces OpenMP
 +
  proces MPI drugi
 +
  \_ pierwszy proces OpenMP
 +
  \_ drugi proces OpenMP
 +
  \_ ...
 +
  \_ 12-ty proces OpenMP
 +
 +
węzeł drugi:
 +
\_
 +
  proces MPI pierwszy
 +
  \_ pierwszy proces OpenMP
 +
  \_ drugi proces OpenMP
 +
  \_ ...
 +
  \_ 12-ty proces OpenMP
 +
  proces MPI drugi
 +
  \_ pierwszy proces OpenMP
 +
  \_ drugi proces OpenMP
 +
  \_ ...
 +
  \_ 12-ty proces OpenMP
 
</pre>
 
</pre>
  

Wersja z 10:46, 30 mar 2017

< Podręcznik użytkownika KDM < System kolejkowy < Jak korzystać z kolejek PBS

Kolejki

Na klastrze Bem zadaniami obliczeniowymi zarządza system kolejkowania PBSPro.

Uruchamianie obliczeń odbywa się w ramach kolejek, które różnią się między sobą priorytetem, limitami czy prawami dostępu (a czasem również dostępnymi zasobami).

Uruchamianie typowych obliczeń na klastrze nie wymaga podawania kolejki, gdyż wyboru odpowiedniej kolejki dokonuje system kolejkowy na podstawie podanych przez użytkownika wymagań odnośnie czasu wykonania.

Podstawowe kolejki na klastrze Bem przeznaczone dla wszystkich użytkowników KDM:

  • main - zadania należy zlecać do tej kolejki podając limit czasu (przy użyciu konstrukcji opisanej w dalszej części artykułu: -l walltime=X)
  • short, short48h, short168h, normal, infinity - użytkownik nie ma możliwości bezpośredniego wstawiania zadań do tych kolejek, dokona tego system kolejkowy automatycznie, w oparciu o podany limit czasu.

Kolejki dostępne na klastrze Bem dla użytkowników infrastruktury PL-Grid:

  • plgrid, plgrid-long, plgrid-testing

W systemie kolejkowym zakładane są także czasowo dedykowane kolejki na specyficzne potrzeby projektowe lub grup badawczych.

Sprawdzanie stanu kolejek

Do sprawdzenia stanu kolejki służy polecenie qstat. Można korzystać z następujących jego parametrów:

  • -r - pokazuje uruchomione zadania
  • -i - pokazuje zadania oczekujące
  • -u - pokazuje zadania wybranego użytkownika
  • -f - pokazuje szczegółowe informacje o zadaniach (lub zadaniu, jeżeli podamy jego identyfikator po parametrze)

Konfigurację kolejek można przeglądać za pomocą komendy:

> qstat -q

Dokładniejsze informacje na temat kolejki wyświetla komenda:

> qstat -Qf nazwa_kolejki

Zasoby

Po wyborze odpowiedniej kolejki należy zadeklarować ilość wymaganych zasobów.

Przydział zasobów może odbywać się w jednej, spójnej części (dla zadań szeregowych lub zrównoleglonych w obrębie jednego węzła) lub kilku części (dla zadań zrównoleglonych przy użyciu bibliotek MPI). Deklarację buduje się używając wyrażenia select dla parametru -l polecenia qsub (opisanego w dalszej części). Jej format jest następujący:

select=X:zasób1=wartość1:zasób2=wartość2+Y:zasób3=wartość3:zasób4=wartość4

gdzie:

  • X - liczba części alokacji (tzw. chunków) pierwszego zbioru zasobów
  • zasób1=wartość1:zasób2=wartość2 - opis pierwszego zbioru zasobów
  • Y - liczba części drugiego zbioru zasobów
  • zasób3=wartość3:zasób4=wartość4 - opis drugiego zbioru zasobów

Liczba zbiorów zasobów może być różna (równa 1 lub większa). Alokowane części mogą (ale nie muszą) znaleźć się na różnych węzłach.

Dostępne parametry:

  • ncpus - liczba rdzeni obliczeniowych
    • domyślnie: 1
    • maksymalnie:
      • 24 na 720 węzłach
      • 28 na 192 węzłach
  • mem - rozmiar pamięci
    • domyślnie: 2000 MB
    • maksymalnie:
      • 60 000 MB na 688 węzłach
      • 125 000 MB na 214 węzłach
      • 512 000 MB na 10 węzłach

Osobnym słowem kluczowym, którego używa się podczas żądania zasobów, jest liczba procesów MPI w danej części alokacji (w chunku):

  • mpiprocs - liczba procesów MPI
    • domyślnie: 1
    • maksymalnie: 24 lub 28

Należy skorzystać z tego parametru, kiedy w jednej części alokacji chcemy uruchomić więcej niż jeden proces MPI. W takim wypadku wartość

Przykładowe definicje wymagań

Zadanie uruchamia jeden zestaw, w którym jeden proces będzie mógł uruchomić 4 wątki OpenMP lub po prostu cztery procesy i wymaga 4096 MB RAM na cały zestaw. Całość uruchomi się w ramach jednego węzła:

select=1:ncpus=4:mem=4096MB

Zadanie uruchamia 8 zestawów po jeden proces, a każdy proces wymaga 512 MB RAM. Poszczególne zestawy mogą znaleźć się na dowolnej kombinacji węzłów - jednym lub więcej:

select=8:ncpus=1:mem=512MB

Zadanie uruchamia 8 zestawów po 4 procesy MPI, po 4 w każdej części alokacji (i domyślne 2000 MB na każde 4 procesy):

select=8:ncpus=4:mpiprocs=4

Zadanie wymaga 16GB RAM (i domyślnie jednego rdzenia):

select=1:mem=16GB

Zadanie wymaga 4 zestawów po 2 procesy MPI, z których każdy uruchomi po 12 wątków OpenMP i 16GB pamięci per każdy zestaw:

select=4:ncpus=12:mpiprocs=2:mem=16GB

Alokacja w powyższym przypadku będzia wygłądać następująco:

węzeł pierwszy:
\_
  proces MPI pierwszy
  \_ pierwszy proces OpenMP
  \_ drugi proces OpenMP
  \_ ...
  \_ 12-ty proces OpenMP
  proces MPI drugi
  \_ pierwszy proces OpenMP
  \_ drugi proces OpenMP
  \_ ...
  \_ 12-ty proces OpenMP

węzeł drugi:
\_
  proces MPI pierwszy
  \_ pierwszy proces OpenMP
  \_ drugi proces OpenMP
  \_ ...
  \_ 12-ty proces OpenMP
  proces MPI drugi
  \_ pierwszy proces OpenMP
  \_ drugi proces OpenMP
  \_ ...
  \_ 12-ty proces OpenMP

Wstawianie zadań

Do wstawiania zadań do kolejki służy polecenie qsub.

Opis zadania powinien być zawarty w skrypcie powłoki. Następnie taki skrypt przekazywany jest do kolejki jako parametr polecenia qsub (lub na standardowe wejście tej komendy). Najważniejsze parametry polecenia można znaleźć poniżej:

  • -q - wybór kolejki
  • -l specyfikacja wymagań - wartości parametru mogą być następujące
    • select= - opis wymagań
    • software= - informacja o używanym oprogramowaniu
  • -N - nazwa zadania (jej długość nie może przekraczać 12 znaków)
  • -m - włączenie wysyłania powiadomień o zdarzeniach
    • b - o rozpoczęciu zadania
    • e - o zakończeniu zadania
  • -I - zadanie interaktywne (w tym przypadku nie należy przekazywać skryptu)
  • -X - przekierowanie wyświetlania (ma sens w przypadku zadań interaktywnych, wymaga logowania z przekierowaniem wyświetlania

Cenną cechą programu qsub jest możliwość przekazywania parametrów w skrypcie podanym jako argument, poprzez linie zaczynające się od:

#PBS

Usuwanie zadań

Jeżeli z jakiegoś powodu istnieje potrzeba usunięcia zadania - należy skorzystać z polecenia qdel, które przyjmuje jako parametr identyfikator zadania. Można kasować zadania zarówno oczekujące w kolejce jak i uruchomione.

Rezerwacje

Może się zdarzyć, że dostęp do zasobów potrzebny jest w określonym czasie np. za 3 tygodnie w poniedziałek między godziną 8 a 16. W takich przypadkach należy skorzystać z rezerwacji - powoduje to powstanie nowej kolejki, do której wstawione zadania nie będą konkurować o dostęp z innymi zadaniami. Należy jednak pamięć, że nie zawsze będzie to możliwe (będzie tylko wtedy kiedy system kolejkowy w żądanym czasie będzie w stanie zapewnić zasoby). Tworzenie rezerwacji odbywa się poleceniem pbs_rsub, którego najważniejsze parametry to:

  • -R - czas rozpoczęcia rezerwacji w formacie YYYYMMDDHHmm (201302010456 oznacza w takim przypadku 4:56 01.02.2013)
  • -E - czas zakończenia rezerwacji w formacie YYYYMMDDHHmm
  • -l - specyfikacja zasobów rezerwacji (w formacie takim, jak w przypadku zadań)
  • -r - reguła rekurencji (jeżeli rezerwacja ma się powtarzać cyklicznie, więcej na ten temat w manualu polecenia pbs_rsub)
  • -U - lista użytkowników, którzy mogą korzystać z rezerwacji

Do wyświetlenia informacji o rezerwacjach służy polecenie pbs_rstat. Bez parametrów listuje ono założone rezerwacje, a szczegóły o wybranej można zobaczyć dodając parametr -f i identyfikator. Aby usunąć rezerwację należy użyć polecenia pbs_rdel.

Przykłady

Uruchomienie obliczeń na postawie skryptu

  • zawartość skryptu uruchom.sh
#!/bin/bash
#PBS -q main
#PBS -l walltime=6:00:00
#PBS -l select=1:ncpus=2:mem=2048MB
#PBS -l software=test_qsub
#PBS -m be

# wejscie do katalogu, z ktorego zostalo wstawione zadania
cd $PBS_O_WORKDIR

# uruchom program
./test1 > wynik.txt
  • wstawienie skryptu
qsub uruchom.sh

Uruchomienie zadania interaktywnego

qsub -I -l walltime=6:00:00 -l select=1:ncpus=1:mem=2048MB -l software=CFX_14.5

Przekazanie skryptu przez standardowe wejście qsub

  • zawartość pliku skrypt.sh
#!/bin/bash
cat << EOF | qsub
#!/bin/bash
#PBS -q main
#PBS -l walltime=2:00:00
#PBS -l select=1:mem=512MB
#PBS -l software=qsub_stdin
#PBS -m be

# wejscie do katalogu, z ktorego zostalo wstawione zadania
# \ przez $ jest wymagany, aby powloka nie podmienila
# $PBS_O_WORKDIR na wartosc podczas wstawiania - tylko
# podczas dzialania zadania na wezle

cd \$PBS_O_WORKDIR

# uruchom program
./test1 > wynik.txt
EOF
  • wstawienie zadania:
chmod +x skrypt.sh
./skrypt.sh

Więcej o poleceniu qsub można znaleźć w manualu - poprzez uruchomienie polecenia:

man qsub

Zlecenie rezerwacji

Próba utworzenia rezerwacji w bieżącym dniu (dlatego pominięto rok, miesiąc i dzień w wymaganiach) od 12:00 do 14:00, powtarzającej się w poniedziałki, środy i piątki aż do 31.12.2018, na zasobach składających się z dwóch części po 1 rdzeniu i 2000 MB RAM, z której mogą korzystać użytkownicy user1 oraz user2

pbs_rsub -R 1200 -E 1400 -r "FREQ=WEEKLY;BYDAY=MO,WE,FR;UNTIL=20181231" -l select=2:ncpus=1:mem=2000MB -U user1,user2

Jeżeli utworzenie rezerwacji będzie możliwe - system kolejkowy wyśle wiadomość (na adres zarejestrowany w bazie) z potwierdzeniem.


Zobacz też: PBSPro