Archiwizacja danych: Różnice pomiędzy wersjami

Z KdmWiki
Przejdź do nawigacji Przejdź do wyszukiwania
(-leo)
Linia 7: Linia 7:
 
* Zabronione jest zmienianie nazw plików i katalogów po skopiowaniu.}}
 
* Zabronione jest zmienianie nazw plików i katalogów po skopiowaniu.}}
  
'''Archiwizacja danych''' dla użytkowników [[KDM]] możliwa jest przez katalog '''/archiwum/$USER''' dostępny na wszystkich [[maszyny obliczeniowe|maszynach obliczeniowych]] WCSS. Korzystanie z archiwum na klastrze [[Supernova]] odbywa się za pośrednictwem dedykowanego węzła - serwera [[archiwum.wcss.pl | '''archiwum.wcss.pl''']].
+
Jeżeli użytkownik potrzebuje miejsca na przechowywanie dużej ilości danych, powinien w tym celu skorzystać z archiwum. Archiwizacja danych dla użytkowników [[KDM]] możliwa jest przez katalog '''/archiwum/$USER''' dostępny na wszystkich [[maszyny obliczeniowe|maszynach obliczeniowych]] WCSS. Katalog ten jest prywatnym archiwum użytkownika, niedostępnym dla innych użytkowników.  
  
Jeżeli użytkownik potrzebuje miejsca na przechowywanie dużej ilości danych, powinien w tym celu skorzystać z archiwum.
+
System archiwizacji automatycznie tworzy kopie zapasowe składowanych plików, z maksymalną częstotliwością trzy razy na dobę. Częstotliwość jest regulowana przez administratorów.
  
System archiwizacji automatycznie tworzy kopie zapasowe składowanych plików z maksymalną częstotliwością trzy razy na dobę. Częstotliwość jest regulowana przez administratorów.
+
Nie należy sugerować się pojemnością katalogu /archiwum ani jego podkatalogów pokazywaną przez narzędzie takie jak <code>df</code> czy <code>du</code>. Katalog ten jest jest tylko "wierzchołkiem góry lodowej" - po jego zapełnieniu powyżej wartości progowej dane są automatycznie przenoszone na robota taśmowego, bez zmiany sposobu dostępu dla użytkownika. Dlatego odczytywanie pliku z archiwum może potrwać nawet kilkadziesiąt minut (w zależności od jego wielkości), w tym czasie plik, jeśli został wcześniej zarchiwizowany, jest automatycznie przywracany i udostępniany w odpowiednim katalogu archiwum użytkownika.  
  
Nie należy sugerować się pojemnością katalogu /archiwum ani jego podkatalogów pokazywaną przez narzędzie takie jak df czy du. Katalog ten jest jest tylko "wierzchołkiem góry lodowej" - po jego zapełnieniu powyżej wartości progowej dane są automatycznie przenoszone na robota taśmowego bez zmiany charakteru dostępu. Dlatego odczytywanie pliku z archiwum może potrwać nawet kilkadziesiąt minut (w zależności od jego wielkości), w tym czasie plik, jeśli został wcześniej zarchiwizowany, jest automatycznie przywracany i udostępniany w odpowiednim katalogu archiwum użytkownika.  
+
=== Dostęp do archiwum ===
 +
Korzystanie z archiwum na klastrze [[Supernova]] odbywa się za pośrednictwem dedykowanego węzła '''archiwum.wcss.pl'''. Z tego węzła użytkownik ma dostęp do katalogu domowego i swojego katalogu na roboczym systemie plików. Aby przenieść swoje dane z katalogu domowego lub tymczasowego do/z archiwum należy zalogować się na ten węzeł i wykonać potrzebne operacje na danych.  
  
W katalogu '''/archiwum''' użytkownicy mają do dyspozycji prywatne archiwa. Pliki widziane w tym katalogu mogą zostać automatycznie przeniesione do systemu [[Archiwizacja|archiwizacji]].  
+
* Można zalogować się bezpośrednio na węzeł archiwum:
 +
> ssh archiwum.wcss.pl
  
 +
* lub najpierw na węzeł dostępowy klastra Supernova, a następnie na węzeł archiwum:
 +
> ssh supernova.wcss.pl
 +
supernova> ssh archiwum
 +
 +
=== Operacje na plikach ===
 
Korzystanie z archiwum nie różni się od korzystania ze zwykłego katalogu na dysku.  
 
Korzystanie z archiwum nie różni się od korzystania ze zwykłego katalogu na dysku.  
 +
 +
;Archiwizacja danych
 
Aby przenieść dane do archiwum wystarczy je skopiować, np. dla użytkownika <code>user1</code>:
 
Aby przenieść dane do archiwum wystarczy je skopiować, np. dla użytkownika <code>user1</code>:
 
   
 
   
Linia 25: Linia 34:
 
  plik.txt
 
  plik.txt
  
Po skopiowaniu pliku należy usunąć go z dotychczasowej lokalizacji (/home lub /scratch), aby zwolnić miejsce zajmowane przez niego na dysku, np:
+
Po skopiowaniu pliku należy usunąć go z dotychczasowej lokalizacji (/home lub /lustre/scratch), aby zwolnić miejsce zajmowane przez niego na dysku, np:
 
   
 
   
 
  > cd /home/user1
 
  > cd /home/user1
 
  > rm plik.txt  
 
  > rm plik.txt  
+
 
Aby ponownie skorzystać z pliku wystarczy skopiować go do swojego katalogu w przestrzeni /home lub /scratch, np:
+
;Przywracanie danych
 +
Aby ponownie skorzystać z pliku wystarczy skopiować go do swojego katalogu w przestrzeni /home lub /lustre/scratch, np:
 
   
 
   
 
  > cp /archiwum/user1/plik.txt /home/user1/
 
  > cp /archiwum/user1/plik.txt /home/user1/
Linia 41: Linia 51:
 
  > rm /archiwum/user1/plik.txt  
 
  > rm /archiwum/user1/plik.txt  
  
 +
;Pakowanie i kompresja (TAR)
 
Pakowanie i kompresowanie większej liczby małych plików w paczki TAR:
 
Pakowanie i kompresowanie większej liczby małych plików w paczki TAR:
  
Linia 53: Linia 64:
 
  > tar tzvf nazwa_paczki.tar.gz
 
  > tar tzvf nazwa_paczki.tar.gz
  
 +
;Pakowanie i kompresja (ZIP)
 
Pakowanie i kompresowanie większej liczby małych plików w paczki ZIP:
 
Pakowanie i kompresowanie większej liczby małych plików w paczki ZIP:
  

Wersja z 06:45, 26 paź 2012

< Podręcznik użytkownika KDM < Dostęp do KDM < Archiwizacja danych

Jeżeli użytkownik potrzebuje miejsca na przechowywanie dużej ilości danych, powinien w tym celu skorzystać z archiwum. Archiwizacja danych dla użytkowników KDM możliwa jest przez katalog /archiwum/$USER dostępny na wszystkich maszynach obliczeniowych WCSS. Katalog ten jest prywatnym archiwum użytkownika, niedostępnym dla innych użytkowników.

System archiwizacji automatycznie tworzy kopie zapasowe składowanych plików, z maksymalną częstotliwością trzy razy na dobę. Częstotliwość jest regulowana przez administratorów.

Nie należy sugerować się pojemnością katalogu /archiwum ani jego podkatalogów pokazywaną przez narzędzie takie jak df czy du. Katalog ten jest jest tylko "wierzchołkiem góry lodowej" - po jego zapełnieniu powyżej wartości progowej dane są automatycznie przenoszone na robota taśmowego, bez zmiany sposobu dostępu dla użytkownika. Dlatego odczytywanie pliku z archiwum może potrwać nawet kilkadziesiąt minut (w zależności od jego wielkości), w tym czasie plik, jeśli został wcześniej zarchiwizowany, jest automatycznie przywracany i udostępniany w odpowiednim katalogu archiwum użytkownika.

Dostęp do archiwum

Korzystanie z archiwum na klastrze Supernova odbywa się za pośrednictwem dedykowanego węzła archiwum.wcss.pl. Z tego węzła użytkownik ma dostęp do katalogu domowego i swojego katalogu na roboczym systemie plików. Aby przenieść swoje dane z katalogu domowego lub tymczasowego do/z archiwum należy zalogować się na ten węzeł i wykonać potrzebne operacje na danych.

  • Można zalogować się bezpośrednio na węzeł archiwum:
> ssh archiwum.wcss.pl
  • lub najpierw na węzeł dostępowy klastra Supernova, a następnie na węzeł archiwum:
> ssh supernova.wcss.pl
supernova> ssh archiwum

Operacje na plikach

Korzystanie z archiwum nie różni się od korzystania ze zwykłego katalogu na dysku.

Archiwizacja danych

Aby przenieść dane do archiwum wystarczy je skopiować, np. dla użytkownika user1:

> cd /home/user1
> cp plik.txt /archiwum/user1/
> ls /archiwum/user1/
plik.txt

Po skopiowaniu pliku należy usunąć go z dotychczasowej lokalizacji (/home lub /lustre/scratch), aby zwolnić miejsce zajmowane przez niego na dysku, np:

> cd /home/user1
> rm plik.txt 
Przywracanie danych

Aby ponownie skorzystać z pliku wystarczy skopiować go do swojego katalogu w przestrzeni /home lub /lustre/scratch, np:

> cp /archiwum/user1/plik.txt /home/user1/
> ls /home/user1/plik.txt

Jeżeli nie ma potrzeby przechowywania pliku w archiwum, można go stamtąd usunąć, np:

> ls /archiwum/user1/
plik.txt
> rm /archiwum/user1/plik.txt 
Pakowanie i kompresja (TAR)

Pakowanie i kompresowanie większej liczby małych plików w paczki TAR:

> tar czvf nazwa_paczki.tar.gz <lista plikow do spakowania>

Rozpakowywanie narzędziem TAR:

> tar xzvf nazwa_paczki.tar.gz [<opcjonalna lista plikow do rozpakowania>]

Sprawdzanie zawartości archiwum TAR:

> tar tzvf nazwa_paczki.tar.gz
Pakowanie i kompresja (ZIP)

Pakowanie i kompresowanie większej liczby małych plików w paczki ZIP:

> zip -r9 nazwa_paczki.zip <lista plikow do spakowania>

Rozpakowywanie narzędziem ZIP:

> unzip nazwa_paczki.zip [<opcjonalna lista plikow do rozpakowania>]

Sprawdzanie zawartości archiwum ZIP:

> zipinfo nazwa_paczki.zip