Narzędzia użytkownika

Narzędzia witryny


Pasek boczny

so:2024:skrypty_tematy

Skrypty powłoki

Do zaliczenia przedmiotu każda osoba musi napisać dwa wybrane przez siebie skrypty i wysłać je mailem do 26.05. Proszę o wpisanie [SO] na początku tematu maila.

Poniżej lista tematów skryptów. Do listy tematów mogę dopisać inne – proszę o propozycje mailem.

Lista tematów

Temat 1. Samorozpakowujący się skrypt kompilujący i sprawdzający poprawność działania skompilowanego programu
Skrypt ma osadzone archiwum z kodem źródłowym wybranego programu. Po uruchomieniu skrypt sprawdza czy spełnione są określone wymagania, m. inn: czy są dostępne potrzebne kompilatory i biblioteki, czy jest dość miejsca na dysku, czy wskazany katalog docelowy nie istnieje bądź jest pusty. Następnie skrypt rozpakowuje kod źródłowy do wskazanego katalogu docelowego i kompiluje go. Po skompilowaniu skrypt tworzy środowisko testowe (np. pliki testowe) do sprawdzenia czy skompilowany kod działa poprawnie, wykonuje testy i po przejściu testów usuwa niepotrzebne pliki (środowisko testowe, pośrednie pliki kompilacji, kod źródłowy).

Temat 2. Skrypt instalujący i konfigurujący LAMP na wybranej dystrybucji Linuksa.
Skrypt ma być uruchamiany jako root na konkretnej dystrybucji Linuksa. Najpierw ma zainstalować wybrany serwer HTTP (np. apache, nginx, lighttpd…), wybrany serwer bazy danych (mysql, mariadb, postgresql, …) oraz PHP. Następnie skrypt ma skonfigurować zainstalowane serwery – umieścić wcześniej przygotowaną stronę w głównym katalogu serwera HTTP, stworzyć bazę danych i konfigurować dostęp do niej, oraz skonfigurować działanie PHP na serwerze HTTP.
Dostęp do bazy danych musi być chroniony losowym hasłem, umieszczanym w trakcie działania skryptu w pliku konfiguracyjnym instalowanej strony.
LAMP to nazwa na typowy zestaw programów potrzebnych do działania wielu popularnych aplikacji webowych.

Temat 3. Rekurencyjne oczyszczanie nazw plików.
Skrypt ma rekurencyjnie poprawiać nazwy plików we wszystkich podanych jako argumenty katalogach tak, by zawierały w nazwach tylko znaki z listy dozwolonych znaków. Skrypt przyjmuje przełączniki, które: określają dozwolone znaki w nazwach plików, wybierają na co są zastępowane niedozwolone znaki, wybierają co ma się dziać jeśli po oczyszczeniu wiele nazw plików mapuje się na tę samą nazwę – w przypadku katalogów musi być wybór czy zawartości katalogów są łączone czy na koniec nazw katalogów dodawane są końcówki (np. kolejne liczby). Skrypt musi wspierać wielobajtowe znaki (np. Unicode) w liście dozwolonych znaków.
Podpowiedź: sed 's/[^dozwolone]/_/gi zastępuje wszystkie znaki spoza listy dozwolone na _. Końcówka i ignoruje wielkość liter.

Przykładowe wywołanie skryptu i wynik działania

Temat 4. Wykres bieżącego użycia sieci.
Skrypt odczytuje z systemu informacje o ilości przesłanych i odebranych bajtów przez wyspecyfikowaną w argumentach skryptu kartę sieciową ifname. Na tej podstawie co jakiś czas (określony w argumentach skryptu) oblicza prędkość odbioru i wysłania danych jako różnicę bajtów podzieloną przez czas od poprzedniego pomiaru. Po każdym pomiarze skrypt uaktualnia rysowane przez siebie wykresy prędkości wysłania i odbierania danych. Razem wykresy muszą zajmować całe dostępne okno terminala i muszą mieć czas jako poziomą oś. Dodatkowo skrypt ma używać wybranych znaków Unicode pozwalających na większą dokładność niż cały znak (np. ⢀⢠⢰⢸⡀⣀⣠⣰⣸⡄⣄⣤⣴⣼⡆⣆⣦⣶⣾⡇⣇⣧⣷⣿, ▁▂▃▄▅▆▇█ czy ▗▐▖▄▟▌▙█).
Liczbę wysłanych/odebranych znaków można odczytać z pliku /sys/class/net/ifname/statistics/tx_bytes i …/rx_bytes, bądź z wyników komend ethtool --statistics ifname oraz ip [--json] --statistics show dev ifname.
Zaleca się użycie znaków sterujących (por. man console_codes) do przesuwania kursora w wybrane miejsce ekranu.

Temat 5. Automatyzacja uruchamiania benchmarków i robienia wykresów z wynikami.
Temat wymaga wybrania na początku programu który dla różnej wartości jednego parametru generuje powiązany z nim wynik (bądź inną metrykę).
Skrypt przyjmuje kilka argumentów: listę bądź zakres wartości parametru, liczbę powtórzeń i pierwszą część nazwy tworzonych przez skrypt plików.
Skrypt ma uruchamiać wybrany program z kolejnymi wartościami parametru, powtarzając uruchomienie z każdą wartością parametru tyle razy ilu powtórzeń zażądano w argumentach skryptu. Skrypt ma umieszczać wyniki w pliku/plikach tekstowych.
Następnie skrypt ma wygenerować obrazek (np. svg/png) z wykresem (np. punktowym, liniowym) zależności wyniku od wartości parametru. Na wykresie dla każdej wartości parametru ma być umieszczona średnia z wyników wraz ze słupkiem błędu.
Wykresy możesz generować narzędziami takimi jak gnuplot czy R.
Jeśli nie masz pomysłu na program do ewaluacji, możesz użyć komendy szukającej liczby pierwszej o długości N bitów – openssl prime -generate -bits N – i użyć czasu wykonania jako metryki (wyniku).

Temat 6. Skrypt testujący program z kombinacjami dwóch parametrów.
Na początku skryptu ma znajdować się lista możliwych wartości każdego z dwóch zmienianych parametrów oraz komenda do uruchamiania z miejscem na wstawienie wartości tych parametrów.
Skrypt ma za zadanie uruchomić podaną komendę dla wszystkich kombinacji parametrów. Standardowe wyjście testowanego programu (bądź produkowany plik, jeśli program tworzy plik z wynikiem zamiast pisać do standardowego wyjścia) ma zostać umieszczone w pliku o nazwie jednoznacznie wskazującej na parametry z którymi został uruchomiony program. Pliki mają zostać umieszczone w katalogu którego nazwa zawiera nazwę testowanego programu oraz datę i godzinę uruchomienia skryptu. Każdy gotowy plik ma być kompresowany.
Skrypt ma wyświetlać na standardowym wyjściu bieżąco testowaną kombinację parametrów i czas uruchomienia bieżącego testu.
Wybór testowanego programu dowolny. Przykładowy program który można testować to program fio, testujący wydajność operacji wejścia-wyjścia. Przykładowo do badania wydajności dysku można w Bashu użyć komendy:
fio <(echo -e "[foo] \n time_based \n runtime=1s \n filename=/tmp/testFile \n filesize=10M \n ioengine=posixaio \n readwrite=randrw \n rwmixread=10 \n blocksize=4k")
Parametry do zmiany to np. rozmiar bloku i procent odczytów.

Temat 7. Przygotowywanie i uruchomienie testu na zdalnej maszynie.
Skrypt ma utworzyć tymczasowy katalog w którym umieści pliki z listy (lista czytana z pliku lub konfigurowalna na początku skryptu). Następnie skrypt ma przygotować plik konfiguracyjny i umieścić w nim wartości podane jako argumenty skryptu. Następnie pliki mają być skopiowane do maszyny zdalnej (adres maszyny ma być ustawialny w zmiennej na początku skryptu) i na zdalnej maszynie ma zostać uruchomiony wskazany program (też ustawialny w zmiennej na początku skryptu). Standardowe wyjście i standardowy błąd uruchomionego programu mają trafić do pliku z nazwą programu i bieżącą datą.
Wybór testowanego programu i format pliku konfiguracyjnego dowolny. Przykładowy program który można testować i format pliku konfiguracyjnego można wziąć z poprzedniego tematu.

Temat 8. Przypomnienie o najbliższych urodzinach.
Skrypt korzysta z pliku w którym znajdują się cykliczne wydarzenia – daty i opisy (format pliku dowolny, przykład formatu: 12.31 imieniny Sylwestra).
Bez argumentów, skrypt wyświetla wszystkie wydarzenia które dotyczą najbliższych dwóch tygodni, lub jeśli w przeciągu dwóch tygodni są mniej niż trzy wydarzenia, to wyświetla trzy najbliższe wydarzenia.
Z właściwymi argumentami skrypt dodaje nowe wydarzenia, usuwa istniejące bądź wypisuje najbliższe wystąpienie każdego wydarzenia porządkując wyniki chronologicznie.

Temat 9. Pokaz slajdów / prezentacja w Bashu.
Skrypt ma wyświetlać w terminalu po kolei pliki znajdujące się we wskazanym w argumentach skryptu katalogu. Nawigacja między kolejnymi "slajdami" ma odbywać się przy wykorzystaniu odpowiednich klawiszy z klawiatury, po naciśnięciu których skrypt ma przechodzić do kolejnego slajdu, przechodzić do poprzedniego slajdu, oraz wyświetlać listę plików i z tej listy przejść do dowolnego slajdu. Na każdym slajdzie, poza treścią pliku, ma znajdować się pasek stanu z numerem slajdu, łączną liczbą slajdów i nazwą pliku.
Jeśli któryś z plików jest kodem źródłowym, ma on zostać wypisany z kolorowaniem składni.
W Bashu, komenda read -sn1 wczytuje pojedynczy znak bez wypisywania go na ekran. Zauważ, że strzałka generuje trzy znaki.
Do kolorowania składni użyj zewnętrznego narzędzia (np. pygmentize).

Temat 10. Generowanie miniaturek.
Skrypt przyjmuje jako argument listę katalogów. Skrypt generuje dla każdego obrazu znajdującego się bezpośrednio w podanych katalogach miniaturę o określonym rozmiarze i umieszcza ją w podkatalogu tn w katalogu w którym znajduje się obraz. Miniaturkom ustawia czasy modyfikacji, zmiany i dostępu na identyczne jak odpowiednie czasy obrazu. Dodatkowo w każdym podkatalogu tn skrypt tworzy obraz o nazwie cover.jpg z pierwszymi 25 miniaturkami ułożonymi w siatce 5x5.
Skrypt wypisuje na ekranie nazwę każdego przetwarzanego obrazu.
W zadaniu zaleca się skorzystać z programu file do wykrywania typu MIME i pakietu narzędzi imagemagick do operacji na obrazkach (tzn. programów convert/magick oraz montage).

Temat 11. Tworzenie śladów GPX z geotagowanych zdjęć.
Skrypt ma przeglądać rekurencyjnie podane katalogi w poszukiwaniu plików .jpg. Dla każdego znalezionego pliku skrypt ma wyciągnąć pozycję GPS (GPSPosition) oraz datę i czas wykonania zdjęcia (CreateDate) z tagów (metadanych) EXIF. Na tej podstawie ma zostać utworzony plik GPX zawierający ślady (pozycja + data) oraz ścieżki (pozycja + URL do zdjęcia). Odcinki śladów/ścieżek mają być tworzone tak, by kolejne zdjęciami w jednym odcinku dzieliło mniej niż ustalony czas (np. godzina). Zdjęcia bez wymaganych tagów mają być pomijane. Skrypt ma wypisywać podsumowanie: łączną liczbę zdjęć, liczbę zdjęć z tagami, oraz liczbę wygenerowanych śladów/ścieżek.
Do napisania i testowania skryptu potrzebujesz geotagowanych zdjęć – proszę je zorganizować we własnym zakresie, np. robiąc zdjęcia telefonem bądź aparatem fotograficznym z działającym odbiornikiem GPS.
Polecenie exiftool pozwala wyciągać metadane z plików. Liczne narzędzia, np. gpxsee, wyświetlą plik GPX (pod warunkiem że będzie zgodny z odpowiednim standardem).

Przykładowy (uproszczony) plik GPX

Temat 12. Porządkowanie zdjęć.
Skrypt przyjmuje jako pierwszy argument katalog docelowy, a jako kolejne listę katalogów źródłowych.
Skrypt ma porządkować katalog ze zdjęciami. Ma przenieść każdy plik z katalogów źródłowych (rekurencyjnie) do podkatalogu rok/miesiąc/dzień w katalogu docelowym i zmienić plikom nazwy na godzina_minuta_sekunda__stara_nazwa. Jako datę skrypt ma brać dane EXIF (CreateDate, DateTimeOriginal) lub datę modyfikacji pliku jeśli plik nie ma danych EXIF. Jeśli dwa pliki z katalogów źródłowych mają tę samą nazwę i daty, skrypt ma dodawać na koniec nazwy (przed rozszerzenie) kolejne numery tak żeby nie stracić żadnego pliku.
W trackie pracy skrypt ma wypisywać linię plik źródłowy --> plik docelowy
W zadaniu zaleca się skorzystać z programu exiftool do wyciągania metadanych o pliku.

Temat 13. Ściąganie obrazków ze strony.
Skrypt przyjmuje jako argument listę adresów URL do stron www.
Skrypt pobiera wskazane strony i wyciąga z nich adresy obrazów (przez obraz należy rozumieć tag <img … z argumentem src). Następnie skrypt ściąga wszystkie obrazy z nazwami nie istniejącymi w bieżącym katalogu. Skrypt ściąga obrazy równolegle, ale z określoną górną ilością współbieżnych pobierań.
Skrypt wypisuje na ekranie każdy znaleziony na stronie obraz, wypisuje czy istnieje w bieżącym katalogu czy też będzie pobrany, oraz wypisuje komunikat o zakończeniu pobierania każdego obrazu.
W zadaniu zaleca się skorzystać z programu wget lub curl do pobierania plików z sieci.

Temat 14. Wyszukiwanie identycznych plików.
Skrypt przyjmuje jako argument listę katalogów.
Skrypt przeszukuje rekurencyjnie podane katalogi w poszukiwaniu identycznych plików. Najpierw grupuje znalezione pliki rozmiarami, następnie w każdej grupie w której jest więcej niż jeden plik liczy sumy MD5 każdego pliku. Jeśli dwa lub więcej plików ma tę samą sumę MD5, porównuje je dla pewności programem cmp.
Skrypt wypisuje na standardowe wyjście grupy identycznych plików (każda nazwa w osobnej linii) oddzielone od siebie pustą linią.

Temat 15. Rekurencyjne wyszukiwanie tekstu w katalogach.
Skrypt przyjmuje jako pierwszy argument wyszukiwane wyrażenie, jako kolejne listę katalogów.
Skrypt wyszukuje w plikach w podanych katalogach (rekurencyjnie) podanego wyrażenia. Skrypt sprawdza rodzaj pliku i dla formatów zawierających tekst, ale nie będących plikami tekstowymi ma w locie (bez tworzenia plików na dysku) przetworzyć plik na tekst i w nim wyszukiwać podanego wyrażenia. Przykładowo, z plików PDF skrypt wyciąga strumienie tekstu (pdftotext), do plików skompresowanych (.gz/.bz2/.xz…) skrypt używa odpowiednio zgrep/bzgrep/xzgrep…, a archiwa ZIP take jak pliki .zip, książki elektroniczne (.epub/.mobi/…), dokumenty MS Office (.docx/.pptx/…) czy pliki Open Document Format (.odt/.odp/…) mają być najpierw rozpakowane (np. z użyciem unzip -c).
Skrypt ma wypisywać na standardowe wyjście nazwy plików w których znajduje się szukane wyrażenie. Skrypt ma nie wyświetlać komunikatów o braku dostępu do plików.

Temat 16. Kopie zapasowe z wykorzystaniem rsync.
Skrypt ma wykonywać różnicową kopię zapasową, używając: listy katalogów źródłowych umieszczonej w osobnym pliku oraz listy wzorców ścieżek które mają być wykluczone z kopii zapasowej. Kopie zapasowe mają trafiać do określonego (w zmiennej na początku skryptu) katalogu na zdalnej maszynie (rsync wspiera przesyłanie plików po SSH). Po wykonaniu skryptu wskazana ścieżka ma zawierać katalogi nazwane jak katalogi na w liście katalogów źródłowych, z identyczną zawartością jak katalogi źródłowe, za wyjątkiem plików których ścieżka pasuje do listy wykluczeń. Każdorazowe uruchomienie skryptu ma tworzyć osobny katalog z datą uruchomienia skryptu do którego trafiają zmienione od ostatniego uruchomienia skryptu pliki.
(NB: program rsync z odpowiednimi argumentami automatycznie wykona powyższe zadania.)
Po wykonaniu kopii skrypt ma stworzyć plik z listą plików usuniętych od ostatniego uruchomienia skryptu, plik z listą zmienionych plików oraz plik z listą nowych plików, pod nazwami składającymi się z daty uruchomienia skryptu oraz przyrostków .del, .mod i .new.
W trakcie działania skrypt ma wypisywać co robi. Po skończeniu, skrypt ma wypisać ile czasu zajęło zrobienie kopii zapasowej i jak duży jest katalog z usuniętymi i zmodyfikowanymi plikami.
W skrypcie należy użyć programu rsync z opcjami --backup, --backup-dir oraz --exclude-from. Zaleca się też skorzystać z programów find i comm do generowania list plików.

Temat 17. Porównanie metod kompresji.
Skrypt przyjmuje jeden argument – nazwę pliku.
Skrypt kompresuje podany plik używając przynajmniej programów gzip, bzip2, xz i zstd z przynajmniej trzema porównywalnymi ustawieniami (profilami) dla każdego z tych programów (np. domyślne ustawienia, najwyższy poziom kompresji, średni poziom kompresji i użycie wielu wątków).
Skrypt mierzy czas kompresji i rozmiar skompresowanych plików i na tej podstawie wyświetla na ekranie tabele czasu kompresji i poziomu kompresji mające w kolumnach nazwy programów a w wierszach profile (ewentualnie na odwrót).
Tabele mają być powtórzone dla wartości bezwzględnych (tzn. w mega-/kilo-/bajtach i sekundach) oraz wartościach procentowych względem rozmiaru oryginalnego pliku i najkrótszego czasu.
Skrypt ma kompresować plik do plików tymczasowych usuwanych po wykonaniu pomiarów, oraz nie może nadpisać ani usunąć żadnego z istniejących plików (rozważ użycie programu mktemp).

Temat 18. Sprawdzanie czy program generuje poprawny wynik.
Skrypt przyjmuje jako argument nazwę polecenia.
Skrypt z pliku (o nazwie ustawionej jako zmienna na początku skryptu) czyta kolejno ścieżki do pliku z poprawnymi wynikami oraz listę argumentów z którymi takie wyniki powinny zostać otrzymane. Dla każdego takiego pliku skrypt uruchamia podane polecenie z odpowiadającymi argumentami i porównuje wynik polecenia z oczekiwanym. Skrypt ma uruchamiać polecenie równolegle, tak by wykorzystywać wszystkie dostępne wątki procesorów.
Skrypt wyświetla na standardowym wyjściu kolejne nazwy plików z oczekiwanymi wynikami i jeśli testowany program wygenerował poprawne wyniki, to dodaje słowo pass, a jeśli nie, dodaje na czerwono słowo FAIL i wypisuje pierwszą różniącą się linię. Jeśli w trakcie uruchomienia testowany program wypisał jakieś dane na standardowy błąd, to skrypt pod linią dotyczącą testowanych argumentów ma wyświetlić te dane, wcinając każdą linię tabulatorem.

so/2024/skrypty_tematy.txt · ostatnio zmienione: 2024/04/22 22:40 przez jkonczak