Laboratioria
Prowadzący: mgr inż. Bartosz Wieloch
e-mail: imię.nazwisko@cs.put.poznan.pl
Przybliżony harmonogram zajęć
Zajęcia laboratoryjne obejmują ćwiczenia (C1-C4) i realizację projektu (P).
Ocena końcowa jest wypadkową ocen cząstkowych.
Ćwiczenia
Uwaga!
Na koniec zajęć danego dnia proszę o wysłanie do mnie maila (jeszcze na zajęciach) na mój adres (imię.nazwisko@put.poznan.pl):
- temat: PiRO
- w treści:
- imiona i nazwiska
- krótko co zostało zrobione, wspomnieć jakie przetestowane metody działały gorzej a które lepiej
- załącznik: kod źródłowy
Zadania:
- Spróbuj wyodrębnić z obrazka napis (czarny obraz z białymi literami). Obrazki wczytaj jako jednokanałowe (
imread(sciezka, 0)
):
- Spróbuj napisać program rozpoznający wybrany klucz na podstawie kształtu (nie trzeba analizować wewnętrznych "dziur").
Przykładowy zestaw kluczy zawiera 12 obrazków oraz po 7 wersji automatycznie przetransformowanych (obróconych i przeskalowanych) - niestety w części z nich obiekt został "ucięty".
Sposób realizacji dowolny - można przetestować kilka podejść.
Przykładowe etapy przetwarzania:
- Wyodrębnienie obiektu z obrazka. Wynik: czarny obraz z białym kluczem.
- Znalezienie konturu obiektu.
- Wyliczenie sygnatury obiektu.
- Porównanie sygnatury wzorca z analizowanym obrazem.
Lista proponowanych tematów projektów
Uwagi wstępne:
- Tematy należy traktować jako pewne możliwe kierunki a nie konkretną specyfikację zadania.
- Artykuły i inne materiały o podobnej tematyce (np. z podanych linków) mają być inspiracją do samodzielnego opracowania metody przetwarzania obrazów.
Proponowane tematy/zagadnienia:
- Detekcja znaków drogowych: The German Traffic Sign Detection Benchmark
- Wykrywanie punktów charakterystycznych twarzy (lub innej klasy obiektów, np. samochodów), np. http://cmp.felk.cvut.cz/~uricamic/flandmark/
- Estymacja modelu 3D twarzy (głębi) ze zdjęć (zrobionych pod różnymi kątami; lub z pojedynczego zdjęcia).
- Estymacja modelu 3D np. budynku na podstawie zdjęć z różnych stron.
- Przetwarzanie obrazów medycznych z OCT (Optyczna tomografia koherencyjna).
- Biblioteka do przetwarzania obrazów 3D (z myślą o obrazach medycznych)
- Opracowanie metody śledzącej dowolny, wskazany obiekt w sekwencji wideo. Metoda powinna uczyć się (dostosowywać się do) możliwych wersji wyglądu w trakcie śledzenia. Przykład: TLD
- Wykrywanie i śledzenie wielu obiektów - przykładowy filmik
Inne projekty
Projekty realizowane w poprzednich edycjach przedmiotu
Pożądane cechy projektów:
- możliwość zdefiniowania jasnych kryteriów oceny skuteczności (np. trafność rozpoznawania, dokładność lokalizacji),
- projekt powinien zostać jednoznacznie przydzielony do jednej z dwóch kategorii: (1) implementacja [zamkniętego] systemu, (2) studium przypadku (realizacja obszernego eksperymentu obliczeniowego i opis wyników),
- w przypadku stosowania metodologii uczenia maszynowego i problemu decyzyjnego, liczba klas decyzyjnych nie może być duża; na przykład, systemy uczące się z przykładów nie nadają się do identyfikacji.
Przykładowe artykuły z których można czerpać pomysły i rozwiązania
Narzędzia
Biblioteki przetwarzania i analizy obrazów
Środowiska i programy pomocnicze
- WEKA (biblioteka uczenia maszynowego)
- Irfan Viewer
- Image Magick
- Octave
Wybrane dostępne bazy danych obrazowych
Inne bazy danych: