Hurtownie Danych i Przetwarzanie Analityczne

Data Warehouses and Analytical Processing


dr hab. inż. Robert Wrembel, prof. nadzw.

Projekty studenckie realizowane dla przemysłu i innych podmiotów otoczenia gospodarczego


Rok 2022, semestr letni

  • Projekt 1: Implementacja i ocena konektorów AirByte dla Apache Arrow Flight (IBM Software Lab Kraków): dokumentacja >>>
  • Projekt 2: Internetowe Konto Pacjenta: projekt aplikacji wspomagającej organizację pracy szpitala (szpital CM HCP): dokumentacja >>>
  • Projekt 3: Zastosowanie standardu OMOP w integracji danych medycznych (szpital CM HCP): dokumentacja >>>
  • Projekt 4: Parser dokumentów PDF na przykładzie wyników badań laboratoryjnych (szpital CM HCP): dokumentacja >>>
  • Projekt 5: Wyszukiwarka taryfikatorów dla banku PKO BP (PKO BP): dokumentacja >>>

Rok 2021, semestr letni

  • Projekt 1: Hurtownia danych obrazowych (szpital CM HCP): dokumentacja >>>
  • Projekt 2: Kompresja słownikowa (IBM Software Lab Kraków): dokumentacja >>>
  • Projekt 3: Metody oceny różnorodności danych dla kompresji typu delta (IBM Software Lab Kraków): dokumentacja >>>
  • Projekt 4: BankScrapper - pozyskiwanie informacji ze stron banków (PKO BP): dokumentacja >>>
  • Projekt 5: Dopasowanie baz referencyjnych TERYT i Poczty Polskiej (PKO BP): dokumentacja >>>
  • Projekt 6: Rozpoznanie narzedzi raportowych w Azure (Santander): dokumentajcja >>>

Rok 2020, semestr letni

  • Projekt 1: Hurtownia danych dla analizy ofert bankowych (PKO BP): dokumentacja >>>
  • Projekt 2: Data lake: wzbogacanie danych o podmiocie gospodarczym ze źródeł otwartych (PKO BP): dokumentacja >>>
  • Projekt 3: Stopień wykorzystania danych na platformie TeraData (Santander): dokumentacja >>>
  • Projekt 4: Opracowanie modelowego środowiska ETL na potrzeby szkoleń dla użytkowników biznesowych (Santander): dokumentacja >>>
  • Projekt 5: Monitor czasów wykonywania operacji push-down (IBM Software Lab Kraków): dokumentacja >>>
  • Projekt 6: Optymalizacja ETL z UDF: opening a black box (IBM Software Lab Kraków): dokumentajcja >>>
  • Projekt 7: Głębokie sieci neuronowe w rozpoznawaniu tekstu niejednorodnego (Instytut Informatyki Politechniki Poznańskiej - Syndigo): dokumentacja >>>

Rok 2019, semestr letni

Opisy projektów >>>
  • Projekt 1: Ocena algorytmów predykcji zużycia energii (Kogeneracja Zachód): dokumentacja >>>, github
  • Projekt 2: Hurtownia danych w chmurze (Santander): dokumentacja >>>
  • Projekt 3: System Snowflake (Santander): dokumentacja >>>
  • Projekt 4: Profilowanie danych w AbInitio (Santander)
  • Projekt 5: Profilowanie danych w formacie JSON (Roche): dokumentacja >>>
  • Projekt 6: Konwersja pliku JSON do postaci tabelarycznej z uwzględnieniem tablic JSON (Roche): dokumentajcja >>>
  • Projekt 7: Ocena technik i narzędzi de-duplikacji danych: dokumentacja >>>, github
  • Projekt 8: Ocena narzędzi open-source do profilowania danych
  • Projekt 9: Implementacja modelu predykcji w Netezza

Rok 2018, semestr letni

Opisy projektów >>>
  • Projekt 1: Parser zadań ETL w ABInitio (BZ WBK): dokumentacja >>>
  • Projekt 2: Parser logów wykonania zadań ETL w ABInitio (BZ WBK): dokumentacja >>>
  • Projekt 3: Implementacja modelu predykcji w Netezza: dokumentacja >>>, github1, github2
  • Projekt 4: Benchmark ETL dla projektu "Balanced ETL optimization" (IBM): dokumentacja >>>
  • Projekt 5: Ocena technologii przetwarzania plików płaskich z badań klinicznych (Roche): dokumentacja >>>
  • Projekt 6: Budowa data lake danych medycznych w oparciu o hdfs (Roche) [nie został zrealizowany]
  • Projekt 7: Model standardu przechowywania danych klinicznych SDTM i jego implementacja w bazie danych (Roche) [nie został zrealizowany]
  • Projekt 8: SPARQL Named Query Ontology and Service (Roche): dokumentacja >>>
  • Projekt 9: Projekt i implementacja przykładowej bazy danych zgodnie se specyfikacją schematu OMOP (Roche): dokumentacja >>>

Rok 2017, semestr letni

Rok 2016, semestr letni