Hurtownie Danych - projekty na sem. letni 2010

Data Warehouses - projects


dr hab. inż. Robert Wrembel

Celem każdego z poniższych projektów jest:
  • zaprojektowanie modelu konceptulanego hurtowni danych,
  • zaimplementowanie ww. modelu w technologii ROLAP lub MOLAP (w zależności od projektu),
  • wczytanie danych ze źródeł zewnętrznych do hurtowni danych,
  • zaimplementowanie zapytań analitycznych (specyficzne dla każdego z projektów).
Projekty są realizowane w zespołach 3-osobowych. Pierwsze zajęcia projektowe rozpoczynają się 19.04.2010. Projekty będą zaliczane na 2 ostatnich zajeciach. Zaliczenie projektu obejmuje: (1) sprawozdanie obejmujące projekt hurtowni danych, warstwy etl, warstwy analitycznej, opis napotkanych problemów i ich rozwiazań (uwaga: sprawozdanie przyjmowane jest wyłącznie w postaci cyfrowej), (2) prezentację wyników dla całej grupy (z wykorzystaniem slajdów i pokazu na żywo), (3) rozmowę zaliczającą z prowadzącym zajęcia. Z projektu można maksymalnie uzyskać 50 punktów.

Tematy projektów dla grupy 11:45

  • A1. Dziedzina: fundusze inwestycyjne stabilnego wzrostu. Źródła danych: plik csv i xls. Technologia implementacyjna: IBM DB2 (ROLAP). Analizy: ranking funduszy stabilnego wzrostu za rok 2009, analiza trendu funduszy stablinego wzrostu w każdym z miesięcy roku 2009.
    Studenci: Sebastian Kujawa, Mateusz Kaczmarek.
  • A2. Dziedzina: fundusze inwestycyjne akcyjne. Źródła danych: plik csv, xls, baza danych Oracle. Technologia implementacyjna: SQL Server (ROLAP). Analizy: ranking funduszy stabilnego wzrostu za rok 2009, analiza trendu funduszy stablinego wzrostu w każdym z miesięcy roku 2009, predykcja trendu na rok 2010.
    Studenci: Błażej Leśny, Marcin Szajek, Mateusz Zozuliński.
  • A3. Dziedzina: fundusze inwestycyjne zrównoważone. Źródła danych: plik csv, MySQL. Technologia implementacyjna: SQL Server (MOLAP). Analizy (język MDX): minimalna i maksymalna wartość jednostki funduszu w zadanym okresie roku 2009, średnia wartość jednostki funduszu w zadanym okresie, ranking funduszy w zadanym okresie.
    Studenci: Michał Nowak, Jacek Jędrzejczak, Karol Kęsy.
  • A4. Dziedzina: fundusze inwestycyjne za rok 2008, 2 wybrane rodzaje funduszy, po 2 fundusze danego rodzaju. Źródła danych: SQL Server i plik csv. Należy dokonać profilowania źródeł z wykorzystaniem Oracle Data Integrator.
    Studenci: Mikołaj Kędzierski, Szymon Bosy, Wiktor Krzyrzanowski.
  • A5. Dziedzina: kursy akcji. Źródła danych: plik csv. Technologia implementacyjna: Oracle lub SQLServer oraz SAP Business Objects. Analizy: średnie miesięczne kursy akcji 5 wybranych spółek wybranego sektora, średnia roczna wartość koszyka WIG20 za lata 2008 i 2009, predykcja trendu wybranej spółki na czerwiec 2010.
    Studenci: Marcin Ratajczak, Tomasz Ratajczak, Krzysztof Hasiński.

Tematy projektów dla grupy 13:30

  • A6. Dziedzina: fundusze inwestycyjne papierów dłużnych. Źródła danych: MySQL, xls. Technologia implementacyjna: DB2 (ROLAP). Analizy: procentowy spadek/wzrost wartości trzech najlepszych funduszy w ostatnich 4 miesiącach roku 2009, analiza trendu w każdym z miesięcy roku 2009, predykcja trendu na rok 2009.
    Studenci: Anot Kozik, Hubert Gęzikiewicz.
  • A7. Dziedzina: kursy akcji. Źródła danych: plik csv. Technologia implementacyjna: SQLServer (MOLAP). Analizy (język MDX): średnie miesięczne kursy akcji 5 wybranych spółek wybranego sektora, średnia roczna wartość koszyka WIG20 za lata 2008 i 2009, predykcja trendu wybranej spółki na czerwiec 2010.
    Studenci: Adrian Szulc, Paweł Smoczyk, Piotr Sałata.
  • A8. Dziedzina: kursy akcji. Źródła danych: plik csv. Technologia implementacyjna: Oracle i SAP Business Objects. Analizy: średnie miesięczne kursy akcji 5 wybranych spółek wybranego sektora, procentowy spadek/wzrost wartości koszyka MIDWIG za lata 2008 i 2009, predykcja trendu wybranej spółki na czerwiec 2010.
    Studenci: .
  • A9. Dziedzina: kursy akcji za rok 2008, koszyk TechWIG. Źródła danych: SQLServer, plik csv. Należy dokonać profilowania źródeł z wykorzystaniem Oracle Data Integrator.
    Studenci: Łukasz Rek, Mikołaj Sielużycki, Krzysztof Jaroński.
  • A10. Dziedzina: kursy walut. Źródła danych: MySQL, SQLServer, Access. Technologia implementacyjna: SQLServer (MOLAP). Analizy (język MDX): średnie kursy walut za poszczególne miesiące i kwartały roku 2009 dla USD, GBP, EUR, maksymalny i minimalny kurs ww. walut w roku 2009, predykcja kursu USD na wrzesień 2010.
    Studenci: .
  • A11. Dziedzina: fundusze inwestycyjne zrównoważone i stablinego wzrostu. Źródła danych: SQLServer (fund. zrównoważone), DB2 (fund. stab. wzrostu). Technologia implementacyjna: Oracle (ROLAP). Analizy: średnie miesięczne i kwartalne wartości jednostki uczestnictwa w roku 2009 z podziałem na poszczególne fundusze. Należy ponadto zaprojektować przepływ ETL.
    Studenci: Krzysztof Stefaniak, Paweł Roszak, Marek Łukaszczyk.