Your browser doesn't support the features required by impress.js, so you are presented with a simplified version of this presentation.
For the best experience please use the latest Chrome, Safari or Firefox browser.
Praca dyplomowa magisterska
Badanie ekonomii sieci społecznościowych
Karol Bonenberg, M.Sc.Eng.
Intelligent Decision Support Systems
Zakres tematyczny prezentacji:
- Cel pracy
- Założenia teoretyczne
- Wdrożenie
- Analiza wyników
Cel pracy
Wynika z obecnej sytuacji:
- Spadku efektywności tradycyjnych reklam
- Wzrostu popularności serwisów społecznościowych
- Trudności w przeprowadzaniu badań marketingowych sieci społecznościowych przez niezależne firmy
Cel pracy
- Opracowanie sposobu analizy ekonomicznej danych zawartych w sieciach społecznych za pośrednictwem internetowych serwisów społecznościowych
- Zaprojektowanie oprogramowania umożliwiającego automatyczne zbieranie i przechowywanie danych
- Wdrożenie oprogramowania i testy
- Analiza wyników za pomocą algorytmó do badania sieci społecznych oraz narzędzi analityki biznesowej
Założenia teoretyczne
Tradycyjne badania jakościowe i ilościowe nie są przystosowane do działania w Web 2.0.
Najczęściej stosowane metody doboru próby losowej to:
- Schemat prostego losowania bez zwracania
- Schemat losowania warstwowego (warstwy wewnętrznie jednolite, maksymalnie różne między sobą)
Założenia teoretyczne
W pracy wykorzystane zostały narzędzia analizy sieci społecznych.
Sieci pierwotnie stosowane były w socjologii i antropologii,
od niedawna używane w informatyce.
Sieć społeczna modelowana jest za pomocą grafu, zbioru wierzchołków (osób) połączonych
krawędziami (znajomościami).
Założenia teoretyczne
Wybrane pojęcia z analizy sieci:
- Gęstość sieci to stosunek liczby istniejących związków w sieci do
liczby wszystkich potencjalnych związków w sieci
- Moduł to zbiór wierzchołków taki, że gęstość połączeń wewnątrz
modułu jest większa niż gęstość połączeń między wierzchołkami należącymi
do różnych modułów
- Modularność jest różnicą między rzeczywistą liczbą krawędzi
wewnątrz modułu a liczbą wynikającą z przypadkowego podziału na moduły
Założenia teoretyczne
Wybrane pojęcia z analizy sieci:
- Współczynnik grupowania dla danego węzła jest gęstością bezpośredniego
sąsiedztwa zbioru wierzchołków bezpośrednio powiązanych z danym węzłem
- Zjawisko małych światów występuje w sieciach, które wyglądają na losowe,
ale tworzą lokalnie gęste grupy węzłów oraz posiadają niewielką średnicę i niewielką
średnią odległość między węzłami. Zjawisko bardzo często występuje w sieciach społecznych
ze względu na przechodniość silnych związków i tendencję słabych związków do tworzenia
mostów skracająych średnią odległość między węzłami.
Założenia teoretyczne
Badania wskazują, że homofilia (tworzenie związków z jednostkami o dużej skali podobieństwa)
zdarza się równie często w wirtualnych sieciach społecznych, jak i tych rzeczywistych.
Wpływa ona również na kształt „małych światów” tworzących się w danej sieci społecznej, co wykorzystane
zostało w niniejszej pracy do obliczeń statystycznych.
Wdrożenie
Zbieranie danych:
- - Opierając się na założeniach teoretycznych, do pewnej liczby wybranych losowo
bez zwracania mieszkańców Poznania wysłano zaproszenia do wzięcia udziału w badaniu
- - Osoby, które wyraziły zgodę, zainstalowały aplikację w serwisie Facebook,
monitorującą informacje napływające z sieci społecznej w kierunku badanego użytkownika
Wdrożenie
Zbieranie danych:
- Po instalacji aplikacji, z napływających do profilu użytkownika danych program wybiera interesujące zdarzenia
- Dane następnie magazynowane są w hurtowni danych i przetwarzane za pomocą narzędzi analitycznych
Schemat losowania warstwowego w sieci społecznej. Poszczególne warstwy oznaczone są kolorami.
Wdrożenie
Przepływ informacji:
- Aplikacja składa się z Instalatora oraz Monitora
- Użytkownik musi uruchomić Instalator przynajmniej jeden raz, żeby Monitor
uzyskał dostęp do profilu użytkownika i mógł systematycznie zbierać napływające
informacje
Przepływ informacji i struktura programu.
Analiza wyników
W trakcie jedenastu dni badań zebrano do bazy danych blisko 90 000 rekordów
pochodzących z sieci społecznej o rozmiarze 17 241 osób.
Próba losowa o rozmiarze 17 241 osób podzielona według płci i grup wiekowych.
Wykres liczby zebranych rekordów w czasie, z podziałem na kategorie.
Analiza wyników
Podsumowanie:
- Serwis Facebook szacuje liczbę użytkowników z terenu aglomeracji Poznania na ponad 300 tysięcy osób
- Z 1000 losowo wybranych osób, 52 zainstalowały aplikację zbierającą dane z ich sieci społecznych
- Uzyskano w ten sposób dostęp do 17 241 osób, z czego 9 208 osób udziela informacje o swoim miejscu zamieszkania
- Z pośród nich, 4 092 osoby zostały włączone do badań na obszarze Poznania
Proces przetwarzania informacji z hurtowni danych
Wizualizacja zgromadzonej sieci społecznej rozmieszczonej w przestrzeni za pomocą algorytmu
Fruchterman-Reingold wraz z podziałem na lokalne społeczności (oznaczone kolorami) za pomocą algorytmu Louvain.
Analiza wyników
Porównanie liczby zdarzeń monitorowanych procesów z całej populacji Poznania w ciągu tygodnia badań.
Liczba zdarzeń dla procesów ATTENDANCE, LIKEs, oraz LINKAGE to odpowiednio 237 600, 219 600 oraz 176 400.
Łącznie daje to 644 600 zdarzeń tygodniowo.
Analiza wyników
Do szacowania wartości zdarzeń posłużono się trzema różnymi badaniami, których celem była wycena poszczególnych działań użytkownika
w serwisie Facebook.
Na poniższych wykresach przedstawiono wycenę aktywności użytkowników serwisu na terenie Poznania w ciągu tygodnia z podziałem na procesy.
Dla procesu ATTENDANCE szacunkowa wartość wynosi 59 875 PLN, dla procesu LIKES wartość to 37 661 PLN, dla procesu LINKAGE to 23 708 PLN. Łączna szacunkowa wartość na
terenie aglomeracji poznańskiej wynosi 121 245 PLN na tydzień.