Dialog: o bibliotekach cyforwych (BC) i systemach googlowych (GS)





Prolog
Poniższa rozmowa jest skutkiem seminarium, "Efektywne metody zarządzania treścią cyfrową i dostępem do niej", które odbyło się 16 III 2004, a referentem był Cezary Mazurek z PCSS. Po seminarium, referentowi zadawane były pytania. Zapytałem (M.Drozdowski) dlaczego w przedstawionej wizji bibliotek cyfrowych brak jest takiego źródła informacji, jakim są powiązania między dokumentami, np. powiązania hipertekstowe między stronami HTML w internecie. Na takim źródle informacji oparty jest system Google oraz inne podobne. Mówiłem, że na takich systemach będą opierać się nowe aplikacje takie jak Google define:. Argumentowałem, że zaletą takich Google systemów (GS) jest: a) olbrzymia ilość dostępnej informacji, b) porządkowanie inforamcji przeprowadzają dla nas "inni" za darmo.
Referent, wsparty przez Dawida Weissa, stwierdzili, że informacja wyciągana z powiązań między dokumentami w sieci nie jest wystarczająco wysokiej jakości. Dawid, stwierdził nawet, że np. kierując się takimi metodami, jako wykładnią wiedzy o poprawności językowej, doprowadzimy do jeszcze szybszej degradacji języka polskiego, tak niska jest jakość dokumentów w sieci. Poniższy tekst, to rozmowa jaka wywiązała później się między D.Weissem (DW), a M.Drozdowskim (MD). Tekst został sformatowany w wątkach, które wytworzyły się w dyskusji przez email.



List MD do kolegów (fork)
Date: Tue, 16 Mar 2004 14:05:08 +0100 (CET)
From: Maciej Drozdowski
To: ....
Subject: jeszcze o seminarium
Panowie,

chcialbym nie zgodzic sie z waszym pogladem, ze biblioteki cyfrowe zagwarantuja lepsza jakosc, "niezawodnosc" informacji.

Zarowno w googlo-systemie (GS) i w bibliotekach cyfrowych (BC) wg wizji Cezarego wpisy/informacje tworza ludzie. (idź za tym wątkiem). To, ze bedziemy wiedzieli kto odpowiada za pewien wpis w BC nie oznacza, ze ten wpis bedzie w 100% niezawodny. Wiedza kazdego czlowieka jest pochodna doswiadczen, przebytej drogi zyciowej itp. Dlatego wiedza bibliotekarza w BC tez moze byc stronnicza, lub niepelna (idź za tym wątkiem).

Zaleta GS jest to, ze jesli jest kilka punktow widzenia na pewna kwestie, to GS to pokaze z waga stosowna do tego jaki jest "zdrowy rozsadek" ludzkosci oddany w powiazaniach miedzy dokumentami (idź za tym wątkiem). N.b. zauwazcie, ze bibliotekarz BC tez ma w sobie zaszyty pewien "zdrowy rozsadek", ktory jednak nie jest explicite wyrazony, tak jak widoczne sa powiazania miedzy dokumentami. Druga zaleta GS jest to, ze informacja oddana w powiazaniach tworzonych przez tak wielu ludzi jest mniej podatna na zmanipulowanie.

Zaleta GS jest duzy wolumen informacji, z ktorej mozna czerpac. O wiele latwiej bedzie ssac z sieci informacje za pomoca GS niz w tloczyc je "odgornie" przez BC (idź za tym wątkiem). Dlatego GS bedzie sie szybciej napelnial informacja niz w systemie tloczonym przez ludzi (idź za tym wątkiem).

Wada GS, takiego jakim jest OBECNIE, jest to ze metainformacja zawarta w algorytmie rankingu GS nie jest znana, ani stabilna, ze zasoby znikaja. To jednak nie wyklucza wytworzenia wlasnego GS dzialajacego wg naszych wlasnych wizji/priorytetow i z wlasnym repozytorium (idź za tym wątkiem).

Jakie z tego wnioski.
a)Ja mysle, ze aplikacje oparte na GS beda rozwijac sie znacznie szybciej niz te oparte na BC, z powodu czystej roznicy w ilosci udostepnianej informacji (idź za tym wątkiem).
b)Jedno nie wyklucza drugiego, bo mozna dorobic GS do BC, ktory bedzie automatycznie tworzyl taka biblioteke, lub bedzie wspomagal jej tworzenie.
Moze sensowna bylaby hybryda taka jak citeseer, w ktorej automatycznie gromadzi sie informacje, a ludzie (ewentualnie Bibliotekarze) filtruja/moderuja te informacje (n.b. to bardzo jest zbiezne z pomyslem Cezarego o tworzeniu kolekcji). (idź za tym wątkiem).

Pozdrawiam,
Maciej



Epilog (join)
Z powyższej rozmowy można wyciągnąć następujące wnioski
a) pojęcie "jakość informacji" jest wytworem społecznym, trudnym do zdefiniowania i zmierzenia,
b) GS/BC nie wykluczają się,
c) czy ilość przechodzi w jakość nie jest pewne ;-)
d) każdy niech korzysta z tego (GS/BC) co mu miłe.