Korpus "Rzeczpospolitej"

Informacje


O korpusie

Korpus "Rzeczpospolitej" jest zbiorem artykułów prasowych (w formacie HTML) pobranych z internetowego serwisu gazety o tym samym tytule. Proces zbierania danych był przeprowadzony w roku 2001 i obejmuje zasoby od roku 1993 do marca 2002, przy czym nie wszystkie lata są reprezentowane równie licznie.

Dane "korpusu" zostały oficjalnie udostępnione jedynie co celów badań naukowych, pierwotnie dla potrzeb mojej pracy magisterskiej. Nie można ich udostępniać ani wykorzystywać w sposób inny niż zostało to określone.

Ponieważ dane z "Rzeczpospolitej" i tak krążą w kręgu lingwistów komputerowych w Polsce, uprzejmie proszę o umieszczenie stosownej informacji w przypadku ich wykorzystania.

— Dawid Weiss

Informacja o źródle

W publikacjach naukowych będących wynikiem prac z korpusem proszę umieścić następującą informację (cytowanie bibliograficzne).

Kurpus Rzeczpospolitej. [on-line] http://www.cs.put.poznan.pl/dweiss/rzeczpospolita

Cytowanie w systemie BibTeX:

@misc{rzeczpospolita,
    key = "rzeczpospolita",
    title = "Korpus Rzeczpospolitej",
    howpublished = "[on-line] \url{http://www.cs.put.poznan.pl/dweiss/rzeczpospolita}",
}

Pobierz dane

Dane w formacie ZIP (około 300MB).
(c) Presspublica Sp. z o.o.