Zjednoczona nauka, otwarte badania naukowe

Ten system jest obecnie w wewnętrznych testach beta.
Jeśli chcesz uczestniczyć w testach i rozwoju, daj znać!


Każdy, kto zajmuje się nauką, wie jak wygląda system czasopism, recenzji, i kosztów publikacji. Myślę, że najwyższy czas na usprawnienie obecnych mechanizmów i przy okazji usunięcie tzw. "paywall'a", czyli ograniczenia dostępu do publikacji i osiągnięć naukowych poprzez wymóg płacenia za dostęp do nich. Jednak ta strona nie skupia się na potrzebie darmowego dostępu "open access" do artykułów i danych – inicjatyw poświęconych temu celowi jest już na świecie bardzo dużo, należą one do nurtu Open Science (zobacz też Plan S oraz Otwarta Nauka). Tymczasem tutaj proponuję konkretne rozwiązanie dla całego, ogólnoświatowego zarządzania publikacjami naukowymi i ich recenzjami we wszystkich dziedzinach.

Jak było i jak jest obecnie (opis dla osób, które nie zajmują się nauką i nie wiedzą)

Kiedyś było tak, że wydawnictwo zajmowało się korektą artykułu (formatowaniem tekstu, poprawianiem drobnych usterek, grafiką, uzupełnieniem i ujednoliceniem literatury), procesem recenzji, drukiem wersji papierowych i rozsyłaniem wydrukowanych kopii artykułu. To wszystko generowało koszty, które wydawca musiał odzyskać sprzedając dostęp do artykułów (i dodatkowo mógł zarobić).

Obecnie to autor tekstu jest zwykle odpowiedzialny za odpowiednie formatowanie. To autor tekstu często musi zaproponować recenzentów podczas zgłaszania artykułu – i to w liczbie często większej niż liczba recenzji, żeby redaktor miał wybór i mógł ich dopisać do bazy danych recenzentów czasopisma. To nie wydawnictwo załatwia recenzję: to redaktor lub redaktor pomocniczy, zwykle za darmo, się tym zajmują. To redaktor lub redaktor pomocniczy, zwykle za darmo, wykonują dla wydawnictwa robotę "łowiąc" autorów do kolejnych numerów danego czasopisma, rozsyłając informacje i na różne sposoby reklamując czasopismo w swoim środowisku naukowym. To autor tekstu musi przygotować odpowiednią bibliografię; jeśli coś jest nie tak, to recenzenci – inni naukowcy – nieodpłatnie recenzując mu to wytkną. Co do kosztów druku i wysyłania – wszechobecna dziś forma elektroniczna ma w tym względzie wiele zalet, a jedną z nich jest możliwość wydrukowania na papierze przez samego odbiorcę artykułu, jeśli on woli taką postać tekstu.

Jak widać, obecnie ciężar pracy i odpowiedzialności przesunął się na samych naukowców, którzy wykonują większość zadań nie pobierając za to opłat od odbiorców–beneficjentów swojej pracy. W tym świetle biznes polegający na drogim sprzedawaniu dostępu do tak wytworzonych publikacji jest po prostu nieetyczny, nie wspominając nawet o tym, że mówimy o utrudnianiu dostępu do nauki, czyli do dziedzictwa ludzkości, z którego cała ludzkość korzysta. To, że niezamożny uniwersytet, miejsce gdzie naukowcy tworzą artykuły, musi płacić za dostęp do artykułów – nierzadko z tego samego czasopisma, w którym pracownicy tego uniwersytetu publikują – pokazuje absurdalność obecnej sytuacji. Jednak to nie kwestia opłat jest istotą przedstawionego poniżej systemu – jak wspominałem, zajmują się tym liczne inne inicjatywy.

Aby publikować, naukowcy muszą zakładać osobne konta w różnych serwisach i usługach – czasem powiązanych z pojedynczymi czasopismami i dedykowanych do nich, a czasem istniejących jako osobne produkty zewnętrznych firm. Różnią się dane, które należy w tych systemach wypełnić (często wymagania są nieaktualne i nie są zsynchronizowane z wymaganiami podanymi na stronach czasopism). Brakuje integracji i spójności – zarówno od strony interfejsów użytkownika i wymagań, jak i na poziomie całego międzynarodowego środowiska naukowego jako grupy użytkowników. Publikacje zgłaszane do czasopism muszą wpasować się w profil danego czasopisma. Stanowi to problem dla artykułów interdyscyplinarnych. Naukowcy muszą poświęcić sporo czasu dopasowując artykuł do wymogów czasopisma (czy to tematycznych, czy graficznych) czasem tylko po to, żeby dowiedzieć się, że artykuł został po wstępnym przeglądzie odrzucony bez recenzji nie z powodu niskiej jakości badań (ich jakość może być nawet chwalona), ale z innych powodów (niedopasowanie tematyczne, graficzne, zbyt dużo innych czekających w kolejce artykułów). Często zalecane – lub nawet wymagane – jest cytowanie w zgłaszanym artykule innych prac z danego czasopisma, żeby podwyższyć jego wskaźniki. Czasopisma konkurują miedzy sobą – zatem z punktu widzenia wydawców i redaktorów, kryterium często nie jest maksymalizowanie jakości naukowej przyjmowanych artykułów, ale zwiększanie popularności czasopisma (jego wskaźników i parametrów). Te dwa kryteria nie są jednak tożsame. Konkurencja czasopism i prostota ich zakładania prowadzi też ostatnimi czasy do lawinowego wzrostu ich liczby ("naukowy spam", predatory publishing) i postępującej fragmentacji obszarów badawczych, o które walczą czasopisma.

Jaką mam wizję docelowego systemu

Oto jakie miałem założenia tworząc współczesny system publikacji i recenzji naukowych. Mówiłem o tym od wielu lat, ale na tej stronie wymieniam te założenia zebrane w jednym miejscu :-). System ma cechy repozytorium artykułów i możliwość dyskusji (komentarze), ciągłego oceniania i poprawiania (tak jak jest np. w serwisach Stack Exchange) oraz jest dostosowany do specyfiki procesu rozwoju nauki, publikacji i recenzji badań. Zaskakujące jest, że różne pozanaukowe komercyjne usługi i darmowe branżowe serwisy działają wydajniej i potrafiły lepiej zintegrować użytkowników na całym świecie, niż samo środowisko naukowe potrafiło się zintegrować – stąd poniższej wyspecyfikowany pomysł. Większość z jego części już istnieje i funkcjonuje, np. Open peer review, nie ma jednak pełnej integracji różnych aspektów. Oto założenia:

  • wszystkie publikacje są w formie elektronicznej
  • jeden system pokrywa całą naukę ze wszystkimi gałęziami i dziedzinami
  • co do formy artykułów: nie ma (a przynajmniej nie musi być) wyszukanych stylów z dwoma albo trzema kolumnami, których stosowanie zajmuje autorom czas i utrudnia odbiór treści – nacisk jest na czytelność i dostępność, można używać domyślnego formatowania. To nie musi być nawet pdf, tylko któryś z otwartych standardów zapisujących formatowanie tekstu i meta-informacje o autorstwie, procencie udziału, źródłach finansowania itd.
  • autorzy i recenzenci muszą założyć konta w systemie, reszta świata nie musi
  • artykuły w systemie mają przypisywane przez autorów i moderatorów "tagi" w celu łatwego grupowania artykułów do celów organizacyjnych (np. artykuły z konferencji XYZ-2022)
  • każdy zgłoszony tekst jest analizowany i automatycznie indeksowany po całej swojej treści. Zatem jeśli ktoś zada pytanie "nowotwory układu nerwowego u kobiet z niedoborem witaminy D", to jest to jedyna informacja używana po to, żeby znaleźć odpowiednie artykuły wśród wszystkich istniejących w systemie. Autorzy mogą sterować klasyfikacją swojego tekstu (po to są słowa kluczowe, ręczne określenie dziedzin jeśli automat się pomyli, itd.).
  • odpowiednikiem tradycyjnego pojęcia "czasopismo" jest "strumień artykułów o zadanej tematyce", ewentualnie "zbiór artykułów otagowany terminem JournalOfSomething" (to ostatnie nie jest zalecane – w dłuższej perspektywie w duchu tego systemu odchodzimy od zamkniętej koncepcji czasopisma)
  • autorzy mogą zawsze zmienić tekst, wszystkie zmiany są widoczne w historii zmian
  • autor zgłasza potrzebę recenzji swojego artykułu w momencie, który sam wybiera
  • ta wskazana wersja podlega recenzji i jest oznaczona jako "w trakcie recenzji" po akceptacji zlecenia recenzji przez recenzentów; recenzenci mogą publicznie dyskutować ze sobą i z autorem
  • dobór recenzentów do artykułu odbywa się na podstawie podobieństwa treści artykułów pisanych przez tych naukowców (przypominam, że system indeksuje treści wszystkich artykułów, więc ma wiedzę o tym, jakimi treściami zajmuje się każdy naukowiec)
  • autor jest zachęcany, żeby wgrał zanonimizowaną wersję artykułu. Recenzenci wybierają, czy chcą pracować w modelu anonimowym, czy z jawną osobowością. Zatem "publiczne recenzowanie" oznacza, że jest znana treść recenzji, ale obie strony mogą być anonimowe, jeśli chcą (Autor1, Recenzent1, Recenzent2)
  • wersje zmieniane po recenzji są również dostępne i każdy może zobaczyć, co się zmieniło (tu poprawiona literówka, tam inna drobnostka, tu poważniejsza errata czy nowe dane)
  • autor może dla kolejnych wersji (po wersji już zrecenzowanej i zaakceptowanej) też poprosić o kolejną recenzję, wtedy recenzenci mają bardzo prosto – bo widzą, co się zmieniło. Autor nie musi wysyłać opisów i podsumowań co zmienił, bo dyskusje toczą się w konkretnych miejscach tekstu, tak jak komentarze w Google Docs, a zmiany są automatycznie pokazywane kolorami
  • każdy artykuł ma swoje DOI, ale takie, że widać wersję i miejsce tej wersji w historii wszystkich wersji
  • autor po wgraniu nowego artykułu do systemu nie musi nic robić oprócz ewentualnego wskazania konfliktów interesów (teraz też tak się robi) oraz oznaczenia, czy chce, żeby ta wersja była recenzowana. Chwilę po wgraniu nowego artykułu system automatycznie informuje o jego dostępności innych naukowców zajmujących się daną tematyką, pewną liczbę z nich pytając o możliwość wykonania recenzji (i teraz dzieje się podobnie, tylko nie automatycznie). Z analogicznego działania Stack Exchange wiadomo, że działa to świetnie, i często bardzo trudne problemy są rozwiązywane przez najlepszych ekspertów na świecie w ciągu minut od zadania pytania
  • system balansuje globalnie obciążenie recenzentów, oczywiście recenzenci w pełni dobrowolnie podejmują się recenzji, tak jak obecnie
  • nagrodą dla recenzentów jest między innymi (oprócz tego co obecnie, czyli okazji do zapoznania się z pracą innych naukowców) rosnąca "karma" i prestiż w systemie, który jest publicznie widoczny jeśli recenzent tak wybierze. Pamiętajmy że w nauce najczęściej autor jednego artykułu jest też recenzentem innych, więc ta sama osoba ma prawie zawsze dwie role
  • W systemie oprócz roli autora i recenzenta istnieje rola moderatora (analog roli redaktora), który zajmuje się przypadkami trudnymi dla automatycznej decyzji systemu (brak recenzentów, konflikty interesów, nadużycia itp.). Moderatorami zostają dobrowolnie zgłoszeni i wybrani w głosowaniu użytkownicy systemu
  • Wszyscy zarejestrowani użytkownicy mogą pod artykułami pisać komentarze i uwagi, które podlegają "głosowaniu" pod kątem użyteczności i są sortowane
  • odpowiednikiem obecnego powiedzenia "opublikowałem ten artykuł w bardzo dobrym czasopiśmie" będzie "mój artykuł został pozytywnie zrecenzowany przez recenzentów o wysokim prestiżu (kompetencjach) w tej tematyce" i taką informację będzie można zweryfikować, bo tego typu statystyki będą publicznie widoczne
  • konferencje i czasopisma będą w tym systemie różniły się 1) istnieniem nieprzekraczalnego terminu w przypadku konferencji oraz 2) liczbą etapów recenzji czyli liczbą interakcji autor↔recenzenci
  • środowisko naukowe doskonale orientuje się kto jest ekspertem i w jakiej dziedzinie, więc od początku system będzie bazował nie na przypadkowych użytkownikach (co jest problemem w wielu publicznych systemach), tylko na znanych naukowcach ze znanym dorobkiem (to de facto ci sami, którzy są "łowieni" jako recenzenci do czasopism przez swoich kolegów-naukowców, więc ta zasada się nie zmienia)
  • wszystko będzie prosto, szybko i wygodnie działało na różnych urządzeniach (stacjonarne, mobilne), analogicznie do serwisów Stack Exchange czy narzędzi Google'a, czego nie da się powiedzieć o wielu istniejących systemach
  • przez pierwsze lata system będzie się "docierał", okaże się czego w nim brakuje i które pomysły są nietrafione, więc będzie podlegał ewolucji tak jak każdy taki system, z publicznymi dyskusjami, pomysłami ulepszeń i głosowaniami
  • istnieją firmy para-naukowe dysponujące infrastrukturą, która mogłaby wspierać taki system. Jednak chciałbym, żeby ten system był tak wolny (nie uwiązany zależnościami) i tak czysty, jak tylko możliwe (np. bez reklam, analogicznie do wikipedii). Utrzymywany z mikroskopijnego procenta podatków (wbrew pozorom jego koszty są minimalne w porównaniu do innych wydatków na naukę, a tu mówimy o jednym, ogólnoświatowym systemie, finansowanym przez wszystkie kraje) i z dobrowolnych składek, z transparentnością finansowania
  • kody źródłowe systemu będą dostępne do ulepszania i rozwoju (obecnie github) przez środowisko naukowe i zainteresowanych programistów.

Więcej szczegółów tu nie opisuję – powyższa lista wystarczy, żeby poznać główne cechy i założenia. Zachęcam do kontaktu osoby chętne do rozpropagowania idei, wsparcia i dalszego ulepszania. Proszę o komentarze i uwagi: maciej.komosinski (at) cs.put.poznan.pl. Wkrótce możliwe będzie testowanie systemu, zgłaszanie sugestii oraz własny udział naukowców w jego rozwoju i ulepszaniu.

Przyjęcie się systemu, "soft start"

Jak zwykle wyzwaniem jest przyjęcie się tej idei. Zgłaszanie publikacji do systemu takiego jak opisany powyżej powinno być obowiązkowe dla każdego naukowca, bowiem będą go sukcesywnie tworzyli sami naukowcy w taki sposób, żeby miał same zalety w porównaniu do istniejącej sytuacji. Zatem nie powinno być racjonalnych argumentów "przeciw". Powodem niechęci zmian może być tradycja, tzn. będziemy tkwili w obecnej nieoptymalnej sytuacji, bo opisywany tu system nie wpasuje się w zasady punktowe takiej czy innej lokalnej listy (np. w Polsce – "ministerialnej"), więc naukowcy nie będą w nim publikowali bo oceniani są punktami z listy, więc nie będzie presji żeby system się wpasował w "listę". Szczęśliwie ten problem dotyczy tylko pomysłów na listy z punktami przypisanymi do czasopism, bo zliczanie cytowań pomiędzy artykułami czy obliczanie h-indeksu autorów będzie działało bez żadnych zmian (artykuł pozostanie artykułem tak, jak jest obecnie i jak było od początku). Natomiast "punkty czasopism" można zastąpić innymi statystykami generowanymi przez system – np. "artykuł był w 2% najbardziej cytowanych w 2022 roku w obszarze cząstek elementarnych" albo "artykuł uzyskał średnią ważoną ocenę 97%" (ocena artykułu przez recenzentów mnożona przez ich h-indeks albo kompetencje). Można też użyć "tagów" żeby uzyskać odpowiednik tradycyjnych czasopism (tzn. wprowadzić "tag" będący nazwą czasopisma), ale ma to większy sens dla konferencji i wszelkich wydarzeń, niż dla czasopism. Czasopisma z natury obejmują pewien zakres tematyczny, a ta funkcjonalność będzie lepiej obsługiwana przez globalne indeksowanie treści artykułów i ich dopasowywanie do zainteresowań naukowców.

Dzięki takiej konstrukcji system będzie w stanie obliczyć wiele istotnych statystyk charakteryzujących poszczególne dziedziny i obszary badań oraz poradzić sobie z dwoma istniejącymi problemami: interdyscyplinarnością (poprzez rozmycie obecnych sztywnych granic i indeksowanie po treści) oraz niezbalansowaniem obszarów badawczych (liczba cytowań jest obecnie pochodną zainteresowania daną tematyką – i jako taka nie odzwierciedla jakości artykułu, choć niekiedy tak się uważa. Fatalna publikacja w popularnej dziedzinie ma dużo więcej cytowań, niż świetna publikacja o egzotycznej, rzadkiej tematyce. System będzie w stanie skompensować te różnice odpowiednio obliczając wskaźniki jakości artykułów).

Funkcjonujący system będzie w początkowej fazie działał równolegle do wszystkich istniejących mechanizmów, bowiem nie koliduje z nimi w żaden sposób. Początkowo będzie umożliwiał naukowcom sprawne znajdowanie artykułów z ich pola zainteresowania, wymianę poglądów oraz komentowanie (recenzowanie) artykułów ich kolegów działających w tym samym obszarze. Stopniowo te oceny będą zyskiwały na istotności i formalnym znaczeniu, a cały system może w dalszej perspektywie zastąpić tradycyjne czasopisma.