Materiały dydaktyczne

Książka

3. Nowe otwarte modele komunikacji naukowej

3.5. Dane badawcze

Coraz częściej naukowcy zamieszczają surowe lub przetworzone dane naukowe - które powstały w procesie badawczym - w Internecie. Wynika to z polityki wielu grantodawców, wydawców lub zaleceń i rekomendacji poszczególnych krajów. Komisja Europejska i Polscy grantodawcy rozpoczęli w roku 2019 wprowadzać do regulaminów konkursów wymóg umieszczania danych badawczych w Internecie lub opracowywanie planów zarządzania danymi. Jest to zgodne z zaleceniami Komisji Europejskiej, która uważa, że dzielenie się danymi wpłynie na wzrost innowacyjności Europy i świata.

Co to są dane badawcze?

„Dane badawcze” zdefiniowano jako „dokumenty w formie cyfrowej, inne niż publikacje naukowe, które są gromadzone lub opracowywane w ramach działalności badawczo-naukowej i są wykorzystywane jako dowody w procesie badawczym bądź też są powszechnie akceptowane w środowisku naukowym jako konieczne do weryfikacji poprawności ustaleń i wyników badań” (DYREKTYWA PARLAMENTU EUROPEJSKIEGO I RADY w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego (wersja przekształcona) art. 2, p. 9). W praktyce chodzi m.in. o wyniki pomiarów, eksperymentów, obserwacji, ankiet, zdjęcia, nagrania wywiadów, specyfikacje, metadane i inne formy.

Dane badawcze przechowuje się w specjalnie dla nich przygotowanych otwartych dla wszystkich repozytoriach, które różnią się od tych gromadzących publikacje czy preprinty. Największy zbiór repozytoriów danych, dziedzinowych i ogólnych, widoczny jest w wyszukiwarce re3data, większość z nich jest bezpłatna.  Wyszukiwanie w nich 

Polska nie ma zbyt wielu repozytoriów danych badawczych, ale w związku z decyzjami Narodowego Centrum Nauki i powiązaniu finansowania grantów z upowszechnianiem danych w Internecie, uczelnie zaczęły je tworzyć. Myślę, że za parę lat będzie ich całkiem sporo.  Oto te pierwsze jaki już dziś są dostępne:

Repozytoria danych badawczych polskich instytucji naukowych:

  1. Clarin-PL – repozytorium lingwistyczne, Politechnika Wrocławska
  2. RepOD – ogólnopolskie repozytorium danych badawczych prowadzone przez ICM UW.
  3. e-Science – Politechnika Wrocławska
  4. Azon – Uczelnie wrocławskie
  5. Narodowy Korpus Języka Polskiego – Uniwersytet Łódzki
  6. Archiwum Danych Społecznych, UW, PAN Warszawa

Na świecie upowszechnianie danych badawczych jest znacznie szersze, co widać przy przeglądaniu statystyk pokazujących stały wzrost ich liczby, zob. przykładowe w OpenAIRE (dane z kwietnia 2020):

  • Dataset (7,271,165)
  • Image (1,131,236)
  • Clinical Trial (147,520)
  • Audiovisual (106,558)
  • Sound (30,748)
  • Film (8,649)
  • Other ORP type (273)
  • Article (3)
  • Unknown (1)

Listy repozytoriów danych badawczych ze świata

Szczegółowe i bieżące informacje na temat danych badawczych można znaleźć w poradnikach ICM UW, które powstały w ramach nowego projektu ICM zatytułowanego: „Dziedzinowe Repozytoria Otwartych Danych Badawczych”, który rozpoczął się 1 sierpnia 2018 roku. Jednym z jego celów jest kształcenie akademików w zakresie gromadzenia i upowszechniania danych w Internecie. Oto 3 poradniki opracowane przez zespół:

  1. Wojciech Fenrich, Selekcja i przygotowanie danych badawczych do udostępnianiaICM UW Warszawa 2019. 
  2. Natalia Gruenpeter, Jak korzystać z zasobów w repozytoriach danych. ICM UW Warszawa 2019. 
  3. Krzysztof Siewicz i Nikodem Rycko, Prawne aspekty otwierania danych badawczych - poradnik. ICM UW Warszawa 2019.