Kutatási adatkezelés

A kutatási adat meghatározása

A kutatási adatok a tudományos közösség által létrehozott, rögzített, elfogadott és megőrzött tényadatok, amelyek a kutatási eredmények hitelességét támasztják alá. Létrejöhetnek megfigyelések, kísérletek, szimulációk eredményeképpen – egy konkrét kutatás számára előállítva – vagy korábban gyűjtött adatok összegyűjtésével, válogatásával, feldolgozásával.

Néhány példa kutatási adattípusokra:

  • adatbázis-tartalmak (videó, hang, szöveg, képek)
  • alkalmazások működési adatai (naplófájlok tartalma, alkalmazások futási eredményei, szimulációk eredményei)
  • audio/video anyagok, fotók, filmek, diapozitívok, hangfelvételek
  • dokumentumok (szöveges vagy táblázatos formátumban)
  • fehérje vagy genetikai szekvenciák
  • kérdőívek, szövegátiratok, kódkönyvek
  • kérdőíves felmérések válaszai, teszteredmények 
  • kutatási folyamat során megszerzett és/vagy előállított digitális tárgyak
  • laboratóriumi jegyzetek, terepgyakorlati naplók, feljegyzések
  • modellek, algoritmusok, szkriptek
  • módszerek és munkafolyamatok
  • szabványos működési eljárások és protokollok
  • színképek, színképelemzések stb.

Kutatási adat típusai

Megfigyelésen alapuló adatok

  • Adatgyűjtési elve: viselkedés vagy tevékenység megfigyelése során gyűjtik
  • Módszer: emberi megfigyelés, eszköz vagy érzékelő használatával vagy nyílt végű felmérések 
  • Megjegyzés: mivel a megfigyelési adatokat valós időben gyűjtik, nagyon nehéz vagy lehetetlen azok reprodukálása

Kísérletek során létrehozott adatok:

  • Adatgyűjtési elve: a kutató aktív beavatkozása révén gyűjtik
  • Módszer: általában paraméterek változtatásával összefüggésben vizsgálják a minta eredeti és új állapota közötti eltéréseket, a kísérleti adatok tipikusan lehetővé teszik a kutató számára, hogy meghatározza az ok-okozati összefüggéseket 
  • Megjegyzés: az ilyen típusú adatok gyakran reprodukálhatók

Szimulációs eljárások során keletkezett adatok: 

  • Adatgyűjtési elve: valós folyamat vagy rendszer számítógépe modellje
  • Módszer: a szimulációs adatokat úgy generálják, hogy egy valós folyamat vagy rendszer működését utánozzák számítógépes tesztmodellek segítségével. Ez a módszer arra szolgál, hogy meghatározzuk, mi történhet vagy történhet bizonyos feltételek mellett.
  • Megjegyzés: az alkalmazott tesztmodell gyakran ugyanolyan, vagy még a szimuláció során előállított adatoknál is fontosabb

Meglévő adatforrásokat felhasználó adatok

  • Adatgyűjtési elve: meglévő adatforrások felhasználásából hozzák létre az új adatokat 
  • Módszer: a származtatott adatok magában foglalják a meglévő – gyakran különböző adatforrásokból származó – adatpontok felhasználását új adatok létrehozására valamilyen transzformáció, például aritmetikai képlet vagy aggregáció révén.
  • Megjegyzés: noha az ilyen típusú adatok általában pótolhatók, ha elvesznek, pótlásuk nagyon időigényes


Nyers adatok: kiindulási adatok, amelyek manipuláció mentesek. 

Feldolgozott vagy aktív adatok: különböző eljárások során feldolgozott adatok (szerkesztés, tisztítás, módosítás)


Kutatási adat életciklus:

A kutatási adatok életciklusának hat főbb állomása van, melyek további részállomásokra oszthatók.

 

Adatok létrehozása

  • kutatás megtervezése
  • adatmenedzsment megtervezése (formátum, tárolás stb.)
  • megosztási terv
  • már meglévő adatok felkutatása
  • adatgyűjtés (kísérlet, észlelés, mérés, szimuláció)
  • metaadatok létrehozása és rögzítése

Adatfeldolgozás

  • adatok megadása, digitalizálás, másolás, fordítás
  • ellenőrzés, validálás, adattisztítás
  • anonimizálás (érzékeny adatok)
  • adatok leírása
  • menedzselés és tárolás

Adatanalizálás

  • adatok értelmezése
  • adatok származtatása
  • megfelelő kimeneti formátum létrehozása a kutatás számára
  • az adatokon alapuló publikációk elkészítése
  • adatok előkészítése megőrzésre

Adattárolás

  • adatmigrálás a legjobb formátumba
  • adatmigrálás a szükséges formátumba
  • biztonsági mentés és tárolás
  • metaadat- és dokumentációkészítés
  • archiválás

Adathozzáférés biztosítása

  • elérhetőség szabályozása, ellenőrzése
  • szerzői jogi szabályozás megállapítása
  • licencek meghatátorozása
  • adatok megosztása
  • promotálás

Adat-újrahasznosítás

  • nyomonkövetéses vizsgálatok, utólagos kutatás
  • új kutatás
  • korábbi kutatás felülvizsgálata
  • korábbi kutatás következtetéseinek részletes vizsgálata
  • tanulási-tanítási folyamatokban való felhasználás