Data organisatie

Data organisatie is de bescherming van data tegen onvindbaarheid door een systematische ordening van je data. Een goede organisatie zorgt ervoor dat jij – en anderen – snel en eenvoudig de juiste versie van de juiste dataset kunnen terugvinden. Een consistente en duidelijke naamgeving van files, een heldere en logische ordening van data files in folders en versiebeheer helpen hierbij.

File-naamgeving:
File-namen helpen om de juiste dataset terug te vinden zonder dat deze geopend hoeft te worden. Goede file-namen zijn daarom consistent (gebruik file-naamgevingsconventies), uniek (maken onderscheid tussen verschillende versies van een file en tussen files met gelijksoortige onderwerpen) en betekenisvol (beschrijvend).
Een file-naam bevat alle beschrijvende informatie onafhankelijk van in welke folder de file is opgeslagen.
De volgorde van de elementen waaruit een filenaam bestaat (onderwerp, datum, versie, file type) is van belang als je de datafiles op een bepaalde manier wilt kunnen sorteren.
Vermijd het gebruik van speciale karakters in een file-naam: \ / : * ? < > | [ ] & $ . , omdat deze de computerverwerking van de file kunnen storen. Spaties in een file-naam worden bij voorkeur vervangen door een underscore. Tot slot: maak een readme-file waarin de betekenis van de file-namen wordt uitgelegd en bewaar deze bij de files.
Er is software beschikbaar om meerdere files gelijktijdig te hernoemen, bijvoorbeeld PSRenamer en Ant Renamer.

  • Meer informatie over file-naamgeving op de pagina's van Stanford University Libraries

Folderstructuur
Naast file-namen is een heldere folderstructuur belangrijk om datafiles snel en gemakkelijk te kunnen identificeren. Denk aan het begin van je project al na over hoe je je onderzoeksdata (en andere documenten die bij het onderzoek horen) indeelt in folders en subfolders. Meestal is een onderverdeling in 3-4 niveaus voldoende.

Datafiles kunnen in folders georganiseerd worden bijvoorbeeld volgens file type, methode (interview, survey, experiment, observatie) of soort materiaal (data, documentatie, publicaties).

Versiebeheer
Een prima uiteenzetting over het waarom en hoe van versiebeheer, met name wanneer er samengewerkt wordt met anderen, vind je in de gids Managing and Sharing Data (p. 13-14) van het UK Data Archive.