Mijn EndNote bibliotheek bevat na een jaar promoveren inmiddels bijna 800 verwijzingen naar voor mij relevante literatuur. Bij een groot deel daarvan heb ik een PDF-document opgeslagen met het betreffende artikel, een uitdraai van de webpagina, het rapport of soms zelf digitale versies van hele boeken (die zijn ook legaal soms online te vinden!).
EndNote bevat alle voor mij relevante metadata, zoals titel, auteur, jaar van publicatie, soort bron, plek van publicatie etc.
Die informatie heb ik meestal niet zelf hoeven in te voeren omdat repositories die die literatuur bevatten vaak exportopties hebben voor de metadata. En ook Google Scholar heeft een handige optie waarbij je bij een zoekresultaat een link krijgt waarmee de gegevens direct in EndNote geïmporteerd worden (wel in alle gevallen even controleren, want ook hier zitten wel eens foutjes in, ook bij officiële repositories!).
Toen ik die PDF documenten op mijn Kindle zette zag ik echter hoe slecht het gesteld is met de metadata die in de PDF-bestanden zelf zit. Je zou verwachten dat daar in ieder geval de titel van het artikel en de auteur(s) vermeld zouden staan. Maar niets is minder waar. Vaak zijn de PDF-documenten gemaakt door middel van bijvoorbeeld het printen van een Word-document. De titel van het Word-document wordt dan de titel van de PDF, soms komt dat in de buurt, maar meestal niet. Auteur van het document wordt dan de gebruikersnaam die bij Word is ingesteld.
Vervelend, want als ik me had kunnen aanwennen om bij elk nieuw bestand dat ik opsloeg in EndNote de metadata aan te passen dan was het niet zo’n klus geweest. Nu met die grote hoeveelheid PDF-bestanden heb ik daar niet zo heel veel trek in.
Boos wordt ik echter als blijkt dat zo’n PDF-document, dat gewoon legaal ter download online aangeboden wordt aan iedereen die het wil downloaden, beveiligd is én slechte metadata bevat. Dan willen ze namelijk zelfs voorkomen dat ik de metadata in het document wijzig/verbeter. Natuurlijk laat ik dat zomaar gebeuren.
Lees verder »