To feed or to scrape?

 Gepubliceerd door om 01:05  Internet
nov 072004
 

Naar aanleiding van een bericht van Robin Good, wordt op MediaFact de vraag gesteld wat je mag doen met de RSS-feeds van iemand anders. En een stap verder nog: mag je RSS-feeds maken van een website die er geen heeft (‘scrapen’)?

De eerste vraag (gebruik van een RSS-feed) lijkt redelijk eenvoudig. Hoewel de licentie van een website beperkingen zou kunnen opleggen, lijkt het aannemelijk dat je ook bijvoorbeeld een webpagina mag bouwen met een verzameling berichten van verschillende feeds, zoals bijvoorbeeld lastpak, onesite
of Xiffy doen. Maar waarom is dat zo en hoe zit dat dan met dat scrapen?
Een deel van het waarom komt aan bod in de reactie van Anders Floor op MediaFact. In de rechtzaak die PCM aangespannen had tegen Kranten.com (zie o.a. Emerce) werd bepaald dat de manier waarop Kranten.com gebruik maakte van de informatie uit de verschillende PCM websites, vergelijkbaar was met het citeren uit andermans werk. Het tonen van een RSS-feed met alleen titels inclusief de links terug naar de oorspronkelijke site valt hier evenzeer onder.

Een RSS-feed door middel van scrapen.
Het bericht bij Robin Good ging echter niet alleen om het gebruik van een RSS-feed, hij had namelijk een RSS-feed gemaakt voor een site die er nog geen had. Dat doe je door middel van ‘scraping’ van die website.
In een van de reacties bij Mediafact.nl werd zei Erwin Maas: “[scrapen] mag van mij strafbaar gesteld worden, punt uit. Is gewoon diefstal.”
Maar dat is niet zo, want ook de RSS-feed die zo gemaakt wordt kan heel goed voldoen aan de eisen van het citeren. Natuurlijk niet als de berichten in hun geheel in de feed worden opgenomen, maar in het geval van titels + link + eventueel een kort tekstfragment is het gewoon toegestaan.

Toestemming vragen noodzakelijk?
Je hoeft niet vooraf toestemming te vragen als je iemand wilt citeren.

Hoe oplossen?
Zorg er gewoon voor dat er geen noodzaak is voor het scrapen van een RSS-feed: biedt er zelf een aan!
Dan heb je volledige controle over de inhoud, kun je er voor zorgen dat er niet meer tekst opgenomen is dan je wilt (zeker als je wilt dat bezoekers doorklikken naar de site zelf), kun je in de feed zaken als copyright, maker etc. opnemen én laat je zien dat je open staat voor het bieden van keuzevrijheid aan je klanten.

Wil je dat niet, dan kun je de server met het scrape-script de toegang tot jouw pagina’s ontzeggen. Dan wordt het scrapen al een stuk moeilijker. Maar dan ben je dus bezoekers aan het buitenhouden en dat moet toch ook raar voelen.

Deel dit bericht:

Sorry, het reactieformulier is momenteel gesloten.