Statistieken voor RSS-feeds online

 Gepubliceerd door om 21:43  Tools
jan 092005
 

De statistieken voor de RSS-feeds van deze weblog staan online.
RSS-stats Niet via Feedburner, zoals Marketingfacts onlangs uitlegde, maar met de eigen importfunctie waar ik ook gisteren over schreef. Wat wordt er getoond?
Berekend wordt het aantal verschillende IP-nummers dat een van de twee RSS-feeds ophaald (de atom-feed track ik nog niet maar die werd de afgelopen twee dagen ook niet opgehaald). De getallen die je vandaag ziet, zijn van gisteren (dus van een volledige periode van 24 uur). Het getal tussen haakjes is het verschil met de dag ervoor.

Het script parst de Bloglines header (zie ook dit bericht) zodat ook de subsribers bij Bloglines meegeteld worden.

Wat betekenen de deelgetallen?
Het getal dat ik gisteren als totaalgetal kreeg was 251 verschillende IP-adressen. Dat leek me best veel als ik dat vergelijk met de getallen die bij Marketingfacts genoemd werden. Daarom ben ik ze een beetje gaan uitsplitsen.

Bots
Een groot aantal van de requests komen van ‘bots’, scripts die de feed ophalen maar waarvan het duidelijk is dat er geen mens achter zit te lezen. Zo wordt de feed bijvoorbeeld ook door de Googlebot bezocht, door een bot van syndicatie.nl, everyfeed.com, al het nieuws etc.
Die bezoeken worden eruitgefilterd en apart getoond. Zoals je kunt zien komen zoekmachines niet dagelijks langs, het draagt voor een groot deel bij aan het verschil tussen gisteren en de dag ervoor.

Bloglines bezoekers
De Bloglines bezoekers zijn ook eenvoudig te herkennen en worden apart weergegeven. Overigens moet bij Bloglines aangetekend worden dat het daar ook mogelijk is dat iemand een account aanmaakt en dan nooit meer leest. Dan worden de feeds toch elk uur opgehaald en wordt het account meegeteld. Zo gebruik ik mijn Bloglines-account nauwelijks, maar zou ik wel nog meetellen als Bloglines-bezoeker bij elk van de ruim honderd feeds die ik daar heb toegevoegd.

RSS-lezers
De derde groep bestaat uit de verschillende RSS-lezers die niet aantoonbaar bij een van de andere twee horen. Dat zijn losse applicaties zoals SharpReader, maar ook bijvoorbeeld het servergebaseerder FeedOnFeeds wordt daarbij meegeteld.
Een daling ten opzichte van de dag ervoor kan daar overigens zowel betekenen dat iemand de feed verwijderd heeft, maar ook gewoon dat de computer die dag niet aangestaan heeft. Overigens wordt ook het in de browser opvragen van de RSS-feed meegeteld, er is (nog) geen minimum aantal keer per dag dat iemand een feed hoeft op te vragen om voor die dag meegeteld te woren.

De teller loopt pas twee dagen, dus het wordt nog even aankijken hoe de getallen verspringen. Ik merk ook dat gezien het aantal regels dat uit de logbestanden geparst moet worden het importeren ervan best lang duurt. Het is dus even de vraag of het meteen wegschrijven van de informatie in de database op het moment dat de RSS-feed opgehaald wordt niet veel sneller is. Nou ja, het was tenslotte vooral ook een leer-project. Dus als het straks niet gebruikt wordt is er ook nog geen man overboord.

Deel dit bericht:

  3 reacties aan “Statistieken voor RSS-feeds online”

Reacties (3)
  1. Dank voor de update Pierre, absoluut aardig om ook eens de RSS-statistieken van een ander weblog te zien.

    Vwb de bots, Feedburner maakt onderscheid tussen readers and aggregators (op basis hiervan bepaal ik het aantal unieke lezers) en bots (dit zijn o.a. MSN Search Bot, Syndic8.com, Google Bot en Blogdigger Search Bot). Syndicatie.nl, allhetnieuws, etc. worden door Feedburner beschouwd als een unieke lezer (ondanks het feit dat hier meerdere lezers aan gekoppeld kunnen zijn).

  2. Hoi Marco,
    Graag gedaan. Na twee dagen heb ik nog maar geen grafieken gemaakt zoals Mediafacts heeft :-) Die grafieken laten wel zien dat een flink verschil van dag tot dag te verwachten valt. Zodra ik de oude IIS-logbestanden geƃĀÆmporteerd heb komt er ook nog wel een grafiek. Of die zo’n mooie opgaande lijn zal hebben?

  3. De query voor de info is nog niet optimaal (blijkt). En op dit moment werd hij voor elke pagina uitgevoerd. Ik heb ze dus even naar de statistieken-pagina verbannen.

Sorry, het reactieformulier is momenteel gesloten.