SURFnet Search Engine vernieuwd

“De SURFnet Search Engine, de zoekmachine voor wetenschappelijk Nederland, is recent vernieuwd. Hierdoor wordt de SURFnet Search Engine voor de gebruiker nog efficiënter. Zo heeft de SURFnet Search Engine taalfilters en diverse opties om de zoekresultaten te verfijnen.”

(bron)

Ik wist wel dat SURFnet een zoekmachine had, maar had er eigenlijk nooit echt gebruik van gemaakt (tja, we hebben Google tenslotte, toch). Hebben we wat aan een extra zoekmachine en biedt hij meerwaarde naast “de anderen”?

Eenvoudig zoeken
Het gaat eigenlijk al meteen fout. Ik ga naar http://search.surfnet.nl/ en voer een “eenvoudig zoeken” opdracht uit. Het blijkt echter dat de url niet gebruikt kan worden om de zoekopdracht te reproduceren.
Zoek ik bij Google bijvoorbeeld op Pierre Gorissen, dan wordt de url (die ik kan opslaan en hier in het document plakken): http://www.google.nl/search?hl=nl&ie=UTF-8&q=pierre+gorissen.
Bij de SURFnet zoekmachine wordt dat: http://search.surfnet.nl/search.do (en levert dus niets op als jij er nu op klikt).

De eerste zoekopdracht bij SURFnet leverde 499 resultaten op. Onder elke resultaat staat de optie “Vergelijkbare documenten”. Klik ik daar bij het eerste resultaat op, dan krijg ik 7778 treffers, met op de eerste pagina een heleboel dubbelingen.
De zoekmachine levert namelijk als eerste vier opties:
* 2 keer: http://elearning.surf.nl/e-learning/boekenensites/1684/printversie
* 2 keer: http://www.e-learning.surf.nl/e-learning/boekenensites/1684
(4 keer dezelfde informatie dus).
Begrijpelijk voor een “domme” zoekmachine, maar een groepering (of zelfs “weglaten”) zoals Google dat doet was wel handig geweest.

Wat de optie “Uitsluiten” hoort te doen weet ik niet. Toen ik dat bij de eerste hit probeerde (de hierboven genoemde aanbevolen website), bleven er geen hits meer over.

Geavanceerd zoeken
De SURFnet zoekmachine kan zoeken op de metadata in de geïndexeerde documenten. Dat betekent dat je dus expliciet kunt aangeven dat gezocht moet worden naar documenten met DC.creator = “Pierre Gorissen”.
Als je in de bron van de pagina’s hier kijkt, zie je dat die zijn voorzien van die informatie. Helaas zoekt de SURFnet zoekmachine alleen in pagina’s van de instellingen die aangesloten zijn bij SURFnet. Dus kun ik het niet testen tegen deze pagina’s.

Het beperken van binnen welke instellingen gezocht moet worden, was overigens tamelijk verwarrend. Ik dacht eerst dat Fontys niet in de lange lijst voor kwam, wél zag ik “Hogeschool Eindhoven” (voor de insiders: is lang geleden al in Fontys opgegaan). Fontys bleek als “Stichting Fontys” opgenomen en dus alfabetisch op een heel andere plaats dan waar ik hem verwacht had in de lange lijst.

Zoeken naar personen
Nóg een waardevolle optie: het zoeken naar personen binnen het Nederlands hoger onderwijs is namelijk tamelijk moeilijk. Fontys heeft via haar website onze adresgegevens voor de hele wereld beschikbaar, en zoeken op mijn naam levert alle informatie nodig om mij te bereiken. Maar dat is zeker niet bij alle andere instellingen het geval.
Omdat het zoeken naar personen door een andere zoekmachine gebeurt, kan ik er wél naar linken:
Zoeken naar Pierre Gorissen levert bij SURFnet géén resultaten op. Zoeken op alleen Gorissen levert wél resultaten op, maar geen van Fontys. Wél overigens de inmiddels verouderde gegevens van toen ik tijdelijk bij de OUNL werkte. Maar omdat ik daar als “Gorissen, P.” in sta, leverde de eerste zoekdracht dat resultaat niet.

Alleen LDAP
Verder zoekend blijkt dat de SURFnet zoekmachine alleen in zogeheten LDAP-servers zoekt naar informatie, dus helaas voor Fontys (of anderen), de medewerker-informatie van Fontys wordt niet geïndexeerd.

Listserv
Als laatste optie het zoeken in de maillijsten van SURFnet. Veel mensen zullen die niet kennen, maar we maken voor SURF SiX gebruik van een mailinglijst via SURFnet, dus had ik iets om naar te zoeken.
Ook hier gelukkig wél de mogelijkheid om naar de resultaten te linken.
Eerste zoekopdracht: SURF SiX leverde 329 resultaten op. Maar die resultaten worden gegroepeerd op mailinglijst en binnen elke mailinglijst op relevantie. Dat betekent niet dat de meest relevante resultaten bovenaan staan. Het merendeel van de resultaten heeft namelijk wél het woord SURF maar niet ook SiX en heeft helemaal niets met de expertisegroep te maken.
Een tweede zoekopdracht: “SURF SiX” werkt wel en levert de gewenste resultaten.

Samenvattend
Vergeleken met (bijvoorbeeld) Google ligt de SURFnet zoekmachine jaren achter. Zoals zo vaak gezegd: ik wil normaal gesproken niet zoeken op internet, maar vinden. Dat betekent dat ik bij Google het gewenste resultaat bij de eerste drie links verwacht én meestal ook vind. SURFnet boort pagina’s en informatie binnen instellingen aan die Google voor een deel links laat liggen en zou door de beperking tot het hoger onderwijs (of juist specifieke informatie) meerwaarde kunnen bieden. Maar dan moet het anders worden aangeboden en vooral veel gebruikersvriendelijker. Bijvoorbeeld met structuren zoals beschikbaar via KartOO. Hoewel ook daar aan de zoekstructuur nog het nodige verbeterd moet worden, zie je dat daar informatie uit verschillende bronnen op een manier wordt weergegeven waarbij de onderlinge relaties zichtbaar worden en kun je echt een zoektocht opbouwen. Zou ik niet gebruiken voor mijn dagelijkse zoekopdracht, maar wel als ik meer van een onderwerp wil weten.
Werk aan de winkel dus. Ik hoor graag als de volgende versie online staat.