Laatste update 18-11-24
Zie ook ons artikel voor de 37e HSN conferentie in Brussel hsnbundels.taalunie.org/bijdrage/zoeken-onderzocht-het-100-queries-project/
<aside> <img src="https://prod-files-secure.s3.us-west-2.amazonaws.com/c64313d1-cc1d-40be-966f-deaec3cd9ee2/1d18a07b-1680-447a-ac7b-154bf0fefaac/Slim-Zoeken_groen.png" alt="https://prod-files-secure.s3.us-west-2.amazonaws.com/c64313d1-cc1d-40be-966f-deaec3cd9ee2/1d18a07b-1680-447a-ac7b-154bf0fefaac/Slim-Zoeken_groen.png" width="40px" /> Kennis van het web en van soorten bronnen, plus een goede afstelling van de zoekopdracht of prompt die je gebruikt, dat is waar zoekeducatie om draait. Zowel bij het gebruik van zoekmachines, als in chatbots en op social media.
Met ons onderzoek willen we bijdragen aan het vinden van online kwaliteitsinformatie voor alle leeftijden op het web. Wat zijn de betrouwbare bronnen in tijden van nepnieuws? Hoe kunnen wij helpen die te vinden?
</aside>
100 authentieke queries zijn onze lens op wat er op het web beschikbaar is en wat er via zoekmachines wordt gepresenteerd aan de zoeker (in de vorm van 1000 resultaten).
Maarten Sprenger en Carsten Schnober onderzochten voor ‘Slim Zoeken’ de kwaliteit en de bruikbaarheid van de zoekresultaten in Google op honderd uiteenlopende informatieve zoekopdrachten van kinderen van acht tot twaalf jaar.
Met dit project willen we enerzijds aantonen dat het tijdverlies en misleidend is voor kinderen om ze zomaar iets te laten googelen (zonder verdere begeleiding), en willen we anderzijds een begin maken met het beantwoorden van de vraag wat websearch waard is op dit moment, zowel vanuit de kant van het aanbod op het web, als vanuit wat gevonden wordt door Google.
We sluiten hiermee graag aan op een opleving die we zien in de kritische benadering van websearch voor gebruikers. *1
De achterliggende gedachte is dat qua observatie (expert opinion) naar schatting 90% van de resultaatpagina’s een commerciële component heeft, variërend van content als vehikel voor advertenties tot productbeschrijvingen en blogs die moeten leiden tot meer verkeer naar de betreffende websites, onder het SEO-motto ‘Content is king’. Dit gecombineerd met de ervaring dat tegelijk ook zo’n 80% van de resultaat-pagina’s voor kinderen van de basisschool (te) moeilijk toegankelijk lijkt te zijn. Tot nu toe was hiervoor vooral anekdotisch bewijs vanuit de meer dan vijftien jaar ervaring van Maarten in het werken met online informatie voor kinderen (zie ook M. Sprenger, Children’s Informatie Who cares?, 2014).
*1
“Het bewijs voor de falende zoekmachines was vooral anekdotisch, maar deze week (jan ‘24) werden de aannamen gestut door een Duitse wetenschappelijke publicatie.” volkskrant.nl/wetenschap/voor-robots-door-robots-hoe-zoekmachines-lijden-onder-seo-spam~b712ea4b/ Onderzoekers keken naar duizenden zoekopdrachten voor productbesprekingen in Google, Bing en DuckDuckGo. Ze concluderen dat alle zoekmachines last hebben van SEO-spam.
Maarten Sprenger is informatieprofessional, educatief redacteur en auteur van twee Slim Zoeken boeken voor 8-14 jaar. Op dit moment werkt hij aan Slim3, begrijpelijke informatie over online zoeken voor school, werk en thuis. Gratis openbaar toegankelijk voor iedereen, in twee versies, voor 8-14 en voor 15+.
Maarten adviseerde van 2019 tot heden op verschillende momenten in het kader de Actualisatie van de nieuwe Kerndoelen, zowel bij het vak Nederlands als bij Digitale Geletterdheid.
slimzoeken.nu, linkedin.com/in/msprenger
Software engineer en Natural Language Processing (NLP) researcher met een kritische kijk op maatschappij en technologie.
linkedin.com/in/carsten-s-a1aba0, esciencecenter.nl/team/carsten-schnober/
Presentatie van 100 Queries #1 PO op de voorjaarsconferentie van i&i: https://ieni.github.io/april2024/honderd-queries
Search strategies and interface design. Three studies on children’s search performance and evaluation, Thesis Hanna Jochmann 2014
https://link.springer.com/book/10.1007/978-3-031-02286-9, Foss/Druin 2014
De onderzoeksvraag is tweeërlei:
Wij hebben voor dit onderzoek honderd zoekopdrachten (queries) gekozen **uit een a-selecte lijst met tweehonderd toevallige, authentieke zoekopdrachten van basisschoolleerlingen. De queries zijn afkomstig van Wizenoze bv, met dank aan Thijs Westerveld.
Queries, Resultaatpagina’s en bijbehorende Bronnen zijn ondergebracht in drie databases, waarin alle records werden voorzien van labels over metadata, relevantie, kwaliteit en moederbedrijven. Later is hier nog een vierde database Moederbedrijven aan toegevoegd om zo de clustering van content-providers beter in beeld te krijgen.
In de loop van het onderzoek constateerden we dat dit project een formaat zou kunnen opleveren voor herhaalde metingen, ook voor andere doelgroepen, leeftijden of meer specifieke onderwerpen, en in andere zoekmachines. Hiervoor werd de labeling tijdens het metadateren soms aangepast of uitgebreid (om daarna altijd de records na te lopen).
Bij vaststellen van de labeling werd per veld gezocht naar redelijk of goed quantificeerbare metrics. Zoals:
de hoeveelheid reclame die voorkomt op een pagina (geen
/ weinig
/ veel
/ over-the-top
)
de aanwezigheid van een zogenaamde ‘about-pagina’ (in hoeverre geeft een site over zichzelf en de kwaliteit van die pagina. Is de informatie geschikt om een beeld van makers/doel van de bron te vormen? *
Labels Kwaliteit about-pagina
de hoeveelheid geblokte cookies/trackers (een getal).
Expert-rating. Daarnaast is er ook een inschatting gegeven van de bruikbaarheid van de informatie voor de doelgroep, in dit geval basisschoolleerlingen. Het gaat hier om een combinatie van de leesbaarheid en verdere toegankelijkheid van de resultaatpagina’s voor kinderen van 8 tot 12 jaar. Deze toegankelijks-score voor pagina’s is, net als de Thumbs-up waardering bij wel/niet gebruiken van bronnen, een expert-label gebaseerd op vijftien jaar curatie van bronnen voor het onderwijs.