Home > Overzicht

<aside> šŸ”° Vraag Hoe kan het dat een zoekmachine zo snel zo veel resultaten vindt?

Antwoord Een zoekmachine heeft twee kanten die afzonderlijk van elkaar tegelijk veel werk verzetten. Met zoekbots aan de ene kant en een zoek-algoritme aan de andere.

</aside>

Bekijk dit plaatje en lees verder voor de hele uitlegā€¦

Bekijk dit plaatje en lees verder voor de hele uitlegā€¦

Hoe werkt een zoekmachine?

A. De linkerkant: de index, een kopie van het web

Een zoekmachine bezoekt de hele dag door webpaginaā€™s en maakt een kopie van alles wat hij tegenkomt. Van die kopieeĢˆn maakt de zoekmachine een soort inhoudsopgave (de index). Dat is kant A.

B. De rechterkant: het zoeken zelf

De gebruiker zit aan kant B. Wanneer jij een zoekopdracht geeft, gaan de computers van de zoekmachine razendsnel in de index bladeren. Je krijgt dan stukjes (snippets) van de gevonden webpaginaā€™s in een lijst met zoekresultaten te zien. Wanneer je op een zoekresultaat klikt word je doorgelinkt naar de website.

Kant A - Zoekbots

De linkerkant ā€“ zoekbots aan het werk

De linkerkant ā€“ zoekbots aan het werk

Er komt een robot op bezoek

Het langsgaan bij websites gebeurt automatisch, met een spider of zoekbot (robot). Dat klinkt geheimzinnig, maar stiekem is het niet. De zoekbot stelt zich netjes voor (ā€˜hallo, ik ben spiderbotā€™) en gaat aan het werk na toestemming van de website. Hij leest nauwkeurig wat er staat en seint alles door wat hij vindt. Dit heet de crawl.

De websites zelf zijn blij met het bezoek van de robot. Want zonder zoekmachine komen er meestal weinig nieuwe bezoekers. De zoekbot weet bovendien dat hij rustig aan moet doen. Snel achter elkaar alle paginaā€™s bekijken en kopieĢˆren zou een site overbelasten. De zoekbot is dus zo ingesteld dat zijn bezoek lijkt op dat van een gewone bezoeker. De zoekbot neemt telkens even pauze, alsof hij echt leest. Pagina voor pagina stuurt hij kopieeĢˆn naar zijn eigen computers. Behalve wanneer hij bovenaan berichten voor robots ziet staan, zoals noindex of nofollow. Die paginaā€™s laat hij met rust (noindex) of hij stopt daar met het volgen van de links. Nofollow is een harde boodschap voor de meeste zoekbots. Links volgen is hun lust en leven: ze zwerven van de ene link naar de andere, om zo het hele web in kaart te brengen. Dit soort berichten wordt soms door webmasters op webpaginaā€™s geplaatst wanneer die paginaā€™s priveĢ zijn. Jammer voor de robot!

De zoekbot komt regelmatig weer langs om te kijken of alles nog hetzelfde is, of dat er wijzigingen zijn. Dan wordt de crawl van een website ververst. Dat is hard nodig, want veel websites veranderen vaak van inhoud en vorm. En een zoekmachine wil natuurlijk de nieuwste informatie doorgeven. Een dode link naar een pagina die niet meer bestaat is vervelend.

Crawl

Het maken van de eerste crawl en van de eerste index **ofwel **inhoudsopgave kost het meeste tijd. De teksten, de plaatjes, de videoā€™s en bijschriften: waar staan ze en wat staat er precies? Elke pagina wordt nauwkeurig in kaart gebracht. Alle woorden worden geteld en in een statistiek gezet. Koppen en tussenkoppen krijgen een groter ā€˜gewichtā€™ dan gewone tekst.

De index

Al deze informatie wordt samengevat en opgeslagen in de index (ofwel: inhoudsopgave). Google crawlt en indexeert, net als Bing, het hele world wide web. Deze grote zoekmachines komen razendsnel langs op alle sites die ook regelmatig nieuwe content plaatsen. Bij nieuws-sites is dat meerdere keren per dag! Bij kleine, individuele websites is dat tempo lager vaak, maar toch is Google vaak eerder op de hoogte van wat er op een website veranderd is dan een site zelf šŸ˜…Ā .

Kant B - Jij, de gebruiker

De rechterkant van de tekening ā€“ hier zit jij

De rechterkant van de tekening ā€“ hier zit jij

Het zoek-algoritme

Als je een zoekopdracht intypt gebeuren er bliksemsnel drie dingen vrijwel tegelijkertijd.

1 De zoekmachine leest jouw zoekopdracht en kijkt naar de zoekbedoeling. Hij ziet bijvoorbeeld waar je bent (afhankelijk van je instellingen of de mogelijkheden van de zoekmachine zelf). Een derde van alle zoekopdrachten gaat bijvoorbeeld over dingen in de buurt van de zoeker.

2 De zoekmachine zoekt in de index naar passende resultaten. Bij de ene opdracht krijg je een nette lijst. Bij de andere opdracht krijg je afbeeldingen en een Kenniskaart.

3 De zoekmachine zet de resultaten op een rij. Dat zijn er meestal heel veel, maar het kan ook om een paar paginaā€™s gaan. Om niks te krijgen moet je behoorlijk je best doen. Vaak mixt de zoekmachine er nog een stapel advertenties tussendoor, afhankelijk van de zoekbedoeling.

Het bepalen van wat bij je zoekwoorden past en van de volgorde (ranking) van de resultaten gebeurt met een uitgebreide rekensom, het zoek-algoritme. Bij Google bestaat die som uit wel 200 onderdelen. Hoeveel serieuze tekst een site heeft telt zwaar mee in deze berekening. En of een site goed op een mobieltje te gebruiken is. Of hij netjes onderhouden wordt. Of andere websites veel linken naar deze site.

Maar het allerbelangrijkste is steeds: welke zoekwoorden zijn er gebruikt en hoe passen die bij een webpagina? Hoe beter de zoekwoorden passen, hoe meer kans op een plek hoog in de resultatenlijst.

Geheim

Hoe het algoritme er precies uitziet, is bij de grote zoekmachines geheim, om drie redenen.

1. Een kok vertelt niet graag zijn keukengeheimen. Dus het recept voor zijn ā€˜rekensomā€™ moet niet zomaar door een andere kok uit te voeren zijn. Of door de klanten.

2. Websitebouwers die de rekensom zouden kennen, maken er graag misbruik van om bovenaan in de zoekresultaten komen. Ze zetten dan iets op hun site dat in werkelijkheid misschien niet klopt, maar heel goed werkt in het zoek-algoritme. Zoekmachines hebben daar veel last van. De rekensom wordt daarom steeds ingewikkelder en het bedriegen van de zoekmachine steeds moeilijker. Toch blijven websitebouwers het proberen.

3. Soms laat de zoekmachine jou niet alles zien dat belangrijk voor je is. Google bevoordeelt sommige partijen (zoals vroeger hun eigen Google Plus gebruikers; zij waren veel beter zichtbaar in de zoekresultaten. Dat is illegaal en dus verboden). Google zoekt steeds de grens op.

<aside> šŸ‘ļøā€šŸ—Øļø DIT WEET JE NU ā€¦ over algemene zoekmachines

</aside>

Externe links >


Verder leren >

Wat doet het zoekalgoritme van Google?

Welke zoekmachine?

Wat is een filterbubbel?

Privacyvriendelijk browsen en zoeken?

15+ menu original - synced blok

[Slim Zoeken](<http://slimzoeken.nu/>) Ā©2024 door [Maarten Sprenger onder licentie](<http://slimzoeken.nu/over>) [CC BY-NC 4.0](<https://creativecommons.org/licenses/by-nc/4.0/deed.nl>) [15+] Word een Slim Zoeken supporter Docentinformatie