BERT

BERT is een techniek van Google om natuurlijke taalverwerking te herkennen, op waarde te schatten en te koppelen aan de zoekopdracht

BERT

Auteur: Erwan Vrignaud
Leestijd: 12 minuten

Kunstmatige intelligentie en SEO

Als SEO specialist is het noodzaak altijd op de hoogte te blijven van de laatste ontwikkelingen van Google. Een hele uitdaging. In de afgelopen jaren zijn er veel wijzigingen en veranderingen in het zoeknetwerk van Google waargenomen die allemaal van invloed zijn op de manier waarop we websites ontwikkelen, content schrijven, css codes herschrijven, kortom de hele plan van aanpak is continu in beweging. In dit artikel ga ik de laatste belangrijke ontwikkelingen binnen Google omschrijven en wat dat SEO-technisch voor gevolgen heeft. In de afgelopen tien jaar is kunstmatige intelligentie het speerpunt geworden in de evolutie van SEO. In oktober 2015 begon Google met RankBrain – het machinegebaseerde zoekalgoritme dat Google helpt om relevantere resultaten naar gebruikers te pushen. Hoewel RankBrain inmiddels al ruim vijf jaar draait vangen we nu pas een glimp op van hoe kunstmatige intelligentie SEO de komende jaren zal domineren.

BERT

De laatste en tevens grootste stap vooruit hierin is BERT en dat is niet de chagrijnige Sesamstraat vriend van Ernie maar een uiterst ingenieus formule die teksten kan indexeren op basis van natuurlijke taalverwerking. BERT staat voor Bidirectional Transformers for Language en dat is een hele mond vol. Op dit moment is dit alleen actief in de VS en UK. Maar het zal niet lang duren of het wordt in NL ook uitgerold. Wat houdt het precies in? In het kort is BERT een op neurale netwerken gebaseerde techniek van Google om natuurlijke taalverwerking te herkennen, op waarde te schatten (relevantie) en te koppelen aan de zoekopdracht. En andersom natuurlijk, de zoekopdracht wordt gekoppeld aan de pagina/website. Dit is belangrijk omdat Google zelf al aangeeft dat dit de grootste sprong voorwaarts is in de geschiedenis van het Zoeknetwerk van Google. En dat is nogal een uitspraak. BERT beïnvloedt gemiddeld één op de tien zoekopdrachten en geeft Google een beter begrip van hoe taal wordt gebruikt en helpt het de context van individuele woorden in zoekopdrachten te begrijpen. Het belangrijkste dat je moet weten over BERT (en RankBrain) is dat veel van de SEO trucen overboord kunnen. Deze algoritmes halen ze er haarfijn uit en in het gunstigste geval heeft het geen effect maar in het ongunstigste geval heeft het een negatief effect.

BERT en SEO

BERT is slechts één signaal van hoe Google tekst begrijpt, maar het is een van de belangrijkste in het arsenaal van de zoekmachine. Dat betekent dat zowel webdevelopers als SEO-marketeers zich nu meer dan ooit moeten concentreren op het creëren van natuurlijke, relevante en hoogwaardige content. Google rangschikt pagina’s ook op basis van entiteitsstatistieken, wat inhoudt dat er verschillende kenmerken (entiteiten) worden gekoppeld aan de zoekopdracht. Te denken valt aan interesse, intentie, context, eerder gemaakte zoekopdrachten enz. Wanneer twee personen allebei op dezelfde locatie zitten, allebei achter hun eigen computer en ingelogd zijn in Google en dezelfde zoekopdracht uitvoeren zul je verschil zien in de zoekresultaten die Google zal laten zien. Als individu bouw je een profiel op en dit zal iedere resultaat beïnvloeden. Wanneer een volwassen man bijvoorbeeld de zoekopdracht ‘planeet Venus’ intoetst en deze man is altijd zeer geïnteresseerd in de wetenschap, dan is de kans groot dat er wetenschappelijke resultaten aan hem worden vertoond. Maar, als zijn dochter van tien jaar dezelfde zoekopdracht uitvoert zullen er andere resultaten te zien zijn. Heeft bijvoorbeeld het Jeugdjournaal twee maanden geleden een heel artikel geschreven over deze planeet, dan zal Google deze naar voren schuiven. Dat BERT uiterst complex in elkaar zit moge duidelijk zijn, fascinerend is het zeker ook.

Rankbrain van Google, kunstmatige intelligentie voor maximale relevantie voor hun bezoekers

Rankbrain van Google, kunstmatige intelligentie voor maximale relevantie voor hun bezoekers.

BERT in de praktijk

Dat BERT veel opschudding heeft veroorzaakt in de technische SEO-scene laad zich raden. Het machine learning proces is hiermee naar een nieuw niveau getild en Google is in staat om nauwkeurig de waarschijnlijkheid van gebruikersintentie te berekenen. Bovendien zijn entiteiten minder afhankelijk van links als rangschikkingsfactor dus, afhankelijk van wat jouw SEO-strategie is, kan dit resulteren in de behoefte aan grote aanpassingen in jouw SEO beleid.
Het belangrijkste aspect dat je moet overwegen is hoe Google de entiteiten op jouw website zal indexeren. Als je bijvoorbeeld telefoons verkoopt moet je bedenken hoeveel verschillende soorten, kleuren, maten, merken en concepten er bestaan. Elke telefoon vertegenwoordigt een andere entiteit, wat betekent dat je moet nadenken over hoe je elk product moet kaderen zodat het voldoet aan de verwachtingen van gebruikers en aan de leermogelijkheden van Google. Door gedegen en gedisciplineerd te werk te gaan is het mogelijk dat na enige tijd de website zelf een entiteit gaat worden. Wikipedia is een prachtig voorbeeld, ook zij zijn ooit klein begonnen en moesten er zelf zorgen “vertrouwen” te winnen bij Google en nu hebben ze een zeer hoge entiteitsstatus. Dit is zo ver gegroeid dat een vermelding van een bedrijf of persoon op Wikipedia indirect zal leiden tot een hogere entiteit in Google. Het is als klimmen in een Pyramide, hoe hoger de entiteit hoe meer data onder jouw website “hangt” wat juist geleid heeft tot deze status.

Google Discover

Google Discover werd uitgebracht in juni 2017 wat leidde tot een nieuwe manier van informatieverstrekking, een waar geen zonder zoekopdracht aan vooraf gaat. Discover is een AI-aangedreven tool voor contentaanbeveling en claimt tachtig miljoen actieve gebruikers. In Google Discover is een extra laag toegevoegd, de Topic Layer, die is ontworpen om te begrijpen hoe de interesse van een gebruiker zich in de loop van de tijd ontwikkelt en voor welke onderwerpen je mogelijk interesse zal hebben. Door de vele onderwerpen te onthouden waarin een gebruiker is geïnteresseerd identificeert Discover de meest nauwkeurige content die moet worden geleverd vanaf een reeks verschillende websites. Om in Discover te verschijnen schrijft Google voor dat de pagina’s moeten zijn opgesteld en voldoen aan het inhoudsbeleid van Google Nieuws. Er zijn geen speciale tags of gestructureerde gegevens vereist. Het rangschikt inhoud op basis van algoritmes dat de kwaliteit van de inhoud inspecteert naast de interesses van de gebruiker en het onderwerp van de pagina op de website. De exacte formule is onbekend, maar op basis van verschillende onderzoeken en experimenten hebben we nu een redelijk goed beeld van hoe het werkt. Volgens Google zijn er twee manieren om de prestaties van jouw inhoud binnen Discover te verbeteren, namelijk het plaatsen van interessante inhoud en het gebruik van afbeeldingen van hoge kwaliteit. Zorg er zoals altijd voor dat jouw content uniek en van hoge kwaliteit is en een prettige ervaring voor gebruikers biedt. Met prettig wordt bedoeld, het juiste lettertype (niet te groot of te klein), responsive inhoud (voor mobiele gebruikers), snelle laadtijd etc. En de teksten moeten door de semantische algoritmes worden “goedgekeurd”, dus maak de teksten leesbaar en prop het niet vol met technisch jargon of zoekwoorden bijvoorbeeld. De andere kant doorslaan is net zo funest, als de teksten worden geclassificeerd als ‘algemene content’ dan worden er dus veel woorden gebruikt maar zonder inhoud.

Google Lens

De grootste verandering in het zoeken naar afbeeldingen vond plaats in september 2018 toen Google Lens werd uitgerold. Niet alleen begonnen aanbevolen video’s te verschijnen bij het zoeken naar afbeeldingen, maar er werden ook AMP-verhalen en nieuwe rangschikkingsalgoritmen en tags vrijgegeven. Er is een trend gaande dat afbeeldingen steeds meer gebruikt worden om doelen te bereiken, producten te kopen en nieuwe informatie te leren. Dat afbeeldingen een puur illustratief doel hadden is inmiddels verleden tijd. Laatst was ik zelf op zoek naar skeelers om cadeau te geven aan een 12 jarige jongedame. Ik herinner me dat ik meteen overschakelde op afbeeldingen en pas bij het zien van een “geschikt” exemplaar op de afbeelding klikte. Iedereen weet dat je dan naar de website zelf gaat en meestal tot aankoop over kan gaan. Het scheelt oeverloos gesnuffel op allerlei websites omdat je weet dat je toch in eerste instantie op zoek bent naar een item wat visueel aan je verwachting voldoet. Is dat niet in orde, dan gebeurt er sowieso meestal niets. Google heeft altijd vermeld dat afbeeldingen correct moeten worden geoptimaliseerd en gemarkeerd, dus als je nog niet bent begonnen met het toevoegen van dergelijke gegevens of informatie aan jouw afbeeldingen dan moet dit prioriteit krijgen. Het is gangbaar dat de SERP een universeel zoekresultaat presenteert dat afbeeldingen, video’s, kaarten, nieuws en winkelvermeldingen omvat. De mogelijkheid om te verschijnen in een universeel (of gemengd) resultaat is gewoon een andere reden waarom correct getagde en gemarkeerde afbeeldingen zo belangrijk zijn. Ten slotte heeft Google visuele zoekattributen voor afbeeldingen toegevoegd aan zoekresultaten. Het interessante van deze update is dat deze attributen nu beschikbaar zijn als afbeeldingscarrousels in de belangrijkste zoekresultaten

Google Lens identificeert afbeeldingen en koppelt deze aan zoekopdrachten

Google Lens identificeert afbeeldingen en koppelt deze aan zoekopdrachten

Google EAT-formule

E-A-T staat voor Expertise, Authoritativeness en Trustworthiness (of in het Nederlands Expertise, Autoriteit en Betrouwbaarheid). Het is een ranking norm die Google hanteert om website te keuren op basis van cruciale factoren. Al wordt deze formule bij de ene website strikter gehanteerd dan bij de andere, het is voor iedere online marketeer belangrijk te weten wat dit inhoud. Wanneer jouw website voornamelijk blogs bevat met teksten en zelf geschoten foto’s over je dagelijkse ochtendwandeling, dan zal Google dit minder strikt hanteren dan wanneer de content gericht is op zaken als gezondheid, financiën of veiligheid. Deze laatste categorie valt ook wel onder de YMYL (Your Money or Your Life) categorie wat impliceert dat wanneer de content directe invloed uitoefent op iemands toekomstige geluk, gezondheid, financiële stabiliteit of veiligheid dit invloed kan hebben op iemands leven en deze content dus extra aandacht zal krijgen. Het probleem is echter dat de meeste websites (en zeker de websites waar SEO-specialisten aan hebben gesleuteld) over het algemeen YMYL-pagina’s of -onderwerpen zullen hebben en Google neemt grote stappen om ervoor te zorgen dat YMYL-inhoud van lage kwaliteit of twijfelachtige inhoud wordt verwijderd. Het is niet mogelijk de E-A-T formule te beïnvloeden omdat het geen algoritme is, maar je kan wel wijzigingen aanbrengen om ervoor te zorgen dat jouw site de juiste kwaliteitssignalen naar Google stuurt.

De semantiek van zoekwoorden

Google is erg slim geworden in het begrijpen waarnaar een gebruiker zoekt op basis van slechts een paar basiswoorden. Dit algoritme heeft inderdaad een diepgaand begrip van semantiek en verlangt ernaar gebruikers te voorzien van een schat aan informatie. Dit betekent dat het nog nooit zo belangrijk is geweest om hoogwaardige, diepgaande en zinvolle content voor gebruikers te creëren, maar je moet ook nadenken over de informatiestructuur. Als je bijvoorbeeld outdoor kleding verkoopt kun je uitgebreide educatieve artikelen schrijven over welke kleding voor welke activiteiten het meest geschikt is, welke kleding de beste keus is voor welk weertype en uit welke materialen deze kleding bestaat. Wanneer al deze onderwerpen worden onderverdeeld in compartimenten dan kan zowel Google als de bezoeker makkelijker navigeren door de menu´s om een totaalbeeld te krijgen van de aangeboden content. Zorg dus voor een heldere en overzichtelijke menustructuur. De afgelopen jaren zijn de zoekresultaten enorm geëvolueerd. Ze zijn zelfs zo sterk veranderd dat het in sommige gevallen niet de meest lucratieve positie is om als eerste te worden geplaatst in de organische zoekresultaten. Dit is iets dat slechts een paar jaar geleden ondenkbaar zou zijn geweest. Met de introductie van Voice Search, rich snippets, kennispanels, Google Mijn Bedrijf, afbeeldingen en uitgebreide resultaten moeten SEO-marketeers nu een hele nieuwe reeks technische marketingstrategieën overwegen om in organische zoekresultaten tevoorschijn te komen.

SERP

SERP staat dus voor Search Engine Results Page en het is moeilijk om te weten waar Google het komende jaar met deze SERP’s naartoe gaat. Het is continu in ontwikkeling en strategieën die we vandaag gebruiken voor de zoekomgeving kunnen zomaar binnen zes maanden weer achterhaald zijn. Neem bijvoorbeeld de recente toevoeging en daaropvolgende verwijdering van favicons in de SERP’s, inmiddels heeft Google deze wijziging weer ongedaan gemaakt wat bewijst dat we nooit kunnen voorspellen welke wijzigingen tijdelijk of blijvend zijn. Zorg ervoor dat jouw strategieën flexibel zijn en bereid je voortdurend voor op online veranderingen in zowel jouw branche als de constant evoluerende zoekomgeving. Let ook op de variabele factoren zoals seizoen gebondenheid van zoekopdrachten en gebruik tools zoals Google Trends om eventuele afwijkingen hierin op te vangen.

Conclusie

Onderstaande punten zijn zo belangrijk dat ik ze puntsgewijs heb opgeschreven. Zorg ervoor dat geen enkel punt is overgeslagen aangezien dit grote consequenties heeft op de vindbaarheid van jouw website:

  • Zorg er voor dat de website voor mobiele apparaten geschikt is.
  • De snelheid van de laadtijd moet zo snel mogelijk zijn.
  • Is de content op de website relevant en van goede kwaliteit? Vermijd content die weinig van doen heeft met het primaire doel. Geen pagina over het weer als je website over computer benodigdheden gaat. De kwaliteit betreft een breed scala aan punten zoals schrijfstijl, spellingsfouten of grammaticale onjuistheden.
  • Vermeld altijd duidelijk de contactgegevens. De afkorting NAP is hierin leidend, deze staat voor Name, Adress en Phone number. Een webwinkel die deze gegevens niet vermeld is kansloos. Dit heeft te maken met de betrouwbaarheid van de website.
  • Wanneer je iets verkoopt, zorg voor een pagina geheel gewijd aan klantenservice met daarin zoveel mogelijk vragen en antwoorden verwerkt. Stel je klant gerust.
  • Voorzie de website regelmatig van nieuwe content, zeker in een branche die “in beweging” is. Verkoop je bloemen dan is dit minder belangrijk dan wanneer je bijvoorbeeld anti virus software aanbiedt.
  • Zorg voor een duidelijke structuur binnen je website. Vinden klanten snel waar ze naar op zoek zijn?
  • Wees overtuigd dat de schrijver ook gekwalificeerd is om de content te plaatsen. Dit heeft met autoriteit te maken. Als een professor een artikel schrijft over klimaatverandering zal dit een hogere waarde vertegenwoordigen dan een burger zonder deze kwalificaties.
  • Zorg voor externe platforms die verwijzen naar jouw website. Hoe belangrijker dit platform hoe meer waarde. Dus een link vanuit Wikipedia naar jouw website zorgt voor hogere ranking dan een link vanuit een onbenullige website.
  • Schrijf geen teksten om hoger in Google te komen maar informeer je bezoeker. Leg de focus altijd op je bezoeker, prospect of klant en “vergeet” Google eigenlijk. Dit klinkt tegenstrijdig maar als je al je focus op je klant legt ziet Google dat vanzelf en volgen de resultaten automatisch.

Al deze punten, mits correct toegepast, zullen gegarandeerd leiden tot meer (relevant) verkeer en uiteindelijk ook tot meer conversies. Het gaat niet over een nacht ijs maar dat moet je ook niet willen. Gedegen en betrouwbare SEO-marketeers zullen altijd zeggen dat correct SEO-werk zijn tijd nodig heeft. Beter een langzame maar stabiele stijging dan een snelle met alle risico’s van dien.