Naturalmente, ogni qual volta un nuovo algoritmo viene rilasciato in Google, gli esperti SEO di tutto il mondo tremano: le più recenti novità, infatti, potrebbero spazzare via completamente tutte le loro conoscenze in merito alla tematica, costringendoli di fatto a una nuova formazione.
Non è stato questo il caso, eppure Google BERT – uno dei più recenti aggiornamenti del motore di ricerca, darà molto filo da torcere a tutti gli esperti di posizionamento e web marketing. Le novità che questo nuovo algoritmo introduce sono infatti molto rilevanti, e possono stravolgere il posizionamento dei siti in seguito alle query. Ecco, dunque, tutte le novità di Google BERT.
Cosa significa Google BERT
Innanzitutto, per comprendere cosa sia Google BERT, è possibile partire dalla sigla che accompagna il nome dell’azienda. BERT, infatti, sta per Bidirectional Encoder Representations from Transformers, ed è il frutto del lavoro dei ricercatori di Google AI Language (il team dell’azienda dedicato a utilizzare l’intelligenza artificiale per migliorare le proprietà di linguaggio e comprensione del testo, degli audio e di tutto ciò che riguarda le parole).
Per introdurre le novità di BERT, si può innanzitutto partire col dire che è un algoritmo di Machine Learning, il quale mima il funzionamento cerebrale umano: in altre parole il sistema automatico preleva degli input, li processa e, quando commette degli errori, apprende da essi per ottimizzare le proprie performance.
Google BERT migliora le performance del dispositivo di comprensione delle parole di Google denominato Transformer. Mentre in passato questo sistema era pensato per leggere le parole da sinistra verso destra, processandole singolarmente, Google BERT si prefigge l’obiettivi di analizzare i caratteri in maniera bidirezionale.
In realtà, per una maggiore precisione è opportuno dire che più che leggere il testo da destra verso sinistra e viceversa, Google BERT prende in considerazione gruppi di parole in contemporanea. Ciò è fondamentale per permettere di ricostruire il contesto con maggiore precisione, in modo da estrarre il significato direttamente dalla frase e non dalle singole parole, con lo scopo di fornire una risposta pertinente ed efficiente.
Oltre a leggere e interpretare gruppi di parole insieme, l’algoritmo si sforza anche di leggere più frasi in contemporanea.
Ciò consente a Google non solo di interpretare meglio la singola ricerca, ma anche di ottimizzare il proprio livello di conoscenza di ogni idioma, soprattutto per ciò che concerne l’aspetto legato alle sfumature di significato di parole e frasi.
Come funziona Google BERT?
Oltre a descrivere in linea teorica cosa fa Google BERT, è anche opportuno approfondire le strategie che esso utilizza per raggiungere i suoi scopi. Innanzitutto, il Transformer di Google implementato negli algoritmi legge le frasi, le contestualizza, le interpreta e prova a predire la parola successiva. Per come è stato descritto, però, l’approccio è unidirezionale, dunque in contrasto con le novità introdotte da BERT.
Per superare questo limite, dunque, i ricercatori di Google hanno adottato le seguenti strategie:
• Masked LM.
• Next Sentence Prediction.
Cos’è il Masked LM?
La prima delle due strategie adottate da Google BERT per migliorare la propria comprensione del linguaggio e delle query consiste nel mettere alla prova le proprie capacità. In pratica, l’algoritmo ottiene in input una porzione di testo e la processa in modo da sostituire alcune parole (nello specifico, il 15% del totale) con uno spazio vuoto, chiamato MASK. Sulla base del contesto, quindi, Google cerca di prevedere quali sono le parole più adatte per completare i campi precedentemente celati.
Cos’è il Next Sentence Prediction?
Il funzionamento dell’algoritmo Next Sentence Prediction differisce dal Masked LM, in quanto non prevede la comprensione e la predizione di singoli termini, bensì l’associazione di frasi tra loro, affinché formino un discorso di senso compiuto e coerente.
Per “mettere alla prova” l’algoritmo, i ricercatori forniscono al processo il 50% di periodi in cui la seconda segue la prima, e il 50% composto invece da frasi sconnesse tra loro. L’obiettivo dell’algoritmo è ovviamente riconoscere i periodi che mancano di coerenza, in modo da eliminarli.
Come si può utilizzare BERT?
L’algoritmo implementato da Google può essere utilizzato dagli utenti in 3 modi differenti:
• Migliorare la comprensione linguistica, ottimizzare algoritmi finalizzati a processare testi sulla base del loro significato e molto altro. Gli impieghi, in questo caso, possono riguardare la ricerca e non solo.
• Nei bot dei siti web, come elaboratore di risposta ad alcune domande.
• Nell’ambito del Named Entity Recognition, in cui l’algoritmo pre-installato può essere implementato con BERT, in modo da addestrarlo a prevedere l’etichetta da attribuire a un testo.
Google lo adotta in maniera piuttosto complessa. Il 15% dei token casuali inseriti nel testo, infatti, viene elaborato preventivamente in modo da far sì che l’80% di questi sia sostituito da ulteriori token, il 10% da parole casuali e il 10% da parole originali. In questo modo, secondo i ricercatori, le performance dell’algoritmo sono ottimali e complete, in quanto lo stesso è sempre stimolato a migliorarsi.
Google BERT in ottica SEO
Grazie alla possibilità dell’algoritmo di comprendere in maniera più approfondita l’idioma e di contestualizzare ogni singolo termine, Google BERT può essere impiegato per comprendere meglio le ricerche degli utenti. In questa ottica, Google BERT può essere utile per processare espressioni più colloquiali e legate alla conversazione piuttosto che alla stesura di testi, e dunque fornire risultati di ricerca adeguati, evitando qualunque incomprensione.
Al momento, non sembra che BERT richieda un intervento specifico da parte degli esperti SEO: si tratta semplicemente di un algoritmo finalizzato alla migliore comprensione del testo. Di certo, però, gli esperti di web marketing devono investire ulteriormente le proprie energie per realizzare testi di qualità e pertinenti relativamente a una query di ricerca, in modo da evitare l’esclusione dalla SERP.