1. Capire Google
Google è tra i motori di ricerca più utilizzati al mondo ed è il punto di riferimento in Europa e nel Nord America per portare il pubblico prestabilito ai siti web delle aziende. Non a caso è il focus delle campagne SEO e uno dei tanti miti di questo settore. Per questo motivo, è preferibile imparare il più possibile dalla prospettiva dell’analista aziendale. Per fortuna, comunque, Google fornisce molte informazioni sul suo funzionamento ed ha spesso fornito fonti ai propri utenti per approfondire. Ad esempio, esistono account di twitter molto utili, come quelli appartenenti a John Mueller, Gary Illyes e Danny Sullivan, oppure Think with Google, Google devs e Google AI. Se invece preferite i blog, allora potete scegliere tra Blog.google, Webmasters.googleblog e AI.googleblog.com.
2. LSI
Questa sigla sta per Latent Semantic Indexing, ovvero un indicizzazione che lavora meglio con un dataset statistico ristretto. Questo metodo è stato brevettato dai Laboratori Bell negli anni Ottanta, ben prima dell’invenzione del World Wide Web. Nello specifico, dimostrava che ogni volta che una nuova informazione era aggiunta ad un corpus di dati indicizzato utilizzando lo l’LSI quella indicizzazione si sarebbe dovuta ripetere. Essendo appunto una tecnologia precedente al web, non poteva anticipare il modo di indicizzarlo. Spesso appare questo acronimo in alcuni brevetti di Google, ma non necessariamente per essere il metodo utilizzato per i dati di quell’indice. Esiste comunque un nuovo tool che si chiama LSI Keywords, ma che non sfrutta questa tecnologia nè produce keywords, ma piuttosto parole relazionate che si potrebbero trovare nella stessa pagina della keyword già scelta per quella pagina. In particolare, con questo metodo Google riscriverà la query cercata dagli utenti per mostrare pagine che crede possano incontrare i bisogni informativi o di situazionali con il contenuto che significa sostanzialmente lo stesso, che è un po’ il pensiero che sta dietro a Google Hummingbird.
3. TF-IDF
Come l’LSI, anche il TF-DFI è un vecchio metodo di indicizzazione inventato prima dell’avvento del World Wide Web. Guarda alla frequenza di un termine in un documento e quanto spesso appare in un corpus di documenti indicizzati. Questo svelerà se un pagina riguarda un termine concreto e quanto comune o popolare sia nello stesso corpus. Non include comunque parole che appaiono spesso e che non hanno un significato proprio, come ad esempio le preposizioni e gli articoli. Questo approccio è stato però rimpiazzato da un algoritmo più avanzato, conosciuto con il nome di BM25. Spesso ci si riferisce al TF-IDF come a parte di un processo per identificare i miglioramenti della query che appaiono al fondo dei risultati di ricerca di Google, ma non viene mai associato ad una parte di come le pagine sono indicizzate sul web.
Esistono tool creati per persone che costruiscono pagine per siti internet. Questi tool ad esempio prendono i termini query indicizzati per una pagina e li passano attraverso un processo TF-IDF in pagine che si classificano ai primi posti per quei termini, così da creare pagine che comparano bene rispetto a quelle pagine ben classificate.
4. TrustRank
L’idea che sta dietro questo processo è quella di identificare le pagine di spam sul web. Il progetto è nato da una joint venture tra i ricercatori di Yahoo e l’Università di Stanford. Essendo apparso per la prima volta proprio sul sito di questo istituto, molti hanno erroneamente ete pensato che fosse collegato a Google, dato che Google è nato proprio grazie a ricercatori e studenti dell’Università di Stanford. TrustRank non viene utilizzato per classificare le pagine web, così come l’approccio basato brevettato da Google non ha niente a che vedere con quello inventato da Yahoo. Infine, si è riferita all’affidabilità nelle sue Quality Rater’s Guidelines, ma non ha niente a che vedere con questo argomento.
Inoltre, attenzione a cosa si legge in giro riguardo a TrustRank. Infatti, spesso si mischiano fatti verificabili con generalizzazioni frettolose e con prove completamente in disaccordo per supportare l’affermazione che Google utilizzi questo metodo per classificare le pagine (cosa che nemmeno TrustRank fa).
5. RankBrain
Google ha una lunga storia per quanto riguarda le query di riscrittura, risalendo addirittura al 2003. In questo anno brevettarono un metodo che utilizzava sinonimi di query salvati dal moto di ricerca, trovando termini che potevano essere sostituti o sinonimi del termine originale che qualcuno sceglie per fare una ricerca. Venne però introdotto un aggiornamento chiamato RankBrain. La riscrittura si basa su una tecnologia Word Vector sviluppata dal team di Google Brain. Ad ogni modo, l’azienda ha ufficialmente annunciato che le pagine web non possono essere ottimizzate per questa tecnologia. Purtroppo però in internet sono apparsi molti articoli a riguardo e molti dei consigli che vengono portati sono utili di per sè, ma non servono però per RankBrain.
Se state navigando o se siete in cerca di informazioni specifiche, ma non vi fidate delle fonti riportate, allora questa infografica potrebbe esservi d’aiuto: https://cdn.semrush.com/blog/static/media/6e/84/6e84225f6e91a55c2e76a0fdf998ca62/resize/885×2375/a-guide-to-the-biggest-seo-myths-on-the-web-fallacies-1.webp