Contenuto duplicato: cosa significa?
Prima di tutto è bene dare una definizione di questo concetto. Stando a quelle che sono le parole ufficiali del colosso Google, si può dire che questi non sono altro che contenuti all’interno o tra altri domini che siano identici o quanto meno, molto simili. In svariati casi questa situazione non è volutamente ingannevole, ma è bene prestarvi una certa attenzione in quanto può determinare problemi.
Traducendo tutto ciò in termini più pratici ed immediati, si può dire duplicato quel contenuto che sia presente in due o più pagine con un URL differente. Ovviamente il tutto qualora entrambe le pagine risultino presenti all’interno dell’indicizzazione di Google. Tale questione ha sempre creato un bel po’ di discussioni, e talvolta anche confusione, tra gli addetti ai lavori e professionisti del settore. Più volte è stato rimarcato come ciò, qualora non sia fatto con l’intento di copiare, non è in alcun modo in quanto Google non lo considera come vero e proprio spam.
Dunque non si parla di vere e proprie penalizzazioni pensate ad hoc per tutti quei contenuti duplicati. Ma è sempre necessario evitare di andare incontro a situazioni del genere e che possano essere considerate borderline. I pericoli grossi sono da prendere in esame soprattutto se la copia ha come obiettivo la manipolazione dei ranking. Questo potrebbe esporre qualsiasi sito web a delle conseguenze pesantissime, tra cui la deindicizzazione da Google. Il che vorrebbe dire praticamente scomparire dai radar e vedere quasi del tutto azzerata la propria visibilità online.
Google “odia” i contenuti duplicati: quali sono i motivi?
Molti potrebbero chiedersi perché Google abbia una tale avversione nei confronti di questi contenuti. In primis perché gli utenti amano la diversità e di certo andare incontro ad articoli uguali o oggetti ridondanti li porterebbe a perdere un determinato interesse. Google dunque deve per certi versi sottostare a questo tipo di esigenza cercando di garantire visibilità a tutti, ma evitando che ci siano sempre le stesse cose online.
Bisogna anche parlare di come GoogleBot possa riconoscere il contenuto originale di fronte a due copie. Ciò non è semplice: si immagini di trovare due articoli completamente uguali: chi ha copiato chi? L’algoritmo perciò va a considerare la data di indicizzazione, così come tutta una serie di fattori tra cui l’autorità del sito. Un sistema dunque molto intelligente e che può essere un’importante tutela per tutti gli utenti e coloro che possiedono un portale online.
Il terzo elemento da considerare è che avere dei backlink verso più pagine che abbiano contenuti duplicati può rivelarsi un’arma a doppio taglio. Questo strumento, se non ben sfruttato, può portare ad una “diluizione” del link e ridurre così la visibilità. Ancor di più qualora venga linkato un concorrente che abbia copiato un determinato contenuto.
Perché controllare attentamente contenuti duplicati
Chi possiede un sito internet di qualsiasi genere ha voglia di raggiungere un pubblico sempre maggiore. L’ambizione dunque è una spinta importante per arrivare a tanti utenti che possano così venire a conoscenza di ciò che si propone: dagli articoli a prodotti da poter acquistare, e molto altro ancora. Il web dunque è una risorsa validissima che però ha anche una certa intelligenza. Motivo per cui non bisogna mai cadere nell’errore (molto comune) di pensare di farla franca duplicando contenuti volontariamente. Ancor più attenzione va prestata per evitare che per caso vi possano essere dei “doppioni” tra il proprio sito ed altri indicizzati in Google.
Le penalizzazioni potrebbero essere dietro l’angolo e minare dunque al successo di un sito. Non bisogna sorprendersi se un errore del genere possa in qualche modo determinare un annullamento di quanto di buono fatto in precedenza.
Le cause della presenza di contenuti duplicati
Non c’è sempre la volontà delle persone che hanno un sito di creare questi contenuti copiati. In molti casi potrebbero anche esserci delle altre cause che espongono così a dei rischi non da poco.
Il primo può essere il tentativo di plagio di un concorrente, per esempio. Copiare i contenuti non è certo una mossa saggia anche perché Google mette a disposizione uno strumento apposito che si chiama DMCA Dashboard che è gli permette di identificare l’autore di questo atto poco leale. E le conseguenze sono immediate dato che viene rimosso interamente il contenuto o addirittura oscurato il portale su cui è inserito. Ultimamente sono in aumento casi di questo genere soprattutto in relazione alle immagini: tanti siti usano file di altri senza chiedere autorizzazione e non rispettando il regolamento imposto sui motori di ricerca.
Altra causa per cui sul proprio sito potrebbero esserci dei contenuti duplicati può essere la presenza di varie versioni dello stesso. Si pensi ai casi HTTP/HTTPS e www/non-www, molto frequenti qualora il possessore del sito o webmaster non abbia implementato correttamente un redirect 301. Potrebbero così venirsi a creare ben quattro pagine identiche che GoogleBot riuscirebbe a vedere in pochissimi istanti. Impostare un redirect è molto semplice, anche perché esistono dei plugin specifici per questa funzionalità.
Occhio ai parametri che se non correttamente impostati possono generare URL differenti. Ci sono infatti alcuni parametri di tracking che non hanno influenza su ciò che viene inserito in una pagina: nella sezione della pagina si può specificare la versione principale evitando di andare incontro a scomode copie. Questo inoltre permetterà di risparmiare spazio sul database in quanto non verranno generate decine di contenuti che oltre che duplicati, sono del tutto inutili.
Altra causa di contenuti duplicati sono i thin content che tradotto vuol dire proprio i contenuti scarni. Questa pagine generalmente sono molto brevi e hanno poco o nulla di originale. Le pagine di archivi di WordPress tra cui Tag e Autori sono tra queste. Meglio dunque arricchire usando dei meta tag appositi tra cui ‘noindex’, ‘follow’.
Su tanti siti viene dato scarso risalto al boilerplate content, ovvero un contenuto che sia presente in sidebar, footer e header. Essendo presente in gran parte degli URL del sito, alla lunga, può anche diventare un problema. Incrementare quanto più possibile le variazioni delle diverse sezioni del sito può essere un’ottima idea. Per andare nel pratico, se si parla di un sito che compari articoli di abbigliamento, è inutile che nella sidebar venga mostrato l’elenco dei rivenditori di smartphone o automobili.
Riconoscere e risolvere il problema dei contenuti duplicati
Per poter trovare dei contenuti che siano duplicati su siti esterni ci sono dei servizi appositamente creati. Basti pensare a Copyscape anche se non mancano le alternative come quella di cercare manualmente alcune frasi di un determinato articolo sfruttando le virgolette sulla barra di ricerca. Usare un crawler esterno può aiutare a trovare dei contenuti doppi presenti nello stesso sito e che dunque possono diventare un pericolo per la SEO.
Parlando di un esempio concreto, dopo aver effettuato una scansione dettagliata si può lavorare sul report finale che si ottiene: esso dà un’analisi completa di quali e quanti sono quei post duplicati che vanno corretti in maniera tale da non determinare penalizzazioni sui motori di ricerca.
Eliminare totalmente i contenuti duplicati
Ci sono delle piattaforme molto funzionali che permettono di individuare i contenuti che siano presenti a doppio sul web. Queste sono in grado di analizzare dettagliatamente tutti gli URL del proprio sito. Tra le principali si può parlare di Semrush e Screaming Frog, ad oggi tra le più utilizzate. Grazie ad essi si possono vedere eventuali collegamenti esterni da pagine diverse da quelle del proprio portale online. Basta applicare il tag ‘no follow’ per risolvere questo problema: esso va inserito in ogni dominio che non venga considerato rilevante e che potrebbe rivelarsi un pericolo per la SEO.
Ottimizzare i contenuti: piccoli trucchi da considerare
Ovviamente non è detto che i consigli precedenti funzionino al primo colpo. In molti casi perciò è bene non arrendersi e soprattutto non pensare che si tratti di una situazione di difficile risoluzione. Gli strumenti sul web non mancano di certo e tra questi si può parlare di Google Search Console che aiuta a modificare i parametri che non generano dei contenuti in qualche modo equivoci. Sempre consigliabile stabilire una certa regolarità nel suo utilizzo così che i parametri siano sempre allineati al proprio portale senza mai creare problemi.
Indubbiamente però uno dei modi più semplici per cambiare l’URL presente su un altro sito e che sia duplicato rispetto al proprio è quello di chiedere la variazione. Infatti gran parte dei siti web potrebbe imbattersi in link di scarso livello e che potrebbero ridurre al minimo i benefici di un corretto utilizzo della SEO. Muoversi per tempo è la mossa migliore, adoperando il sistema email per comunicare col webmaster del sito in questione. Meglio farlo in maniera veloce così da limitare i danni e fare in modo che il proprio sito possa avere una certa visibilità sui motori di ricerca.