Google indicizza una buona parte delle pagine di etichette create su Blogger nonostante il file robots.txt che lo dovrebbe impedire.
Blogger con l'introduzione delle Preferenze di ricerca ha anche dato la possibilità ai suoi utenti di modificare il file robots.txt che è quello che sovrintende alla indicizzazione del sito. Eventuali modifiche vanno fatte con grande prudenza per non danneggiare la scannerizzazione del sito da parte dei bot di Google. Di default nel file robots.txt sono inserite solo due righe particolarmente rilevanti. La prima è la sitemap secondo Blogger che indicizza gli ultimi 25 post mentre la seconda è
Disallow: /search
che impedisce l'indicizzazione delle pagine delle etichette vale a dire degli URL del tipo
nomeblog.blogspot/search/label/nome-etichetta
Sarebbe più corretto dire che dovrebbe impedire l'indicizzazione perché questo non succede e Google mette nei suoi risultati di ricerche una discreta percentuale di etichette dei blog su Blogger. Questa non è l'unica "licenza" che si prende Google visto che qualche volta modifica addirittura il titolo di un post quando gli sembra troppo prolisso scegliendone uno più adeguato
Nello screenshot precedente mentre il primo titolo è esattamente quello del post, il secondo titolo è stato modificato con l'inserimento del nome del blog accanto a quello accorciato del post. Si tratta di un vecchio articolo di quasi due anni fa che ho linkato spesso attraverso i collegamenti automatici di Windows Live Writer con "tag condizionali" come testo di ancoraggio.
Ma torniamo al tema dell'articolo che è l'indicizzazione delle pagine del tipo "label". Per verificare che, nonostante il comando presente sul file robots.txt, Google indicizzi anche le pagine di etichette, incollate nel browser la seguente stringa e cliccate su Invio
site:www.ideepercomputeredinternet.com/search
Vedrete un solo risultato con la scritta "ripetere la ricerca includendo i risultati omessi". Se cliccate sopra alla scritta potrete visionare tutte le pagine delle etichette di questo blog che sono state indicizzate. Sostituendo il dominio di questo sito con il vostro potrete visualizzare quali pagine delle etichette del vostro blog siano presenti nei risultati di ricerca di Google.
Come vedete nello screenshot, il titolo della pagina è dato dalla stessa etichetta e dal nome del blog preceduto da un trattino. L'ordine con cui si visualizzano dipende dal loro posizionamento su Google. Posizionamento che però ha poco a vedere con il Page Rank perché questa pagina
http://www.ideepercomputeredinternet.com/search/label/facebook
ha Page Rank 3 e viene dopo di questa
http://www.ideepercomputeredinternet.com/search/label/rainews
che invece ha un Page Rank addirittura non assegnato.
Su questo blog ho creato al momento 988 etichette e cliccando ripetutamente su Avanti nei risultati di ricerca ho scoperto che quelle indicizzate sono in numero di 290. Si tratta quindi di quasi il 30% del totale. Ovviamente mi è ignoto il tipo di criterio usato da Google per indicizzare una data pagina rispetto a un'altra ma probabilmente dipenderà dal numero degli articoli in cui è presente, dal numero di etichette che si sono create e dalla rilevanza delle parole chiave che rappresentano. Accedendo a Google Analytics si possono facilmente trovare delle pagine di etichetta che hanno agito come landing page di visitatori provenienti dai motori di ricerca a dimostrazione di come esse siano presenti nei risultati.
Non sto adesso a ripetere come gestire le etichette di Blogger e come modificarle o rinominarle in gruppo con la nuova interfaccia. Credo però che occorre essere molto parchi nel creare etichette e di metterne da 2 a 4 per ciascun post. Se proprio non ce ne sono di pertinenti basta anche una soltanto. Non creare una nuova etichetta se non si è sicuri che sarà riutilizzata per altri post entro breve tempo e non farsi troppi scrupoli a cancellare le etichette non più idonee come keyword. E' evidente poi che ciascun blog fa un po' storia a sé e non escludo che Google si comporti diversamente su altri siti.
Anch'io in questi giorni ho scoperto che Google indicizza le etichette, anzi... sembra un tantino fregarsene delle modifiche al file robots (fatto sta che ho tolto il file personalizzato).
RispondiElimina@Bastet
EliminaAppunto. Tanto Google fa come gli pare :)
nel mio non si è indicizzato neanche una etichetta XD
RispondiEliminaProbabilmente su blogger tale opzione è superflua, basterebbe creare un elenco come post e darebbe lo stesso effetto, ed ovviamente creare post correlati a quelli creati in precedenza :D
wow questa si che è una notiziona, e io che mettevo i nofollow ai mei stessi link verso i miei stessi tag ...
RispondiEliminaErnesto, ma tu consigli di impostare il file robott in modo che indicizzi le etichette, o è meglio lasciarlo così com'è?
RispondiEliminaE poi ti chiedo un'altra cosa: è possibile - ad es. tramite l'inserimento di determinate stringhe di codice - far indicizzare magari soltanto le etichette che si ritengono più importanti?
Grazie ^^
Giuly
@Giuliana
EliminaAnche da questo post si capisce che Google fa un po' come vuole e indicizza le cose che gli pare. Personalmente lascerei tutto così com'è. Per la seconda domanda non credo si possano selezionare le etichette da farci indicizzare a meno di non fare un elenco lunghissimo con quelle Allow e quelle Disallow
Ho visto che Google Ricerca restituisce i risultati del tuo blog nella forma:
RispondiEliminatitolo articolo (originale o modificato)
mentre col mio risulta:
nome blog: titolo articolo (originale o modificato)
Come hai fatto ad eliminare il nome del blog dai risultati degli articoli?
Sono stato costretto a ridurre la lunghezza sia il titolo del blog che i titoli principali per rendere comprensibili i risultati...
@MatteoElst
EliminaSi tratta di una modifica semplicissima e utile. Modifica solo il codice relativo all'inserimento del titolo prima di quello del blog e lascia perdere le metadescrioni che adesso si fanno in altro modo
http://www.ideepercomputeredinternet.com/2012/01/il-metatag-description-su-blogger-per.html
Se il nome del blog non lo vuoi proprio mostrare basta che tu tolga il secondo tag. Per farti capire meglio in questo blog ho per esempio questo codice
<b:include data='blog' name='all-head-content'/>
<b:if cond='data:blog.pageType == "index"'>
<title><data:blog.title/></title>
<b:else/>
<title><data:blog.pageName/></title>
</b:if>
<b:if cond='data:blog.metaDescription != ""'>
<meta expr:content='data:blog.metaDescription' name='description'/>
</b:if>
<b:skin><![CDATA[/*