Pubblicato il 10/02/10 - aggiornato il  | 21 commenti :

Cosa sono gli Errori di Scansione e perché non bisogna eliminare alcun articolo del blog.

Nella Bacheca per Webmaster sono mostrati quelli che sono indicati come "Errori di scansione". I principali riguardano

  1. Non trovato - quando a un indirizzo del tuo sito non corrisponde il relativo post
  2. Non seguito - quando il reindirizzamento non è andato a buon fine
  3. URL soggetti a restrizioni in robots.txt - quando nel nostro file robots.txt ci sono delle indicazioni per non indicizzare delle pagine
  4. Timeout - Pausa durante la scansione per la ricerca dei DNS o della connessione al server o durante l'accesso al file robots.txt
  5. Errori HTTP - si è rilevato un errore durante la visualizzazione dell'URL che ha rimandato un messaggio del tipo "404 Not Found" o simile
  6. URL non raggiungibile - Indica un problema generico che può essere relativo a uno dei precedenti casi

Lo stato del vostro sito relativamente agli errori di scansione potrebbe quindi generare una tabella di questo genere

 errori_scansione

Ho evidenziato i due valori diversi da zero per approfondirne il significato. Se siete utenti di Blogger non vi dovete stupire, né preoccupare, del numero di pagine presenti in "Soggetto a restrizioni da robots.txt". Queste dipendono dal fatto che, per scelta, Blogger impedisce di indicizzare le pagine del tipo nomeblog.blogspot/search/label/nome-etichetta attraverso il file robots.txt che ha il comando Disallow: /search. Ve ne potete rendere conto guardando online il vostro file che si trova all'indirizzo nomeblog.blogspot.com/robots.txt; quello di questo blog per esempio si può vedere qui. Tutte le cartelle che contengono le etichette non vengono quindi indicizzate per non creare doppioni con i singoli post. Il numero più o meno alto dipende esclusivamente dal numero di post e dal numero delle etichette che avete utilizzato.

Un discorso diverso lo meritano i link non trovati. Ci possono essere varie cause anche indipendenti dalla nostra volontà.

  1. Blogger ha sbagliato a inserire il link - succede più spesso di quanto non si creda perché per un bug del sistema Blogger non inserisce correttamente il link. Mi è capitato già  qualche volta lo raddoppi, cioè che inserisca l'URL dell'homepage del blog prima di quello da inserire. Si può ovviare rieditando il post
  2. Qualcuno ha linkato un tuo articolo ma in modo non corretto - Si può avvertire chi lo ha fatto oppure si può anche evitare perché comunque non è cosa che tocca il nostro sito. Per esempio molti blog hanno linkato il mio articolo "Tutti i blogger che usano Adsense sono tenuti…". Purtroppo nel codice della scritta scorrevole, che rimanda all'articolo ,in un primo tempo avevo inserito per sbaglio le virgolette inglesi al posto di quelle canoniche. Adesso ho rimediato ma alcuni blog che hanno quella scritta scorrevole non hanno aggiornato il codice.
  3. Abbiamo sbagliato a linkare una nostra pagina - questo errore si può riparare facilmente andando a rieditare il post in cui è presente l'errore di collegamento

 

Ho lasciato per ultimo il caso che riguarda il titolo del post e che è quello che bisogna assolutamente evitare. Vi sarà certamente capitato di aver scritto un articolo che non vi piace, di esservi pentiti di averlo scritto o che vi è stato chiesto di eliminare per problemi di copyright. Nel caso in cui Google l'avesse già indicizzato, se lo cancellate, ve lo dà come errore di scansione. Un errore al quale non si può rimediare in alcun modo perché anche volendo non si può produrre un articolo con un permalink identico a un altro.

Questi errori di scansione, specie se sono ripetuti, possono influire negativamente sulla nostra "reputazione" nei confronti di Google.

L'alternativa all'eliminazione dell'articolo è semplicissima; si apre l'editor di Blogger, si cancella tutto il post, si inserisce un messaggio come "Questo articolo è stato rimosso" e si ripubblica l'articolo.



21 commenti :

  1. Ciao, ma c'è un altro sistema per trovare errori "404 nel blog"? Qualche sito? A me per caso mi è arrivata email di un sito inglese ed effettivamente ne ha individuati parecchi e ho subito cancellato i link che ormai erano inesistenti. Ma era una specie di versione di prova, poi si pagava. C'è ne sono altri cosi?

    RispondiElimina
  2. @arrgianf
    il sistema attraverso la Bacheca per Webmaster è gratuito e poi la bacheca serve comunque anche per la sitemap.
    Non vedo la necessità di trovare altri strumenti...

    RispondiElimina
  3. Semplicemente perchè quel sistema non mi aveva mai rilevato che c'erano un'infinità di link in disuso invece un email Spam che pubblicizzava sto coso qui me ne ha trovati migliaia ma era a pagamento così ne cercavo uno uguale ma gratuito. A proposito vedo che hai il Linkwithin, ma lo trovi utile? Nei miei non vanno perchè non metto quasi mai immagini e poi si ripetono sempre gli stessi post.

    RispondiElimina
  4. @arrgianf
    E' difficile valutare l'utilità di Link Within però è carino e se usi molte etichette e immagini non ti ripete gli stessi articoli

    RispondiElimina
  5. io purtroppo ho cancellato diverse pagine (a volte pensando di non esser beccato da google perchè cancellate subito).. ho però utilizzato lo strumento di rimozione Url tra gli strumenti webmasters.. il problema è che l'url in effetti è stato rimosso dalle ricerche (non compaiono più se cercate su google) però permane tra gli errori "non trovato".. non c'è più nulla da fare? più che altro più me ne rileva più mi sembra diminuire il numero di pagine indicizzate.. c'è altrimenti un modo di bloccarle via robot.txt o non cambierebbe nulla? grazie in anticipo, ciao!

    RispondiElimina
  6. @emanuele
    Il file robots.txt è uguale per tutti i blog e non può essere modificato. Se hai seguito quella procedura non ti devi preoccupare perché tra un po' spariranno tra i "non trovati".
    La diminuzione di pagine indicizzate è fisiologica e riguarda i post vecchi che non vengono più visitati da alcuno.
    Bisognerebbe sempre autolinkarci i post per favorire l'indicizzazione. Leggi qui sotto
    http://parsifal32.blogspot.com/2010/03/sitemap-google-indicizzare-post-elenco.html
    Ciao

    RispondiElimina
  7. Gentile, tempestivo e paziente come al solito.. che dire se non: grazie mille! :)

    RispondiElimina
  8. ciao parsival ... io vorrei creare una pagina di errore 404 personalizzata .. in pratica cambiare la pagina preimpostata da google .. con una mia personalizzata descritta a mio piacere .. renderla piu viva allegra e riindirizzare l'utenza a visionare il blog ... grazie .. sandro

    RispondiElimina
  9. @bul.sa
    con Blogger non si può fare. Se invece hai un tuo dominio e Wordpress ci sono dei plugin appositi

    RispondiElimina
  10. io ho un mio dominio ma e sotto blogger pertanto se ho capito giusto non posso farlo .. esatto ?? .. ti ringrazio ...
    sandro

    RispondiElimina
  11. @bul.sa
    creando dei sottodomini forse sarebbe possibile ma sarebbe un gran casino. Il gioco non vale la candela :-)

    RispondiElimina
  12. Grazie mille mi ero troppo spaventato

    RispondiElimina
  13. Salve Ernesto, Ho 2 blog http://www.muzica-nebuna.blogspot.com/ e http://www.autolanzillotta.blogspot.com/ e forse e piu di un anno che li ho creati, ma non sono indicizzati per niente sul motore di ricerca di google e nemmeno sui altri motori. :(
    Ho inserito dei meta<-tag , ho fatto tutto quello che serve, ma niente...lo so che ci vuole tempo, ma di tempo e passato parecchio. Invece sul dominio personalizzato , http://www.ilnuovogiornalino.com/ , e tutto ok. Non lo so se mi puoi aiutare. Grazie in anticipo...

    RispondiElimina
  14. @Ivan
    Del primo ho aperto due o tre articoli ma è mancante di contenuti. Sostanzialmente ci sono solo dei link. Forse è per questo che è poco indicizzato.
    Il secondo invece è perfetto per i contenuti, è strano che sia poco indicizzato. Prova a fare qualche post riepilogativo autolinkandoti gli articoli passati.
    Ciao

    RispondiElimina
  15. Ciao Parsifal, ma i link che risultano nella lista Non trovati negli strumenti dei webmaster, ovvero i post che ho eliminato, conviene eliminarli definitvamente usando lo strumento di Rimozione URL sempre dagli strumenti per i webmaster? Può essere più vantaggioso che lasciarli invece a "marcire" nella lista Non trovati? Grazie

    RispondiElimina
    Risposte
    1. @Vinnie
      Proprio un paio di giorni fa è cambiata la grafica riguardo ai link cui fai riferimento. Mi è sembrato di capire che comunque non influiscano sulla autorità del sito e si può andare su Correggi per toglierli. Magari in seguito potrei farci un post.

      Elimina
    2. Ma dici dopo averli selezionati di cliccare poi il pulsante Segnala come corretti?

      Elimina
    3. Segnala come corretti a parte, usando la Rimozione URL pensi che potrebbe fare più bene o più male all'autorità del sito?

      Elimina
    4. @Vinnie
      Dopo essere andati su su Errori di scansione > Non trovato e aver cliccato su una delle pagine non trovate si apre una finestra con tre schede. C'è comunque il seguente messaggio:
      "Google non ha potuto eseguire la scansione di questo URL perché rimanda a una pagina che non esiste. In genere gli errori 404 non influiscono negativamente sul rendimento del sito nella ricerca, ma puoi utilizzarli per migliorare l'esperienza degli utenti."
      Quindi sembra che non venga dato troppo peso. Poi ci sono gli errori che si possono correggere e quelli che non si possono correggere. Nella scheda "Con link da" si vede se si tratta di un link interno e che quindi si può correggere o di un link esterno o di un link a una pagina che abbiamo eliminato. Nel caso si possa correggere penso che segnarlo come tale sia positivo

      Elimina
    5. Per la maggior parte sono interni, corrispondenti ai post che ho eliminato. Prvo a segnalarli tutti come corretti e vedo un po' che succede. Ti ringrazio buona giornata

      Elimina

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy