Questo sito è giovane, con una crescita costante di contenuti e un piano editoriale ben definito. Le impressions su Google Search Console stavano aumentando, e tutto sembrava andare per il verso giusto. Poi, allâimprovviso, un crollo.
Allâinizio ho pensato: sarĂ una fluttuazione normale. Poi ho deciso di non ignorare il segnale. Ho aperto Search Console e fatto un controllo accurato. Ed è lĂŹ che ho notato una cosa preoccupante: Google stava iniziando a non indicizzare piĂš alcune pagine, nonostante fossero giĂ presenti e non ci fossero errori evidenti (niente 404, niente canonical sbagliati, nessun errore classico).

Mi sono chiesto: perchĂŠ?
Non basta guardare i numeri crescere con soddisfazione: a volte un calo è un segnale dâallarme. Imparare a leggere i dati è parte integrante del lavoro di chi crea contenuti. Search Console non serve solo a âcontrollare se va tutto beneâ, ma può diventare lo strumento piĂš potente per diagnosticare problemi invisibili.
Indice dei contenuti
L’analisi preliminare
Avevo curato titoli, struttura, leggibilitĂ , e soprattutto avevo investito molto nel tono personale. Per questo mi aspettavo una buona ricezione anche da parte dellâalgoritmo. Proprio per questo il calo era ancora piĂš misterioso: il contenuto non era da scartare.
Il sospetto dei contenuti duplicati

Il sito è performante, i contenuti originali, in molti casi scritti da esperienze personali. Per curiosità faccio una scansione con Siteliner e lÏ trovo qualcosa di assurdo: il sito risulta avere un tasso di contenuti duplicati del 35%. Approfondisco le cause e scopro un articolo con oltre 13.000 parole e 57% di contenuto duplicato.
Impossibile.

Io non scrivo articoli cosĂŹ lunghi, se ho molto da dire tendo a spezzare in contenuti piĂš brevi, e soprattutto, non posso aver copiato la metĂ del sito. Clicco sul link âincriminatoâ e la sorpresa: non è un vero articolo, ma un file .txt servito da WordPress per errore. In pratica, WordPress stava interpretando un URL che conteneva llms-txt come se fosse llms.txt, e mostrava il file, generato per facilitare la comprensione del sito agli agenti AI, contenente gli incipit di tutti gli articoli del sito.
Questo significava che ogni singolo articolo del sito risultava parzialmente duplicato, perchÊ tutti iniziavano con lo stesso paragrafo⌠già presente in quel file.
La fallibilitĂ dei permalink
WordPress, come molti CMS, applica una âriscritturaâ degli URL con logica piuttosto permissiva. Quando si usa un URL come llms-txt, può accadere che venga interpretato come un file .txt se non trova una corrispondenza precisa nella struttura dei permalink. In pratica, il trattino e il punto vengono considerati equivalenti in certi contesti. Questo spiega perchĂŠ veniva servito llms.txt al posto del vero articolo.
Le contromisure: niente panico
Ho immediatamente:
1. Bloccato llms.txt nel file robots.txt:
Disallow: /llms.txt2. Eliminato lâURL dalla Search Console.
3. Corretto il permalink dellâarticolo, cambiando llms-txt-cosa-come-perche-funziona in llmstxt-cosa-come-perche-funziona per evitare ambiguitĂ .
4. Testato tutto: ora il link funziona e il contenuto è indicizzabile correttamente.
Morale: fidarsi è bene, controllare Search Console è meglio
Questo piccolo incidente mi ha insegnato che problemi di indicizzazione possono avere cause subdole, come unâerrata interpretazione di un permalink. Senza Search Console e una scansione esterna, non lâavrei mai scoperto. Quindi sĂŹ: anche se tutto sembra andare bene, ogni tanto è fondamentale fermarsi e analizzare davvero cosa sta succedendo nei dati.
Condividi lâesperienza
Ti sei mai imbattuto in problemi con file .txt, URL interpretati male o contenuti non indicizzati in modo inspiegabile? Ogni caso può insegnare qualcosa a chi crea contenuti online. Racconta la tua esperienza o segnala un argomento che ti piacerebbe vedere approfondito nella nostra rubrica:
