TL;DR: un surface discovery feed è un indice pulito e strutturato (XML/JSON) che dice ai crawler e ai motori AI cosa è nuovo, dove si trova e quando è stato aggiornato. Implementiamo Sitemaps XML (per sezione), JSON Feed (ultimi contenuti) e un DataFeed JSON-LD (Schema.org) + opzionali IndexNow e WebSub. Risultato: scoperta più rapida, meno errori, più citazioni nelle risposte AI.
Perché serve a un imprenditore (senza giri di parole)
- Velocità di scoperta: i tuoi nuovi contenuti vengono visti prima (più chance di entrare nelle risposte AI).
- Controllo: fornisci un elenco “ufficiale” e coerente (meno pagine dimenticate, meno vecchie versioni in giro).
- Citabilità: gli assistenti preferiscono fonti stabili e ben descritte (date, autore, formato, permalink).
Architettura consigliata (in 6 pezzi)
- Sitemap index → punta alle sitemap di sezione (blog, FAQ, how-to, dataset).
- Sitemaps di sezione (XML) → URL canonicizzati, lastmod reali.
- JSON Feed → gli “ultimi 50–100 contenuti” pronti per integrazioni.
- DataFeed JSON-LD → elenco strutturato degli item chiave (Schema.org).
- robots.txt → pubblicizza tutte le sitemap.
- (Opz.) Push → IndexNow (ping su publish/update) e WebSub per RSS/Atom.
Esempi pronti (copia & adatta)
1) sitemap_index.xml
xml
CopiaModifica
<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<sitemap>
<loc>https://www.tuosito.it/sitemaps/sitemap-article.xml</loc>
<lastmod>2025-08-10</lastmod>
</sitemap>
<sitemap>
<loc>https://www.tuosito.it/sitemaps/sitemap-faq.xml</loc>
<lastmod>2025-08-08</lastmod>
</sitemap>
<sitemap>
<loc>https://www.tuosito.it/sitemaps/sitemap-dataset.xml</loc>
<lastmod>2025-08-05</lastmod>
</sitemap>
</sitemapindex>
2) Sitemap di sezione (articoli)
xml
CopiaModifica
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://www.tuosito.it/blog/sov-generativa/</loc>
<lastmod>2025-08-08</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>https://www.tuosito.it/blog/blueprint-schema-org-geo/</loc>
<lastmod>2025-08-10</lastmod>
</url>
</urlset>
3) JSON Feed (ultimi contenuti)
json
CopiaModifica
{
“version”: “https://jsonfeed.org/version/1.1”,
“title”: “Tuosito – Ultimi contenuti”,
“home_page_url”: “https://www.tuosito.it/”,
“feed_url”: “https://www.tuosito.it/feed.json”,
“items”: [
{
“id”: “https://www.tuosito.it/blog/sov-generativa/”,
“url”: “https://www.tuosito.it/blog/sov-generativa/”,
“title”: “SOV generativa: cos’è e come si misura”,
“date_published”: “2025-08-08T10:00:00+02:00”,
“date_modified”: “2025-08-08T10:00:00+02:00”
},
{
“id”: “https://www.tuosito.it/blog/blueprint-schema-org-geo/”,
“url”: “https://www.tuosito.it/blog/blueprint-schema-org-geo/”,
“title”: “Blueprint Schema.org per GEO”,
“date_published”: “2025-08-10T09:00:00+02:00”
}
]
}
4) DataFeed (Schema.org) in JSON-LD (da inserire nella pagina “Risorse” o “Blog”)
html
CopiaModifica
<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “DataFeed”,
“@id”: “https://www.tuosito.it/risorse/#datafeed”,
“name”: “Tuosito – Feed contenuti per LLM”,
“dataFeedElement”: [
{
“@type”: “DataFeedItem”,
“dateModified”: “2025-08-10”,
“item”: {
“@type”: “Article”,
“@id”: “https://www.tuosito.it/blog/blueprint-schema-org-geo/”
}
},
{
“@type”: “DataFeedItem”,
“dateModified”: “2025-08-08”,
“item”: {
“@type”: “Article”,
“@id”: “https://www.tuosito.it/blog/sov-generativa/”
}
}
]
}
</script>
5) robots.txt
makefile
CopiaModifica
User-agent: *
Allow: /
Sitemap: https://www.tuosito.it/sitemap_index.xml
Sitemap: https://www.tuosito.it/sitemaps/sitemap-article.xml
Sitemap: https://www.tuosito.it/sitemaps/sitemap-faq.xml
Sitemap: https://www.tuosito.it/sitemaps/sitemap-dataset.xml
6) (Opz.) IndexNow – ping alla pubblicazione
bash
CopiaModifica
curl -X POST ‘https://api.indexnow.org/indexnow’ \
-H ‘Content-Type: application/json; charset=utf-8’ \
-d ‘{
“host”: “www.tuosito.it”,
“key”: “LA_TUA_CHIAVE_INDEXNOW”,
“keyLocation”: “https://www.tuosito.it/LA_TUA_CHIAVE_INDEXNOW.txt”,
“urlList”: [
“https://www.tuosito.it/blog/sov-generativa/”,
“https://www.tuosito.it/blog/blueprint-schema-org-geo/”
]
}’
Tip: inserisci anche <link rel=”alternate” type=”application/json” href=”/feed.json”> nell’<head> di homepage e pagine hub; facilita i consumer automatici.
Best practice (Business & Engineer)
Business
- Parti dalle sitemap di sezione: costo basso, impatto alto.
- Tieni un JSON Feed con gli ultimi contenuti (semplice da integrare in tool/BI).
Engineer
- Compila lastmod reali e invia Last-Modified/ETag a livello HTTP.
- Evita URL con UTM nei feed; usa canonici e 200 OK (niente noindex).
- Spezza le sitemap oltre 50.000 URL o 50 MB (limite del protocollo).
- Valida con Rich Results Test (per DataFeed) e controlla i report Sitemap in Search Console.
KPI per capire se funziona
- Discovery latency: tempo tra publish e primo hit crawler (dai log).
- Coverage: % URL chiave presenti in sitemap/feed e indicizzati correttamente.
- Freshness: share di item aggiornati (ultimi 30 giorni) nei feed.
- SOV generativa: crescita citazioni/menzioni nelle risposte AI su query tracciate.
Errori da evitare
- Sitemap unica “infinita”: usa un index + sitemap per sezione.
- Date fasulle in lastmod (perdi credibilità).
- Feed non linkati o nascosti (aggiungi link nel head e nel footer).
- Dataset/HowTo/FAQ senza contenuto visibile coerente al markup.
Mini-roadmap (14 giorni)
- Giorni 1–3: inventario URL citabili (guide, FAQ, HowTo, dataset, case study).
- Giorni 4–7: genera sitemap per sezione + sitemap_index.xml; crea /feed.json.
- Giorni 8–10: DataFeed JSON-LD in pagina hub; aggiorna robots.txt; deploy.
- Giorni 11–14: abilita (opz.) IndexNow/WebSub; valida e misura discovery latency.
Fonti autorevoli
- Sitemaps XML – protocollo: https://www.sitemaps.org/protocol.html
- Schema.org – DataFeed: https://schema.org/DataFeed
- W3C – WebSub: https://www.w3.org/TR/websub/






