Feed di surface discovery (XML/JSON) per LLM

TL;DR: un surface discovery feed è un indice pulito e strutturato (XML/JSON) che dice ai crawler e ai motori AI cosa è nuovo, dove si trova e quando è stato aggiornato. Implementiamo Sitemaps XML (per sezione), JSON Feed (ultimi contenuti) e un DataFeed JSON-LD (Schema.org) + opzionali IndexNow e WebSub. Risultato: scoperta più rapida, meno errori, più citazioni nelle risposte AI.


Perché serve a un imprenditore (senza giri di parole)

  • Velocità di scoperta: i tuoi nuovi contenuti vengono visti prima (più chance di entrare nelle risposte AI). 
  • Controllo: fornisci un elenco “ufficiale” e coerente (meno pagine dimenticate, meno vecchie versioni in giro). 
  • Citabilità: gli assistenti preferiscono fonti stabili e ben descritte (date, autore, formato, permalink). 

Architettura consigliata (in 6 pezzi)

  1. Sitemap index → punta alle sitemap di sezione (blog, FAQ, how-to, dataset). 
  2. Sitemaps di sezione (XML) → URL canonicizzati, lastmod reali. 
  3. JSON Feed → gli “ultimi 50–100 contenuti” pronti per integrazioni. 
  4. DataFeed JSON-LD → elenco strutturato degli item chiave (Schema.org). 
  5. robots.txt → pubblicizza tutte le sitemap. 
  6. (Opz.) PushIndexNow (ping su publish/update) e WebSub per RSS/Atom. 

Esempi pronti (copia & adatta)

1) sitemap_index.xml

xml

CopiaModifica

<?xml version=”1.0″ encoding=”UTF-8″?>

<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

  <sitemap>

    <loc>https://www.tuosito.it/sitemaps/sitemap-article.xml</loc>

    <lastmod>2025-08-10</lastmod>

  </sitemap>

  <sitemap>

    <loc>https://www.tuosito.it/sitemaps/sitemap-faq.xml</loc>

    <lastmod>2025-08-08</lastmod>

  </sitemap>

  <sitemap>

    <loc>https://www.tuosito.it/sitemaps/sitemap-dataset.xml</loc>

    <lastmod>2025-08-05</lastmod>

  </sitemap>

</sitemapindex>

 

2) Sitemap di sezione (articoli)

xml

CopiaModifica

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

  <url>

    <loc>https://www.tuosito.it/blog/sov-generativa/</loc>

    <lastmod>2025-08-08</lastmod>

    <changefreq>weekly</changefreq>

  </url>

  <url>

    <loc>https://www.tuosito.it/blog/blueprint-schema-org-geo/</loc>

    <lastmod>2025-08-10</lastmod>

  </url>

</urlset>

 

3) JSON Feed (ultimi contenuti)

json

CopiaModifica

{

  “version”: “https://jsonfeed.org/version/1.1”,

  “title”: “Tuosito – Ultimi contenuti”,

  “home_page_url”: “https://www.tuosito.it/”,

  “feed_url”: “https://www.tuosito.it/feed.json”,

  “items”: [

    {

      “id”: “https://www.tuosito.it/blog/sov-generativa/”,

      “url”: “https://www.tuosito.it/blog/sov-generativa/”,

      “title”: “SOV generativa: cos’è e come si misura”,

      “date_published”: “2025-08-08T10:00:00+02:00”,

      “date_modified”: “2025-08-08T10:00:00+02:00”

    },

    {

      “id”: “https://www.tuosito.it/blog/blueprint-schema-org-geo/”,

      “url”: “https://www.tuosito.it/blog/blueprint-schema-org-geo/”,

      “title”: “Blueprint Schema.org per GEO”,

      “date_published”: “2025-08-10T09:00:00+02:00”

    }

  ]

}

 

4) DataFeed (Schema.org) in JSON-LD (da inserire nella pagina “Risorse” o “Blog”)

html

CopiaModifica

<script type=”application/ld+json”>

{

 “@context”: “https://schema.org”,

 “@type”: “DataFeed”,

 “@id”: “https://www.tuosito.it/risorse/#datafeed”,

 “name”: “Tuosito – Feed contenuti per LLM”,

 “dataFeedElement”: [

   {

     “@type”: “DataFeedItem”,

     “dateModified”: “2025-08-10”,

     “item”: {

       “@type”: “Article”,

       “@id”: “https://www.tuosito.it/blog/blueprint-schema-org-geo/”

     }

   },

   {

     “@type”: “DataFeedItem”,

     “dateModified”: “2025-08-08”,

     “item”: {

       “@type”: “Article”,

       “@id”: “https://www.tuosito.it/blog/sov-generativa/”

     }

   }

 ]

}

</script>

 

5) robots.txt

makefile

CopiaModifica

User-agent: *

Allow: /

 

Sitemap: https://www.tuosito.it/sitemap_index.xml

Sitemap: https://www.tuosito.it/sitemaps/sitemap-article.xml

Sitemap: https://www.tuosito.it/sitemaps/sitemap-faq.xml

Sitemap: https://www.tuosito.it/sitemaps/sitemap-dataset.xml

 

6) (Opz.) IndexNow – ping alla pubblicazione

bash

CopiaModifica

curl -X POST ‘https://api.indexnow.org/indexnow’ \

  -H ‘Content-Type: application/json; charset=utf-8’ \

  -d ‘{

    “host”: “www.tuosito.it”,

    “key”: “LA_TUA_CHIAVE_INDEXNOW”,

    “keyLocation”: “https://www.tuosito.it/LA_TUA_CHIAVE_INDEXNOW.txt”,

    “urlList”: [

      “https://www.tuosito.it/blog/sov-generativa/”,

      “https://www.tuosito.it/blog/blueprint-schema-org-geo/”

    ]

  }’

 

Tip: inserisci anche <link rel=”alternate” type=”application/json” href=”/feed.json”> nell’<head> di homepage e pagine hub; facilita i consumer automatici.


Best practice (Business & Engineer)

Business

  • Parti dalle sitemap di sezione: costo basso, impatto alto. 
  • Tieni un JSON Feed con gli ultimi contenuti (semplice da integrare in tool/BI). 

Engineer

  • Compila lastmod reali e invia Last-Modified/ETag a livello HTTP. 
  • Evita URL con UTM nei feed; usa canonici e 200 OK (niente noindex). 
  • Spezza le sitemap oltre 50.000 URL o 50 MB (limite del protocollo). 
  • Valida con Rich Results Test (per DataFeed) e controlla i report Sitemap in Search Console. 

KPI per capire se funziona

  • Discovery latency: tempo tra publish e primo hit crawler (dai log). 
  • Coverage: % URL chiave presenti in sitemap/feed e indicizzati correttamente. 
  • Freshness: share di item aggiornati (ultimi 30 giorni) nei feed. 
  • SOV generativa: crescita citazioni/menzioni nelle risposte AI su query tracciate. 

Errori da evitare

  1. Sitemap unica “infinita”: usa un index + sitemap per sezione. 
  2. Date fasulle in lastmod (perdi credibilità). 
  3. Feed non linkati o nascosti (aggiungi link nel head e nel footer). 
  4. Dataset/HowTo/FAQ senza contenuto visibile coerente al markup. 


Mini-roadmap (14 giorni)

  • Giorni 1–3: inventario URL citabili (guide, FAQ, HowTo, dataset, case study). 
  • Giorni 4–7: genera sitemap per sezione + sitemap_index.xml; crea /feed.json. 
  • Giorni 8–10: DataFeed JSON-LD in pagina hub; aggiorna robots.txt; deploy. 
  • Giorni 11–14: abilita (opz.) IndexNow/WebSub; valida e misura discovery latency. 

Fonti autorevoli

 

Articoli correlati
Posizionare un sito su Atlas
GEO
fabio

Posizionare un sito su Atlas

Introduzione: L’avvento di Atlas, il nuovo browser di OpenAI con ChatGPT integrato, segna un cambio di paradigma nella ricerca online. Non si tratta più di

Leggi Tutto »