Qualche mese fa ho aperto LavoroInBreve, un sito che raccoglie guide pratiche, calcolatori e articoli su tutto quello che riguarda il lavoro in Italia - dalla NASpI al TFR, dal part-time alle ferie maturate.
L'idea era dare alle persone risposte chiare su argomenti che di solito sono sepolti in circolari INPS scritte in burocratese.
Il problema e' che mantenere i contenuti aggiornati e' un lavoro a se'. Le normative cambiano, l'INPS pubblica nuove circolari, il Ministero del Lavoro aggiorna le sue FAQ. Gestire tutto a mano non era sostenibile.
Il problema: fonti governative difficili da leggere
I siti istituzionali italiani - INPS, Ministero del Lavoro, ANPAL - pubblicano contenuti utili, ma spesso in formati non pensati per chi deve usarli in fretta. Una circolare INPS puo' essere lunga decine di pagine per comunicare tre concetti chiave.
L'obiettivo non era copiarli, ma trasformarli: prendere le informazioni rilevanti, rielaborarle in linguaggio semplice, e pubblicarle su LavoroInBreve con il giusto contesto.
La soluzione: un flusso n8n
Ho usato n8n come orchestratore. Il flusso funziona cosi':
- Trigger schedulato - parte ogni giorno e controlla una lista di feed RSS e URL monitorati dei siti istituzionali
- Fetch del contenuto - un nodo HTTP recupera la pagina
- Estrazione del testo - un nodo di parsing pulisce l'HTML e isola il testo utile
- Controllo duplicati - verifico su Payload CMS che quell'articolo non esista gia'
- Chiamata LLM - il testo pulito va a Claude tramite API con un prompt specifico per LavoroInBreve
- Pubblicazione - il risultato viene postato sull'API di Payload CMS come draft, pronto per revisione
Il prompt: la parte piu' importante
Il prompt al LLM e' quello che fa la differenza. Non chiedo di riassumere genericamente, ma di produrre un articolo strutturato secondo le convenzioni del sito: riassunto in linguaggio semplice, checklist dei punti chiave, contenuto nel formato corretto per Payload.
La versione attuale include esempi di output attesi (few-shot), vincoli espliciti sul tono (niente burocratese, niente marketing), e istruzioni su come gestire i link alle fonti originali. Senza esempi concreti, il modello inventa strutture a caso.
Cosa pubblico, e cosa no
Non pubblico tutto quello che il flusso trova. I contenuti arrivano come draft su Payload CMS, li revisiono, e se sono buoni li approvo.
Il flusso mi fa risparmiare la parte noiosa - recuperare la fonte, strutturare il contenuto, formattare il JSON - ma la decisione finale e' sempre mia.
Per gli articoli piu' tecnici, come quelli sul calcolo della NASpI o sul TFR, le formule di calcolo le ho scritte e testate a mano.
Cosa ho imparato
- La qualita' dell'estrazione del testo e' fondamentale. Se passa HTML sporco all'LLM, l'output fa schifo. Ho dedicato piu' tempo di quanto previsto al nodo di parsing.
- I siti governativi cambiano spesso struttura. Ho gia' aggiornato i selettori due volte in tre mesi.
- n8n e' ottimo per questo tipo di flussi. Il visual editor aiuta a capire cosa sta succedendo e l'integrazione con HTTP e' solida.
- Il few-shot nel prompt fa una differenza enorme. E' la cosa che piu' ha migliorato la qualita' dell'output.
Il risultato
Al momento il sito ha una quarantina di articoli e guide, piu' una decina di calcolatori interattivi su argomenti come stipendio orario, ferie maturate e costo aziendale del dipendente.
Il flusso n8n mi permette di mantenere i contenuti aggiornati senza inseguire ogni pubblicazione istituzionale a mano - e mi lascia il tempo di concentrarmi sulle parti che richiedono davvero attenzione umana.
Se stai costruendo qualcosa di simile, sono su gferruzzi.it o trovami su LinkedIn.