
Come creare un agente AI per la tua azienda: guida pratica per PMI con Claude, n8n e Supabase
La domanda che ricevo più spesso da imprenditori e responsabili IT di PMI italiane nel 2026 è sempre la stessa, formulata in modi leggermente diversi: come creare un agente AI per la nostra azienda che faccia davvero qualcosa di utile, senza limitarsi a rispondere a due domande frequenti. È una domanda legittima. Nel giro di diciotto mesi il vocabolario è cambiato: si parlava di chatbot, ora si parla di agenti. Ma la differenza tra i due non è terminologica, è architetturale. Un chatbot risponde a un messaggio. Un agente osserva un contesto, decide cosa fare, esegue azioni concrete sui tuoi sistemi (CRM, gestionale, calendario, email, database) e rende conto del risultato. Questa guida è pensata per portarti dal primo caso d'uso al deploy in produzione, con lo stesso stack che uso nei progetti reali dei miei clienti: Claude come cervello, n8n come sistema nervoso, Supabase come memoria persistente.
Prima ancora di aprire un editor o creare un account, il passo fondamentale è la scelta del caso d'uso. È qui che la maggior parte dei progetti di agenti AI aziendali fallisce: si sceglie un obiettivo troppo generico ("un agente che gestisce il customer care") oppure troppo ambizioso ("un agente che sostituisce il commerciale"). L'approccio che funziona è opposto: parti da un processo specifico, ripetitivo, misurabile e ad alto volume. Due esempi che ho visto funzionare in aziende con meno di cinquanta dipendenti sono la qualificazione dei lead in entrata e la gestione di primo livello dei ticket di customer care. Nel primo caso, l'agente riceve un lead da form, sito o WhatsApp, pone tre-cinque domande di qualifica secondo il metodo BANT o simili, aggiorna il CRM con score e note, e assegna il lead al commerciale giusto o lo scarta motivando. Nel secondo caso, l'agente legge il ticket, consulta la knowledge base interna, propone una risposta al cliente e, se la richiesta rientra in una lista di casi predefiniti, la risolve autonomamente aggiornando l'ordine, generando un reso o modificando un appuntamento. In entrambi i casi ci sono tre elementi chiave: input strutturato, azioni definite, criterio chiaro di successo. Sono le tre condizioni minime perché un agente abbia senso.
Il secondo passo è la scelta del modello linguistico, ovvero il cervello dell'agente. Nel 2026 la scelta pragmatica per il mercato italiano è Claude di Anthropic, per tre ragioni concrete. La prima è la qualità del ragionamento in italiano: Claude Sonnet 5 e Claude Opus 4.8 gestiscono l'italiano formale e le sfumature del linguaggio B2B con un'accuratezza che i modelli concorrenti raggiungono solo parzialmente. La seconda è la disponibilità di Model Context Protocol (MCP), lo standard aperto che permette all'agente di connettersi ai tuoi tool aziendali (Google Workspace, Slack, database, CRM) tramite un protocollo unico invece di dover scrivere integrazioni custom per ogni servizio. La terza è la struttura di pricing prevedibile: per la qualificazione lead di una PMI che riceve tra cento e cinquecento contatti al mese, il costo mensile di Claude si colloca tipicamente tra i venti e i cento euro, cifre compatibili con qualsiasi budget aziendale. Modelli alternativi come GPT-5.5 o modelli open source ospitati su GPU proprie (GLM 5.2, Kimi K2.7) sono opzioni valide in scenari specifici (privacy stringente, volumi molto elevati, esigenze di fine-tuning), ma per il primo agente aziendale Claude riduce il time-to-value in modo significativo.
Il terzo passo è l'orchestrazione, cioè la scelta di come l'agente riceve gli input, esegue le azioni e produce gli output. Qui la mia raccomandazione per una PMI è n8n, la piattaforma di workflow automation open source che nel 2026 è diventata lo standard de facto per gli agenti aziendali non enterprise. Le ragioni sono pratiche: n8n si autoinstalla in trenta minuti su un piccolo server (bastano cinque euro al mese di un VPS oppure Docker sul server aziendale esistente), ha già connettori pronti per oltre quattrocento servizi (Gmail, Outlook, HubSpot, Salesforce, Shopify, WooCommerce, WhatsApp Business, Telegram e i principali database), integra nativamente le API dei modelli AI con un nodo Claude ufficiale, permette di visualizzare i flussi come diagrammi comprensibili anche da chi non scrive codice e mantiene tutto il codice e i dati sui tuoi server. Alternative come Make.com o Zapier hanno una curva di apprendimento più bassa ma diventano rapidamente costose quando i volumi crescono e non permettono il self-hosting, che per molte PMI italiane è un requisito di compliance implicito o esplicito.
Il quarto passo è la memoria, cioè il sistema che permette all'agente di ricordare le conversazioni precedenti, i dati dei clienti, i risultati delle azioni passate. Per questa componente la scelta pragmatica è Supabase, la piattaforma open source basata su PostgreSQL che offre in un unico pacchetto database relazionale, ricerca vettoriale (necessaria per la knowledge base semantica dell'agente), autenticazione, storage di file e API REST autogenerata. In termini concreti: creerai una tabella per le conversazioni, una per i clienti, una per gli embedding della tua knowledge base aziendale (manuali, FAQ, listini, procedure) e una per il log strutturato delle azioni dell'agente. Il vantaggio di Supabase rispetto a soluzioni SaaS chiuse è duplice: il costo è marginale sotto i cinquecento utenti attivi (il piano gratuito basta per la maggior parte dei progetti pilota) e la portabilità è totale, perché sotto il cofano è PostgreSQL standard e puoi migrare i dati altrove in qualunque momento.
Con questi tre pezzi (Claude, n8n, Supabase) l'architettura tipica del tuo primo agente prende forma in modo lineare. Il trigger è un evento nel sistema aziendale: una nuova submission di form sul sito, un messaggio WhatsApp, una email in una casella dedicata, un ticket aperto sul portale di supporto. n8n riceve l'evento, prepara il contesto interrogando Supabase per estrarre lo storico del cliente e i documenti rilevanti della knowledge base tramite ricerca vettoriale, e passa tutto a Claude con un system prompt che descrive ruolo, tono, azioni permesse e criteri di escalation umana. Claude ragiona sul contesto, decide se rispondere direttamente, se chiamare uno degli strumenti disponibili (aggiornare il CRM, creare un evento in calendario, inviare una notifica interna, aprire un ticket a un tecnico) o se richiedere intervento umano. n8n esegue le azioni decise, scrive tutto nel log di Supabase e chiude il ciclo notificando il risultato all'utente e ai team interni. L'intero flusso, per un caso d'uso semplice come la qualificazione lead, si costruisce concretamente in una-due giornate di lavoro di uno sviluppatore con esperienza sullo stack.
Il quinto passo, quello che distingue un prototipo giocattolo da un agente pronto per la produzione, è il design dei guardrail. Un agente in produzione deve avere confini chiari e invalicabili: cosa può fare autonomamente, cosa richiede approvazione umana, cosa non deve mai fare in nessun caso. Nella pratica questo si traduce in tre livelli. Livello uno, azioni sicure a bassa reversibilità: rispondere al cliente con informazioni presenti nella knowledge base, aggiungere note al CRM, inviare notifiche interne. L'agente le esegue senza chiedere permesso. Livello due, azioni con impatto operativo: modificare un ordine, generare un rimborso sotto una certa soglia, prenotare un appuntamento nel calendario di un collega. Qui l'agente prepara la proposta ma richiede conferma umana o applica limiti automatici (rimborsi solo sotto cinquanta euro, appuntamenti solo in slot già marcati come disponibili). Livello tre, azioni proibite: cancellare dati, chiudere account, inviare comunicazioni commerciali non richieste, promettere sconti non autorizzati. Queste vanno bloccate nel prompt di sistema e verificate tramite validazione esplicita nel workflow n8n prima dell'esecuzione. Il costo di un errore in questi tre ambiti è molto diverso, e l'agente deve trattarli in modo diverso.
Il sesto passo è la fase pilota controllata, che dura tipicamente da due a quattro settimane. Durante il pilota l'agente lavora in shadow mode oppure in modalità supervisionata: ogni sua risposta e ogni sua azione vengono riviste da un operatore umano prima di essere realmente inviate al cliente o scritte nei sistemi. Questo permette due cose fondamentali. La prima è calibrare il prompt di sistema e la knowledge base: nei primi giorni scoprirai casi che non avevi previsto, formulazioni che confondono l'agente, informazioni mancanti nella documentazione interna. Ogni correzione va tracciata in Supabase e riutilizzata per migliorare il sistema. La seconda è misurare le metriche di business che giustificano l'investimento: percentuale di lead qualificati correttamente, tempo medio di risposta al cliente, tasso di risoluzione autonoma dei ticket, ore-uomo risparmiate rispetto al processo manuale. Senza queste metriche l'agente resta un giocattolo tecnologico. Con queste metriche diventa un asset aziendale con ROI dimostrabile, e la conversazione con la direzione cambia radicalmente.
Il settimo passo, spesso trascurato, è la conformità normativa nel contesto italiano ed europeo. Un agente AI che gestisce dati di clienti o dipendenti ricade sotto GDPR e, dal 2 agosto 2026, sotto le disposizioni operative dell'AI Act europeo per i sistemi ad alto rischio. Tre azioni concrete da fare fin dal primo giorno di sviluppo: informare esplicitamente il cliente che sta interagendo con un sistema AI (obbligo di trasparenza dell'articolo 50 dell'AI Act), garantire che i dati personali processati dall'agente restino su infrastrutture in UE (Supabase offre region europea, n8n self-hosted risolve alla radice, Claude via Anthropic è disponibile con residenza dati EU sul piano Enterprise), e tenere un registro dettagliato di tutte le decisioni automatizzate dell'agente per almeno sei mesi (il log strutturato in Supabase menzionato prima serve esattamente a questo). Ignorare questi aspetti nella fase di prototipazione significa doverli riprogettare dopo, quando è molto più costoso e rischioso.
L'ottavo e ultimo passo è il deploy in produzione con monitoraggio continuo. n8n va spostato da esecuzione locale o VPS di sviluppo a un ambiente di produzione con backup automatici del database Postgres e dei workflow, alerting su errori tramite email o Slack, e un piano di rollback documentato in caso di malfunzionamenti. Supabase in produzione richiede l'attivazione delle row-level security policies su ogni tabella accessibile dall'agente, in modo che anche in caso di prompt injection il modello non possa esfiltrare dati che non gli competono. Sul fronte modello, Claude andrà monitorato per due metriche operative: tasso di refusal (le volte in cui rifiuta un'azione legittima per eccesso di prudenza) e tasso di hallucination (le volte in cui inventa informazioni non presenti nel contesto). Entrambe le metriche si misurano tramite campionamento umano su un cinque-dieci per cento delle conversazioni e si migliorano iterando su system prompt e knowledge base. Da questo momento il ciclo di vita dell'agente è simile a quello di qualsiasi altro sistema software critico: rilasci regolari, versionamento delle configurazioni, revisione periodica dei costi API, aggiornamento del modello Claude quando escono nuove versioni con miglioramenti significativi.
Se hai letto fin qui, hai un quadro completo di come si costruisce concretamente un agente AI per una PMI italiana nel 2026. La domanda che vale la pena farsi ora non è più teorica: quale processo aziendale specifico, ripetitivo e misurabile ti costa più tempo ogni settimana e potrebbe essere il candidato ideale per il tuo primo pilota? Se hai una risposta chiara e ti serve un partner tecnico per costruire il prototipo, testarlo con i tuoi dati reali e portarlo in produzione con le garanzie di sicurezza e conformità che la tua azienda richiede, la pagina di contatto di questo sito è il punto di partenza. Il vantaggio competitivo del 2026 per le PMI italiane non è avere l'AI più potente, è essere le prime del proprio settore a integrarla nei processi quotidiani in modo utile, controllato e misurabile.


