Offerte Lavori Chi sono EN · IT 1 slot Giugno Prenota una call

Analisi costi

Costo build agente AI.
La demo è facile. La produzione no.

Gli agenti AI sono facili da demo e difficili da mettere in produzione. Ecco cosa serve davvero (e quanto costa) la versione production-ready, contro il prototipo prompt-and-pray che si rompe appena un utente vero lo tocca.

01

Quanto costa il build, una tantum?

Un build di agente AI in produzione è tipicamente un engagement di 3-4 settimane. €25.000 coprono: selezione del provider (Claude / GPT / open-source), scoping dello use case, definizioni custom dei tool, integrazioni API, vector DB o RAG quando serve, una suite di eval per regressioni del comportamento, difese contro prompt injection, validazione output, e un deploy in produzione con logging e trace.

Salta una qualsiasi di queste cose e hai un prototipo, non un agente in produzione. Saltare gli eval in particolare è la ragione più comune per cui gli agenti degradano silenziosamente dopo il lancio.

02

Quanto costa farlo girare ogni mese?

  • · Token del provider: dipende dal traffico e dal modello. Un piccolo agente interno può girare sotto i $50/mese. Un agente customer-facing a scala sale nelle migliaia.
  • · Vector DB (se usato): $20-200/mese a seconda di storage e volume di query.
  • · Compute (Lambda o container): $10-100/mese a scala piccola-media.
  • · Observability e rerun degli eval: $20-100/mese per uno stack di observability LLM-traceable.

03

Dove sprecano soldi la maggior parte degli agenti?

Tre posti: modelli sovradimensionati per step semplici (usa un modello piccolo per il routing, uno grande solo per lo step difficile), nessun caching delle tool call ripetute, e nessun guardrail di rate-limit (un loop sfuggito può bruciare una bolletta a quattro cifre in un'ora). Tutti e tre sono configurazione, non architettura, e tutti e tre dovrebbero essere in piedi prima del lancio.

Hai già un prototipo?

Non sei ancora pronto a prenotare una chiamata? Ricevi il modello di fragilità a 6 assi applicato al tuo URL, in un Loom di 5 minuti.