Home / Video / From Idea to $650M Exit
From Idea to $650M Exit: Lessons in Building AI Startups
Perché vale la pena vederlo
Jake Heller racconta come Casetext ha portato CoCounsel a 650 milioni di dollari di exit con Thomson Reuters: scelta del problema, eval rigorose e pricing sul valore reale per i clienti.
Per chi è
Riassunto
Da idea legaltech a 650 milioni di dollari con GPT-4
Jake Heller ha fondato Casetext nel 2013 dopo un breve passaggio in un grande studio legale. Coder dall'infanzia, avvocato per scelta, ha visto da dentro quanto fosse arretrato il modo in cui gli avvocati lavoravano. Per dieci anni Casetext ha costruito tool legali basati su NLP e machine learning, raggiungendo circa 20 milioni di dollari di revenue e cento dipendenti. Nell'estate 2022, grazie all'expertise sviluppata sui large language model, ha ottenuto accesso pre-launch a GPT-4: ha fermato tutto il resto e in pochi mesi ha lanciato CoCounsel, il primo AI assistant per avvocati. Due anni dopo, Thomson Reuters ha acquisito Casetext per 650 milioni di dollari cash.
In questo talk a Y Combinator, Heller distilla quello che ha imparato in tre blocchi: come scegliere l'idea, come costruire il prodotto, come venderlo. Il filo conduttore è uno: nell'era AI le regole del gioco sono cambiate, ma molti founder continuano a giocare con le vecchie.
Come scegliere il problema giusto
Il vecchio mantra YC "make something people want" si è sempre scontrato con la difficoltà di capire cosa vogliano davvero. Heller propone una scorciatoia: guarda cosa la gente sta già pagando qualcun altro per fare. Customer support, paralegali, financial advisor, personal trainer, executive assistant. Quel denaro che oggi va a stipendi è il tuo vero mercato indirizzabile.
Da qui tre categorie di prodotto:
- Assistere un professionista nel suo lavoro (è quello che ha fatto CoCounsel con gli avvocati)
- Sostituire completamente il lavoro: invece di vendere software a uno studio legale, diventa tu uno studio legale AI-powered
- Fare cose prima impensabili: leggere e classificare 200 milioni di documenti con migliaia di istanze parallele di Gemini Flash, cosa che nessuno avrebbe mai chiesto a un team umano
Il punto economico è radicale. Un SaaS tradizionale vende seat a 20 dollari al mese. Un prodotto AI che fa il lavoro di un professionista può chiedere 5.000, 10.000, 20.000 dollari al mese. Il TAM si moltiplica per cento o mille rispetto al modello seat-based.
Heller respinge l'accusa di distopia. Sostituire o assistere certi lavori libera capacità per cose che oggi non immaginiamo, come l'elettricità ha reso obsoleto il mestiere di lamp lighter. E democratizza l'accesso: oltre l'85% delle persone a basso reddito non accede a servizi legali perché costano troppo. Un avvocato AI cento volte più veloce e dieci volte più economico cambia chi può dire di sì ai clienti.
Come costruire un prodotto AI che funziona davvero
Il primo passo non è scrivere codice. È avere domain expertise. Da Casetext il 30-40% del team era composto da avvocati, anche tra i coder. Se non hai expertise diretta, vai sotto copertura nel settore o trova un co-founder che ce l'abbia. Senza questo, costruisci alla cieca.
La domanda chiave: come farebbe il migliore professionista del settore questo task se avesse tempo e risorse illimitate, mille AI che lavorano in parallelo? Heller racconta come hanno costruito una versione di deep research per il legal due anni e mezzo prima che il termine entrasse nel mainstream. Hanno chiesto a un avvocato top come avrebbe affrontato una research question: chiarire la richiesta, fare un piano, lanciare decine di ricerche, leggere centinaia di risultati, scartare l'irrilevante, prendere note, sintetizzare in un saggio, verificare le citazioni. Otto step concreti.
Da step a codice
Ogni step diventa o un prompt o codice deterministico. Se puoi farlo senza prompt, fallo: i token sono lenti e costosi. Se il workflow è sempre uguale (sei step fissi ogni volta), costruisci una pipeline lineare con Python puro. Niente LangChain, niente over-engineering. Solo quando il flusso varia davvero in base al contesto entri nel territorio agentic, che è molto più difficile da garantire.
Eval: il vero lavoro
Qui la maggior parte delle startup AI fallisce. È facile costruire una demo al 60-70% di accuratezza, raccogliere capitale dai VC, firmare i primi pilot. È difficilissimo farla funzionare in produzione.
Le eval partono dalla stessa domanda: cosa significa "fatto bene" secondo l'esperto? Per ogni microtask costruisci test con risposta oggettivamente valutabile (true/false, score 0-7). Heller usa promptfoo come framework. Parti da una dozzina di test, arriva a 50, poi 100, e itera il prompt finché passa tutto. Tieni un hold-out set per evitare di overfittare le eval.
La sua regola pratica: due settimane di lavoro ossessivo su un singolo prompt. Dal 60% iniziale si passa al 97%, e il 3% rimanente è judgment call che farebbe sbagliare anche un umano. Pre-produzione: 100 test per prompt, 100 test per il task complessivo. Se passi 99 su 100, sei pronto per la beta.
In beta i clienti ti forniranno test reali (e spesso assurdi). Ogni nuovo modello che esce va testato contro le eval esistenti. Niente di statico: pull request sui prompt ogni giorno. Una singola parola può spostare un punto percentuale, e in finance, medicina o legal quel punto vale moltissimo.
Heller è categorico: chi fa solo questi due passaggi - capire come lavorano i professionisti e costruire eval rigorose - è già al 90% della strada per battere il 95% delle startup AI in giro.
Marketing, pricing e trust gap
Heller smonta una narrazione VC diffusa: che a partire da Series A/B il prodotto conti meno del go-to-market. La sua esperienza dice il contrario. Per dieci anni Casetext ha avuto un prodotto mediocre e venditori normali. Quando è uscito CoCounsel, i venditori sono diventati order taker, il word of mouth ha fatto il lavoro, la stampa è arrivata da sola. Il prodotto eccellente è la migliore strategia di marketing.
Detto questo, tre consigli operativi.
Pricing sul valore, non sul SaaS standard. Le aziende più interessanti oggi vendono un servizio completo (revisione contratti, accounting AI) a 500 dollari per contratto contro i 1.000 di uno studio legale. Step-up estremo dai 20 dollari/mese del SaaS classico. Però ascolta il cliente su come vuole pagare: Casetext pensava al per-usage, ma gli avvocati hanno chiesto 6.000 dollari per seat all'anno per avere budget prevedibile. Glielo hanno dato.
Trust gap. Le grandi aziende vogliono provare l'AI ma hanno paura. Funzionano i confronti head-to-head: tieni il tuo studio legale e usa il nostro tool in parallelo, poi confronta velocità, qualità, accuratezza. Pilot strutturati. Studi di validazione. Il tuo lavoro è costruire fiducia.
La vendita non finisce con il contratto. Heller, ora angel investor, vede troppe startup AI con "10 milioni di ARR" che a guardarli da vicino sono pilot non convertiti. Pilot recurring revenue, non ARR. Avverte di una mass extinction event in arrivo quando questi pilot non si trasformeranno in contratti reali. La soluzione: forward deployed engineer, onboarding curato, training, customer success. Il prodotto non è solo i pixel sullo schermo, è tutto l'ecosistema umano intorno.
La lezione di Casetext per founder italiani
Il messaggio di chiusura per chi sta scegliendo cosa costruire: vai sul problema più grande che pensi di poter risolvere con la tecnologia che hai. Heller riconosce che concentrarsi sul legal aveva senso per lui ma era anche un limite (gli avvocati spendono in software solo una piccola frazione del loro fatturato). Con CoCounsel ha capito la differenza tra fare cambiamenti incrementali a poche persone e cambiare davvero la vita a molti. Non torna indietro.
E sulla difensibilità contro il rischio "GPT wrapper": basta costruire davvero. Quando lo fai scopri quante integrazioni servono, quanti check, quanto fine-tuning sui prompt, quanti modelli da orchestrare. Due anni di lavoro vero non si replicano leggendo un blog post.
Key takeaways
- →Scegli un problema dove qualcuno paga già qualcun altro per farlo: il TAM diventa il salario aggregato dei professionisti, non il prezzo del seat SaaS
- →Decomponi il workflow come farebbe il miglior professionista del settore, poi trasforma ogni step in un prompt o in codice deterministico
- →Le eval sono il vero lavoro: punta a 97-99% di accuratezza su 100+ test per prompt prima di andare in beta
- →Prezza sul valore generato, non sul costo: Casetext ha venduto a 6.000 dollari per seat all'anno quando i clienti hanno chiesto budget prevedibile
- →Il pilot revenue non è ARR: molte startup AI rischiano una mass extinction event quando i pilot non convertono in contratti reali


