ARTICOLO · 1 MAGGIO 2026 · CATEGORIA CAPITALI

Chi sopravviverà?

Il crollo dei prezzi dei token AI: dati, tendenze e la domanda da un milione di dollari.

DI GIULIO BASSI · DOTTORE COMMERCIALISTA, ESPERTO CONTROLLO DI GESTIONE

FATTO verificabile · INTERPRETAZIONE opinione · LIMITE dato non disponibile, stima o esternalità non contabilizzata.

"Una capacità che costava $20 per milione di token nel 2022 oggi ne costa $0,40. Una riduzione del 98% in meno di tre anni."Stanford AI Index 2025

1. Era novembre 2022

ChatGPT appare online. In cinque giorni raggiunge un milione di utenti. In due mesi, cento milioni. Nessun prodotto tecnologico nella storia aveva scalato così velocemente.

Ma sotto quella superficie conversazionale stava accadendo qualcosa di economicamente radicale: si stava costruendo un mercato dal nulla, con prezzi fissati per la prima volta, senza precedenti di riferimento e con una competizione che nessuno aveva ancora visto arrivare.

Quello che è successo dopo ha del clamoroso.

2. I prezzi: una caduta libera documentata

La tabella dei fatti

FATTO I dati che seguono sono tratti da fonti primarie verificabili: Stanford AI Index 2025, TokenCost.app, IntuitionLabs, documentazione ufficiale dei provider.

Data	Modello	Input ($/M token)	Output ($/M token)	Note
Nov 2022	GPT-3.5 equivalente	$20,00	$20,00	Baseline di mercato
Mar 2023	GPT-4 (8K context)	$30,00	$60,00	Il massimo storico
Nov 2023	GPT-4 Turbo	$10,00	$30,00	DevDay: primo taglio significativo
Nov 2023	GPT-3.5 Turbo (rev.)	$1,00	$2,00	−75% rispetto al lancio
Dic 2023	Gemini 1.0 Pro (Google)	$0,125	$0,375	Entra in campo un nuovo attore
Mar 2024	Claude 3 Haiku (Anthropic)	$0,25	$1,25	Segmento budget di qualità
Mag 2024	GPT-4o	$2,50	$10,00	−50% rispetto a GPT-4 Turbo
Lug 2024	GPT-4o mini	$0,15	$0,60	−60% rispetto a GPT-3.5 Turbo
Ago 2024	Gemini 1.5 Flash (rev.)	$0,075	$0,30	Google taglia del 78% in tre mesi
Set 2024	Mistral Small (rev.)	$0,10	$0,30	−90% in un giorno
Ott 2024	GPT-3.5 equivalent	$0,07	$0,07	Benchmark: −280x in 24 mesi
Dic 2024	DeepSeek V3	$0,14	$0,28	Lo shock cinese
Gen 2025	DeepSeek R1 (reasoning)	$0,55	$2,19	vs. o1 di OpenAI a $15/$60: −97%
2025	Claude Sonnet 4.5	$3,00	$15,00	−80% rispetto a Opus 3
2025	Claude Opus 4.5	$5,00	$25,00	−67% rispetto a Opus 4
Apr 2026	GPT-5.4	$2,50	$15,00	Frontiera: 12x più economico di GPT-4
Apr 2026	Gemini 2.5 Flash	$0,15	$0,60	Qualità media a prezzo minimo
Apr 2026	Gemini Flash-Lite	$0,075	$0,30	Il più economico tra i capaci

Sintesi brutale: chi pagava $10.000/mese in API nel 2023, oggi ottiene lo stesso volume di elaborazione per meno di $200.

Il crollo del costo AI: trend globale

$/M token a parità di capacità GPT-3.5 · scala logaritmica · 2022 – 2026

Costo per capacità GPT-3.5 equivalent
Punti di rottura

Fonte: Stanford AI Index 2025 — costo per ottenere capacità equivalente al GPT-3.5 originale
Nota: scala logaritmica — ogni divisione verticale rappresenta una riduzione del 90% · −99,6% in 41 mesi

3. Non è solo deflazione: è una guerra geopolitica

FATTO Il 27 gennaio 2025, NVIDIA perse $589 miliardi di capitalizzazione in un solo giorno — la più grande distruzione di valore in una singola seduta nella storia dei mercati americani.

La causa: una startup cinese chiamata DeepSeek aveva pubblicato un paper tecnico dichiarando un costo di addestramento del proprio modello pari a $5,6 milioni in GPU compute — contro i $100+ milioni confermati da Sam Altman per GPT-4. LIMITE Analisti indipendenti stimano i costi totali di DeepSeek tra $500M e $1,6 miliardi, ma il messaggio era inequivocabile: la barriera all'ingresso si era abbassata catastroficamente.

I media lo hanno chiamato "lo Sputnik dell'AI". E non a torto.

Il mercato oggi: chi sono i giocatori

FATTO Secondo i dati al Q1 2026:

· USA guida con $67,2B di investimenti in AI nel 2025 e il 67% del mercato commerciale LLM
· Cina segue con $43,8B e 41.200 paper scientifici pubblicati annualmente
· Insieme controllano oltre il 70% dei finanziamenti globali all'AI
· L'investimento totale globale in AI nel 2025 ha raggiunto $202,3 miliardi (+75% YoY)

4. La legge che nessuno ha scritto

INTERPRETAZIONE Si chiama Inference Scaling Law e dice che le performance dei modelli AI migliorano con più compute — ma i costi di inferenza (il costo per usare il modello) scendono molto più velocemente di quanto le performance migliorino.

Il risultato pratico è semplice quanto devastante per i vecchi modelli di business:

Ogni anno, per lo stesso dollaro, si ottiene 10 volte più intelligenza artificiale.

Più veloce della Legge di Moore sui microprocessori. Più veloce della deflazione della banda durante il boom di Internet. I prezzi dei token AI scendono a una velocità che non ha precedenti nella storia della tecnologia.

5. Chi guadagna? Chi perde?

I vincitori strutturali

INTERPRETAZIONE NVIDIA e i produttori di infrastruttura hardware sono l'eccezione alla regola deflazionistica. Più i prezzi scendono, più l'utilizzo cresce, più GPU vengono vendute. NVIDIA controlla ancora oltre l'80% del mercato GPU high-end a fine 2025. Il paradosso è che l'abbassamento dei prezzi genera più domanda di compute, non meno.

I cloud provider (AWS, Azure, GCP) controllano il 78% dei servizi AI cloud globali e mantengono posizioni difendibili grazie all'integrazione verticale e ai contratti enterprise.

Le aziende utenti finali vedono esplodere la loro capacità computazionale a parità di budget. JPMorgan Chase ha deploiato il proprio LLM Suite a 200.000 dipendenti; Goldman Sachs ha dichiarato che l'AI può completare il 95% di un prospetto IPO "in minuti" — un lavoro che richiedeva due settimane e sei persone.

I candidati all'estinzione

INTERPRETAZIONE I modelli di business basati esclusivamente sul markup dell'accesso AI: chiunque costruisca valore aggiunto solo facendo da intermediario tra un LLM e l'utente finale, senza differenziazione proprietaria, è strutturalmente esposto. Quando GPT-4-level performance costa $1/M token invece di $30, il margine scompare.

Le startup verticali senza moat difendibile: il mercato dell'AI coding assistant — il segmento più finanziato e più competitivo — vedrà consolidamento significativo entro 24 mesi, secondo le proiezioni 2026.

I provider medi senza scala: tra i top 10 player LLM, si contava solo il 9% del revenue totale di mercato nel 2023. La frammentazione attuale non è sostenibile a lungo.

6. Gli Stati. Regoleranno o saranno regolati dall'AI?

LIMITE La risposta onesta è: ancora non lo sappiamo, e la finestra si sta chiudendo.

FATTO In Europa, l'EU AI Act è la prima legge organica sull'intelligenza artificiale nel mondo. Prevede obblighi diversificati per livello di rischio, con le AI "ad alto rischio" soggette a valutazioni di conformità obbligatorie.

Negli USA, il Congresso ha fallito due volte nel 2025 il tentativo di imporre una moratoria sulle leggi statali. Non c'è ancora una legge federale sull'AI, e le previsioni di Stanford HAI per il 2026 parlano di un "tiro alla fune regolatorio senza fine in vista".

FATTO La tendenza globale emergente è quella della sovranità AI: ogni paese cerca di non dipendere da infrastrutture di intelligenza artificiale controllate da potenze straniere. Gartner prevede che il 35% dei paesi sarà vincolato a piattaforme AI regionali entro il 2027. Negli ultimi mesi del 2025, UAE, Corea del Sud, Giappone e decine di altri paesi hanno annunciato data center sovrani.

INTERPRETAZIONE Ma c'è un problema di tempistica. La concentrazione del mercato — tecnica, finanziaria e geopolitica — avanza molto più velocemente di qualsiasi framework regolatorio. E i governi che non si muovono ora rischiano di arrivare tardi a una partita che si è già giocata.

7. Abbiamo già superato il punto di non ritorno?

Poniamo la domanda in modo diretto, senza ottimismo di convenienza.

INTERPRETAZIONE Il mercato AI ha caratteristiche che storicamente producono oligopoli naturali:

· Network effects potenti (più dati → modelli migliori → più utenti → più dati)
· Barriere di compute che favoriscono chi ha già scala (training da miliardi di dollari)
· Winner-take-most dynamics nella distribuzione enterprise

La combinazione tra crollo dei prezzi che elimina i margini dei player medi, concentrazione del capitale su pochi provider (OpenAI, Anthropic, Google, Meta, xAI), open source cinese che erode ulteriormente le barriere e regolazione frammentata e in ritardo, suggerisce che la finestra per un mercato pluralista e competitivo si sta chiudendo rapidamente.

Ma c'è una domanda che nessuno vuole davvero porre ad alta voce.

8. I conti che non tornano: il caso OpenAI

Un calcolo semplice — e scomodo

FATTO I numeri di OpenAI per il 2025, ricavati da fonti dirette e verificabili, raccontano una storia precisa:

· Ricavi 2025: ~$20 miliardi — confermato dalla CFO Sarah Friar in gennaio 2026
· Cash burn 2025: ~$9 miliardi — proiezione confermata da Sacra Research
· Costi di sola inferenza 2025: $8,4 miliardi — pari al 42% dei ricavi totali, in crescita verso i $14,1 miliardi previsti nel 2026
· R&D e altri costi operativi H1 2025: $6,7 miliardi (solo primo semestre, fonte: The Information)
· Rapporto costo/ricavo implicito: $1,69 spesi per ogni $1,00 incassato (proiezione WSJ su documenti interni)

In sintesi: i soli costi di inferenza consumano quasi metà dei ricavi, prima ancora di pagare ricercatori, uffici, marketing e infrastrutture.

FATTO Il piano dichiarato agli investitori, basato su documenti interni ottenuti dal Wall Street Journal, prevede perdite operative di $74 miliardi nel 2028 — pari al 75% del fatturato previsto in quell'anno — prima di un ipotetico punto di pareggio nel 2029-2030. La perdita cumulata fino al 2029 è stimata in $115 miliardi (The Information). OpenAI ha già impegnato $1.400 miliardi in infrastrutture nell'arco di otto anni (Fortune/WSJ).

Se OpenAI volesse coprire integralmente i propri costi correnti con i ricavi da utenti, senza ulteriore finanza esterna — quanto dovrebbe costare il servizio per ogni utente?

Parametro	Dato verificato	Fonte
Utenti attivi settimanali (mar 2026)	910 milioni	OpenAI/CNBC
Ricavi 2025	~$20 miliardi	CFO Sarah Friar, gen 2026
Cash burn 2025	~$9 miliardi	Sacra Research
Ricavo medio per utente attivo/anno	~$22	calcolo diretto
Break-even per utente/anno (costi correnti)	~$32	calcolo diretto
Utenti che pagano oggi	~50 milioni su 910M	OpenAI (mar 2026)
Break-even se solo i paganti coprono i costi	~$580/utente/anno	calcolo diretto

INTERPRETAZIONE Il divario è abissale. Solo 50 milioni di utenti su 910 milioni pagano un abbonamento. Gli altri 860 milioni usano il servizio gratuitamente — un servizio che costa miliardi di dollari l'anno da mantenere.

Ma questo è solo il costo operativo corrente. Se includiamo le perdite pregresse, i $1.400 miliardi di impegni infrastrutturali futuri e il 20% dei ricavi ceduto a Microsoft contrattualmente, il conto reale diventa strutturalmente irrecuperabile senza scala massiva.

In uno scenario in cui OpenAI dovesse finanziare tutto questo solo con i ricavi degli utenti — senza continuare ad attingere a investitori disposti ad accettare perdite decennali — il costo del servizio che oggi percepiamo come quasi gratuito o abbonabile a $20/mese dovrebbe essere moltiplicato per un fattore che gli analisti stimano tra 3x e 10x.

La domanda che segue è diretta

Gli 800 milioni di utenti non paganti di ChatGPT — quelli che usano il servizio gratuitamente ogni giorno — potrebbero sostenere un abbonamento di $60-200/mese?

La risposta, in larga parte del mondo, è: no.

E allora chi paga? La risposta attuale è: gli investitori. FATTO OpenAI ha ricevuto $122 miliardi di nuovi investimenti ad aprile 2026, raggiungendo una valutazione di $852 miliardi. SoftBank, Andreessen Horowitz, D.E. Shaw, TPG. I mercati finanziari stanno — per ora — sostenendo il costo di un servizio che gli utenti non potrebbero permettersi al prezzo reale.

Questo modello ha un nome: sussidio speculativo. E ha sempre una data di scadenza.

9. I costi che nessuno mette in conto

Il costo ambientale

FATTO I dati pubblicati su riviste scientifiche peer-reviewed (VU Amsterdam, Cornell University, Nature Sustainability) raccontano una storia che la narrativa tech tende a ignorare:

· La sola impronta carbonica dei sistemi AI nel 2025 potrebbe essere compresa tra 32,6 e 79,7 milioni di tonnellate di CO₂, mentre il consumo idrico potrebbe raggiungere 312,5–764,6 miliardi di litri.

· La domanda elettrica globale dei data center potrebbe crescere da circa 415 TWh nel 2024 a quasi 945 TWh entro il 2030, con i carichi di lavoro AI che rappresentano una quota sproporzionata di questa crescita.

· Entro il 2030, al ritmo attuale di crescita AI, si potrebbero immettere nell'atmosfera 24-44 milioni di tonnellate di CO₂ ogni anno — l'equivalente di 5-10 milioni di automobili in più sulle strade americane — e consumare fino a 1.125 milioni di metri cubi d'acqua l'anno, pari all'uso domestico annuale di 10 milioni di americani.

LIMITE Nessuno di questi costi è attualmente internalizzato nel prezzo del token.

Il costo sociale

FATTO Secondo i dati annuali di Challenger, Gray & Christmas — la principale società di outplacement americana che traccia i licenziamenti aziendali — nel 2025 negli USA sono stati annunciati 54.836 tagli occupazionali esplicitamente attribuiti all'AI. Dal 2023, anno in cui le aziende hanno iniziato a dichiarare l'AI come causa di riduzione del personale, il totale cumulato ha superato i 71.000 annunci. Le aziende che hanno citato l'AI includono Amazon (14.000 ruoli), Microsoft (15.000), Salesforce (4.000) e decine di altre.

FATTO Ma il dato più significativo non sono i licenziamenti espliciti: è la trasformazione silenziosa del mercato del lavoro per i giovani. Uno studio accademico firmato da Erik Brynjolfsson, Bharat Chandar e Ruyu Chen di Stanford University — basato su dati di payroll di ADP che coprono milioni di lavoratori — ha documentato che i lavoratori nella fascia 22-25 anni nei settori più esposti all'AI hanno registrato un calo del 13% dell'occupazione rispetto al 2022, a fronte di una crescita del 6-9% per i colleghi più senior nelle stesse professioni. Nello specifico, l'occupazione dei giovani sviluppatori software è calata di quasi il 20% rispetto al picco del tardo 2022.

INTERPRETAZIONE Il meccanismo è preciso: i modelli AI sono addestrati su testi, codice, documentazione — esattamente il tipo di conoscenza formale acquisita all'università. I lavoratori junior, che entrano nel mercato con questa conoscenza codificata, competono direttamente con i modelli. I senior hanno ciò che l'AI non ha ancora: giudizio contestuale, relazioni, esperienza di situazioni ambigue.

Chi assorbirà questi costi? LIMITE Non il prezzo del token.

La dipendenza come dato strutturale

INTERPRETAZIONE C'è una dinamica che la letteratura economica conosce bene e che si sta replicando nell'AI: il lock-in cognitivo.

Quando uno strumento diventa abbastanza capace, abbastanza veloce e abbastanza economico, smette di essere un'opzione e diventa un'infrastruttura. Le aziende integrano i workflow. I professionisti riorganizzano le proprie competenze attorno ad esso. Gli studenti crescono con esso come dato di fatto.

A quel punto, chi controlla lo strumento controlla molto di più dello strumento.

Se il servizio è gestito da privati, il ritorno richiesto è economico: chi non può pagare il prezzo reale è escluso, oppure diventa — come avviene con i social network — il prodotto. Se il servizio passa sotto il controllo dei governi, il ritorno può essere di altra natura: informazione, sorveglianza, narrativa.

La sovranità AI guadagnerà sempre più terreno nel 2026, mentre i paesi cercano di dimostrare la propria indipendenza dai provider AI e dal sistema politico statunitense. Gartner stima che il 35% dei paesi sarà vincolato a piattaforme AI regionali entro il 2027.

10. Chi sopravviverà — e a quale prezzo?

Facciamo chiarezza su quello che i dati, messi insieme, ci dicono.

INTERPRETAZIONE L'AI non è neutrale. Non è uno strumento come un martello o un foglio di calcolo. È un sistema che apprende dai comportamenti, che ottimizza secondo obiettivi definiti da chi lo costruisce, e che — per la prima volta nella storia tecnologica — è in grado di sostituire non solo il lavoro manuale ma il lavoro cognitivo di massa.

Il crollo dei prezzi dei token non democratizza l'AI: sposta il potere. Quando qualcosa diventa quasi gratuito per l'utente finale, significa che il costo viene pagato altrove — da investitori che si aspettano un ritorno futuro, da esternalità ambientali non contabilizzate, da lavoratori il cui valore di mercato si sta erodendo.

La vera domanda non è chi sopravviverà tra i provider. OpenAI, Google, Anthropic, DeepSeek — qualcuno di loro sopravviverà, consolidato attorno a capitali pubblici o privati abbastanza grandi da reggere decenni di perdite.

La vera domanda è:

Quando i conti torneranno — e torneranno, perché le leggi economiche non si sospendono per nessuna rivoluzione tecnologica — chi avrà in mano il conto da presentare, e a chi lo presenterà?

Se lo presenteranno agli utenti, i prezzi dei token saliranno e l'accesso si concentrerà su chi può permettersi di pagare il valore reale dell'intelligenza artificiale.

Se lo presenteranno ai governi, l'AI diventerà infrastruttura pubblica — con tutto ciò che questo comporta in termini di controllo, accesso e sovranità digitale.

Se lo presenteranno all'ambiente e alla società, i costi — già visibili in emissioni, consumi idrici e disoccupazione giovanile — continueranno a crescere in silenzio, non contabilizzati in nessun bilancio.

Probabilmente accadrà tutto questo insieme, in proporzioni diverse a seconda della geografia e del momento politico.

LIMITE Non sappiamo come andrà a finire. E questa è l'unica risposta onesta che i dati consentono oggi.

Chi sopravviverà?

Forse la domanda giusta è un'altra: in quale tipo di futuro vogliamo sopravvivere?

Perché quella scelta — più di qualsiasi prezzo per milione di token — non è ancora stata fatta.

Fonti e riferimenti

Tutte le fonti sono primarie o di primo livello (peer-reviewed, comunicati ufficiali, report di organi riconosciuti).

Stanford AI Index 2025 — Inference costs: da $20/M (nov 2022) a $0,07/M (ott 2024). ai.stanford.edu/research/ai-index
TokenCost.app — "AI Price Index: LLM Costs Dropped 300x (2023–2026)". tokencost.app/blog/ai-price-index
IntuitionLabs — "ChatGPT API Pricing 2026". intuitionlabs.ai
Introl Blog — "Inference Unit Economics: The True Cost Per Million Tokens" (feb 2026). introl.com/blog
Jan Horecny / Medium — "The AI Price Collapse Is Real" (mar 2026). medium.com/@horecny
Wall Street Journal — Documenti interni OpenAI: perdite $74B nel 2028, rapporto costo/ricavo $1,69 per $1,00 (proiezioni estate 2025).
Fortune — "OpenAI says it plans to report stunning annual losses through 2028" (nov 2025). fortune.com
Sacra Research — "OpenAI revenue, valuation & funding" (apr 2026). sacra.com/c/openai
OpenAI — Comunicato ufficiale round $122B / valutazione $852B (31 mar 2026). openai.com
Bloomberg — "OpenAI Valued at $852 Billion After Backing From Amazon, Nvidia, SoftBank". bloomberg.com
CNBC — "OpenAI closes funding round at an $852 billion valuation" (31 mar 2026). cnbc.com
The Register — "OpenAI has spent $12B on inference with Microsoft" (nov 2025). theregister.com
The Information — "$115B cash burn cumulativo 2029" e "H1 2025: $4,3B ricavi, $2,5B cash burn".
Carnegie Invest Blog — "The Risks Facing OpenAI and its $1.4T in Spending Commitments" (nov 2025). blog.carnegieinvest.com
de Vries-Gao / Cell Reports Sustainability (Elsevier) — "The carbon and water footprints of data centers and what this could mean for artificial intelligence" (dic 2025), VU Amsterdam. sciencedirect.com
Xiao, You et al. / Nature Sustainability — Cornell University PEESE Lab, CO₂ 24–44 Mt/anno e acqua 731–1.125 M m³ al 2030 (USA). news.cornell.edu · preprint
IEA — International Energy Agency, "Electricity 2024" — 182 Mt CO₂ data center 2024, 560 miliardi L acqua 2023. iea.org
Challenger, Gray & Christmas — Annual Job Cut Report 2025 (gen 2026): 54.836 tagli AI in tutto il 2025, 71.825 dal 2023. challengergray.com
Brynjolfsson, Chandar, Chen / Stanford Digital Economy Lab — "Canaries in the Coal Mine" (ago 2025), ADP payroll 25M lavoratori, −13% occupazione 22-25enni in settori esposti AI. digitaleconomy.stanford.edu
Gartner — Press release "35% of Countries Will Be Locked Into Region-Specific AI Platforms by 2027" (29 gen 2026). gartner.com
MIT Technology Review — "What's next for AI in 2026" (gen 2026). technologyreview.com
Stanford HAI — "Stanford AI Experts Predict What Will Happen in 2026". hai.stanford.edu
DeepSeek-AI — "DeepSeek-V3 Technical Report" (dic 2024), 2,788M ore GPU H800 per training. arxiv.org/abs/2412.19437