L’intelligenza artificiale più economica al mondo, ma un incubo per il GDPR? Cosa significa lo shock di DeepSeek per le aziende tedesche
La fine della dipendenza da Nvidia: come Huawei e DeepSeek stanno ridefinendo il mercato globale dell’IA
Una guerra dei prezzi senza precedenti sta scuotendo il settore globale dell’IA: la startup cinese DeepSeek ha mandato in tilt il mercato con un taglio di prezzo permanente del 75% per il suo modello di punta. Finanziata da fondi sovrani nazionali e alimentata da chip Huawei, l’azienda si sta svincolando dall’hardware occidentale di Nvidia, dettando improvvisamente i prezzi globali. Questa situazione si sta rivelando una prova cruciale per i fornitori occidentali come Anthropic e Google, che stanno reagendo con aumenti di prezzo occulti attraverso strutture di token modificate, causando già un’impennata dei budget per clienti importanti come Uber e Microsoft. Ma se da un lato il costo incredibilmente basso dell’IA cinese appare estremamente attraente dal punto di vista commerciale, dall’altro si sta rapidamente trasformando in un enorme incubo per le aziende tedesche in termini di GDPR. L’unica soluzione al dilemma tra l’esplosione dei costi dell’IA e le imminenti sanzioni per violazione della protezione dei dati risiede in una strada che pochi decisori hanno finora preso in considerazione.
DeepSeek e la nuova guerra dei prezzi dell’IA
Prezzi più bassi in modo permanente: cosa significa davvero la riduzione di prezzo di DeepSeek
Il 23 maggio 2026, la startup cinese di intelligenza artificiale DeepSeek ha annunciato di aver reso permanente lo sconto temporaneo del 75% applicato al suo token di punta V4-Pro. Ciò significa che il prezzo dei token emessi rimarrà stabilmente a 0,87 dollari USA per milione di token, un livello considerato semplicemente inimmaginabile solo pochi mesi prima. Per confronto, i costi API per il predecessore a prezzo pieno variavano da 0,1 a 24 yuan per milione di token, ovvero da circa 0,014 a 3,30 dollari USA; le tariffe ora permanenti sono comprese tra 0,025 e 6 yuan (circa da 0,0035 a 0,83 dollari USA).
Questa decisione non è una semplice strategia di marketing. È il risultato di un ricalcolo fondamentale dei costi di produzione, reso possibile da due fattori: in primo luogo, il modello V4-Pro ora funziona nativamente sui chip Ascend 950 di Huawei anziché sull’hardware Nvidia. Questo ha reso DeepSeek il primo modello di intelligenza artificiale all’avanguardia cinese ad essere completamente ottimizzato su un chipset nazionale. In secondo luogo, l’azienda ha annunciato che i prezzi dovrebbero diminuire ulteriormente in modo significativo con la produzione di massa dei supernodi Ascend 950 di Huawei nella seconda metà del 2026. Il messaggio strategico è chiaro: DeepSeek scommette che la scalabilità tecnologica e la tecnologia dei semiconduttori nazionale consentiranno una spirale discendente dei costi che i concorrenti occidentali non saranno in grado di replicare nel prossimo futuro.
Schede geopolitiche al posto dei capitali di Wall Street: l’architettura finanziaria alla base dell’attacco ai prezzi
Per capire perché DeepSeek possa permettersi riduzioni di prezzo di questa portata pur essendo alla ricerca di un finanziamento miliardario, è necessario esaminare la sua insolita struttura proprietaria e di capitale. Fondata come laboratorio privato dal fondo speculativo cinese High-Flyer Capital Management, DeepSeek ha perseguito per anni una strategia di rifiuto dei finanziamenti esterni. Questo periodo di deliberato autofinanziamento sembra ora essere giunto al termine.
Secondo quanto riportato da diverse fonti attendibili a MarketScreener e al Financial Times, DeepSeek potrebbe raggiungere una valutazione fino a 50 miliardi di dollari nel suo primo round di finanziamento ufficiale. Ciò rappresenterebbe un aumento considerevole rispetto alle precedenti stime, che si aggiravano tra i 10 e i 30 miliardi di dollari. Particolarmente significativa è l’identità del potenziale investitore principale: il National AI Fund cinese, con circa 8,8 miliardi di dollari di capitale, è in trattative per guidare questo round. Nel frattempo, colossi tecnologici come Tencent e Alibaba avevano precedentemente valutato potenziali investimenti con una valutazione di 20 miliardi di dollari. DeepSeek potrebbe raccogliere un totale di 3-4 miliardi di dollari in questo round di finanziamento.
Ciò che a prima vista appare come un normale finanziamento per la crescita è in realtà una forma di allocazione strategica di capitale a livello statale. La Cina sta posizionando DeepSeek come campione nazionale dell’intelligenza artificiale in una corsa che non è più solo tecnologica, ma anche geopolitica. Il produttore di chip Huawei fornisce l’hardware, il fondo sovrano fornisce il capitale e DeepSeek fornisce i modelli: un ecosistema verticale significativamente più resistente ai controlli sulle esportazioni e alle sanzioni statunitensi rispetto a qualsiasi soluzione basata su GPU Nvidia.
La strategia di prezzo dei concorrenti occidentali: quando i tokenizzatori diventano un’arma di prezzo
Mentre DeepSeek riduce drasticamente i suoi costi, Anthropic e Google si muovono nella direzione opposta, seppur attraverso metodi tecnicamente mascherati che ricevono poca attenzione nel dibattito pubblico. Come rivela un rapporto dettagliato della FAZ dell’aprile 2026, Anthropic ha riprogettato radicalmente il tokenizer dei suoi modelli più recenti, con la nuova versione che genera dal 32 al 45 percento in più di token nativi con testo identico. Ciò significa che chiunque svolga la stessa operazione di prima sta effettivamente pagando molto di più, senza che un singolo prezzo di listino ufficiale sia stato aumentato.
Questo metodo di aumenti di prezzo occulti è particolarmente insidioso dal punto di vista economico perché è difficile da prevedere per molti clienti aziendali. I budget vengono pianificati sulla base di modelli di utilizzo storici, non di sfumature tokenomiche. L’aumento effettivo dei costi può quindi facilmente raggiungere il 22-37%. A ciò si aggiunge l’eliminazione dei modelli a tariffa fissa. Anthropic ha gradualmente trasferito i clienti aziendali da abbonamenti a prezzo fisso a una fatturazione basata esclusivamente sull’utilizzo tramite token. Ciò che rappresenta un flusso di entrate più affidabile per i fornitori diventa un fattore di costo fondamentalmente imprevedibile per i clienti aziendali.
Google sta implementando una strategia simile con i suoi modelli Gemini: la variante Flash più economica rimane competitiva, mentre i modelli Pro ad alte prestazioni hanno prezzi significativamente più elevati. Gemini 3.1 Pro, ad esempio, costa 2 dollari in input e 12 dollari in output per milione di token, considerevolmente meno di Claude Opus 4.7 con 5 dollari in input e 25 dollari in output, ma comunque circa 14 volte più costoso di DeepSeek V4 Pro al suo attuale prezzo di licenza perpetua.
Ubiquità e shock di bilancio: quando gli strumenti di intelligenza artificiale travolgono finanziariamente l’azienda
Forse l’esempio più lampante della nuova realtà dei costi proviene da Uber. L’azienda di ride-hailing ha implementato Claude Code, lo strumento di programmazione per terminali basato sull’intelligenza artificiale di Anthropic, per alcuni team nel dicembre 2025, senza un piano di implementazione coordinato, ma spinto dalla domanda spontanea. A dicembre, il 32% dei suoi ingegneri utilizzava lo strumento. Entro febbraio 2026, questa percentuale era salita al 63%. Ad aprile, il Chief Technology Officer Praveen Neppalli Naga ha annunciato che l’intero budget per l’IA per il 2026, destinato a circa 5.000 ingegneri, era già stato completamente esaurito. Quattro mesi, un budget annuale. L’azienda, secondo il CTO, era “tornata al punto di partenza” con le sue ipotesi finanziarie.
Questo caso non è un episodio isolato, ma piuttosto sintomatico di un fallimento strutturale nella gestione finanziaria dell’IA aziendale. Le aziende hanno imparato a preventivare le licenze software, ma non hanno ancora imparato a prevedere e gestire i costi di utilizzo basati sui token. Claude Opus 4.7, il modello di riferimento per le attività di programmazione più complesse, ha un costo di 5 dollari in input e 25 dollari in output per milione di token. Quando 5.000 ingegneri elaborano quotidianamente repository di codice complessi attraverso il modello, si generano flussi di dati in background che crescono esponenzialmente e, con un’adozione diffusa, possono superare i limiti di budget in poche settimane.
Microsoft fornisce un secondo esempio eclatante: nel dicembre 2025, il colosso del software ha invitato migliaia di sviluppatori a utilizzare Claude Code nel loro lavoro quotidiano. Lo strumento è diventato rapidamente popolare, forse anche troppo. Alla fine di maggio 2026, è stato annunciato internamente che tutte le licenze di Claude Code sarebbero state rescisse il 30 giugno 2026. Microsoft ha raccomandato agli sviluppatori interessati che lavoravano con Windows, Microsoft 365, Outlook, Teams e Surface di migrare i propri flussi di lavoro a GitHub Copilot CLI. La spiegazione ufficiale è rimasta vaga, ma i dati parlano da soli: la fatturazione basata su token aveva completamente esaurito il budget del segmento AI in pochi mesi. Ironicamente, Microsoft rimane un cliente di Anthropic: i modelli di Claude (Haiku, Sonnet, Opus) sono ancora disponibili tramite GitHub Copilot CLI: il modello di business cambia, ma la dipendenza tecnologica rimane.
La disfunzione strutturale: perché i modelli di prezzo basati sui token distruggono sistematicamente i bilanci aziendali
I casi di Uber e Microsoft non sono errori di gestione. Sono il prodotto diretto di un’incompatibilità strutturale tra i modelli di fatturazione dei fornitori di intelligenza artificiale e i cicli di pianificazione delle grandi aziende. Il software tradizionale è concesso in licenza: per utente, per anno, prevedibile e con budget definibile. Le API di intelligenza artificiale, invece, vengono fatturate come l’elettricità: in base all’utilizzo, in modo dinamico, e il costo effettivo si conosce solo a posteriori.
Il problema è aggravato da diverse dinamiche simultanee. In primo luogo, il consumo di token per attività è praticamente impossibile da stimare per i non esperti. Uno sviluppatore che utilizza Claude Code per analizzare un repository di codice di 10.000 righe genererà inconsapevolmente o involontariamente centinaia di migliaia di token in background. In secondo luogo, la maggior parte delle aziende attualmente non dispone dell’infrastruttura di osservabilità necessaria: strumenti come Langfuse o Helicone, che registrano ogni chiamata API con il conteggio dei token e la ripartizione dei costi, sono utilizzati finora solo da una piccola parte delle aziende. In terzo luogo, l’eliminazione delle tariffe fisse da parte di fornitori come Anthropic crea un vuoto di pianificazione: i profili di utilizzo precedenti non sono più validi perché sia gli aggiornamenti dei tokenizer sia l’adozione di nuovi flussi di lavoro basati su agenti modificano significativamente il consumo per attività.
Questa situazione è vantaggiosa per i fornitori nel breve termine: volumi di consumo più elevati e difficili da controllare generano maggiori ricavi. Nel medio termine, tuttavia, si profilano delle conseguenze: le aziende limiteranno l’utilizzo, sposteranno i carichi di lavoro su modelli più economici o valuteranno opzioni di self-hosting. Il danno per Anthropic derivante dalla rescissione del contratto con Microsoft e dal ritiro di Uber non è solo economico, ma anche strategico: entrambe le aziende erano clienti di riferimento di primaria importanza.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Konrad Wolfenstein
Source link

