DeepSeek! (E Made in China 2025)
Impazza DeepSeek, nuova AI cinese: per gli Usa un nuovo "momento Sputnik. Made in China 2025: per il progetto voluto da Xi è tempo di bilanci. E buon anno del serpente :)
DeepSeek
Allora: la nuova versione è uscita poco dopo Natale, pare sia all’altezza di OpenAI e affini, è realizzata con solo una parte dei chip (ad esempio quelli Nvidia) bloccati dagli Usa verso la Cina. E fa parlare di sé come la prima forma di AI che riporta in qualche modo all’AGI (Artificial General Intelligence) specie la release R1. Insomma in ogni caso un po’ tutti hanno detto la stessa cosa: DeepSeek ha colmato un divario. E per gli Usa è arrivato un altro “momento Sputnik”, quello nel quale ci si rende conto che un competitor è più avanti (come capitò nel caso dello Sputnik sovietico, appunto, o come capitò alla Cina dopo la vittoria delle AI di Google contro il campione del mondo di go, allora si parlò di momento Sputnik, ma per la Cina)
Ora, ci sono molti tecnicismi al riguardo ma non solo perché DeepSeek ha segnato l’inizio di una nuova era nell’AI cinese, quella del risparmio: “DeepSeek è stato rapidamente soprannominato il "Pinduoduo dell'IA" e altri grandi giganti della tecnologia come ByteDance, Tencent, Baidu e Alibaba non hanno potuto trattenersi, tagliando i prezzi uno dopo l'altro. Una guerra dei prezzi per i modelli di grandi dimensioni in Cina era imminente”. E a differenze di aziende di stato “che bruciano soldi, in sussidi, DeepSeek è redditizia”.
Vediamo intanto di cosa stiamo parlando. DeepSeek è un'azienda cinese di intelligenza artificiale che sviluppa modelli linguistici di grandi dimensioni open-source. L'azienda è finanziata esclusivamente dal fondo speculativo cinese High-Flyer. Sia DeepSeek che High-Flyer hanno sede a Hangzhou, Zhejiang. DeepSeek è stata fondata nel maggio 2023 da Liang Wenfeng, un ex studente dell'Università di Zhejiang che ha iniziato a fare trading durante la crisi finanziaria del 2007-2008.
Il 2 novembre 2023, DeepSeek ha presentato il suo primo modello, DeepSeek Coder, disponibile gratuitamente per ricercatori e utenti commerciali. Il 29 novembre 2023, DeepSeek ha lanciato DeepSeek LLM, che è stato ampliato fino a 67 miliardi di parametri. Nel dicembre 2024, è stato lanciato DeepSeek-V3 da cui poi nasce R1zero, quello di cui si sta parlando molto di recente.
È dotato di 671 miliardi di parametri ed è stato addestrato in circa 55 giorni a un costo di 5,58 milioni di dollari, utilizzando molte meno risorse rispetto ai suoi pari. È stato addestrato su un set di dati di 14,8 trilioni di token. I test di benchmark hanno dimostrato che ha superato Llama 3.1 e Qwen 2.5, eguagliando GPT-4o e Claude 3.5 Sonnet. DeepSeek inoltre è rilasciato Open source con licenza MIT, “il che significa che ha condiviso il codice sottostante con altre aziende e ricercatori. Ciò consente ad altri di creare e distribuire i propri prodotti utilizzando le stesse tecnologie”, come ha specificato il New York Times che ha aggiunto: "Il baricentro della comunità open source si sta spostando in Cina", ha affermato Ion Stoica, professore di informatica all'Università della California, a Berkeley. "Questo potrebbe essere un enorme pericolo per gli Stati Uniti", perché consente alla Cina di accelerare lo sviluppo di nuove tecnologie”.
Le chiavi del successo di DeeoSeek sono la catena di ragionamento utilizzato dal modello, le prestazioni ottimali e al risparmio, il fatto di essere tecnicamente in grado di arginare le sanzioni e i blocchi Usa e di competere in modo sfrontato con le AI made in Usa (ovviamente è cinese ed è soggetta a tutta una serie di controlli, ma non so chi di voi smanetta con le AI: accade molto spesso sia con OpenAi sia con Google, ad esempio, di chiedere cose inerenti alla politica e ricevere messaggi di diniego. Su questo ci tornerò).
La chiave di DeepSeek secondo gli esperti è l’innovazione tecnica legata al MoE (mixture of experts), un tipo di architettura di rete neurale che utilizza più "expertise" specializzate in diversi aspetti del problema da risolvere. Invece di utilizzare un singolo modello per elaborare tutte le informazioni, MoE distribuisce il lavoro tra diverse expertise, ognuna delle quali si concentra su una parte specifica dei dati (consentendo: meno latenza e meno consumo energetico).
Nel caso di DeepSeek, l'utilizzo di MoE consente al modello di gestire una quantità enorme di dati e di raggiungere prestazioni elevate in diverse attività, come la generazione di testo, la traduzione e la risposta a domande. DeepSeek-V3, come detto, ha 671 miliardi di parametri, ma solo 37 miliardi vengono attivati per ogni token, grazie all'architettura MoE.
Ho chiesto proprio a DeepSeek quali sono i vantaggi del MoE, ecco la risposta ;)
Ecco alcuni vantaggi dell'utilizzo di MoE in DeepSeek:
Efficienza: Attivando solo le expertise necessarie per ogni token, MoE riduce il carico computazionale e consente di addestrare modelli di grandi dimensioni con meno risorse.
Scalabilità: MoE consente di aumentare le dimensioni del modello senza aumentare proporzionalmente il costo computazionale, rendendo possibile lo sviluppo di modelli sempre più potenti.
Specializzazione: Ogni expertise può specializzarsi in un aspetto specifico del problema, migliorando le prestazioni complessive del modello.
Flessibilità: MoE consente di adattare il modello a diverse attività e domini, semplicemente modificando la combinazione di esperti utilizzati.
In sintesi, l'utilizzo di MoE in DeepSeek consente di creare modelli linguistici di grandi dimensioni più efficienti, scalabili e performanti, aprendo nuove possibilità per l'intelligenza artificiale.
Se volete smanettare, questo è il link. Un articolo buono e in italiano sul tema lo trovate qui.
Made in China
Come Lord Voldemort di Harry Potter, "Made in China 2025" è un'iniziativa che suscita così tanta paura e avversione all'estero che i funzionari cinesi non osano pronunciarne il nome. Il piano, introdotto un decennio fa, prevedeva di investire denaro e risorse in decine di settori industriali. L'obiettivo era trasformare la Cina in una "potenza manifatturiera" verde e innovativa, che dipendesse meno dalla manodopera e dalle catene di approvvigionamento occidentali e più dall'automazione e dalle nuove tecnologie sviluppate internamente. Questa era la visione di Xi Jinping per l'economia cinese.
Per la maggior parte, è stato un successo clamoroso.
Questo è l’attacco di un pezzo uscito su The Economist a proposito del progetto “Made in China 2025”. Si tratta di un articolo che restituisce sia gli obiettivi che la Cina si era data, sia quanto ha raggiunto, sia i punti oscuri a seguito del raggiungimento di alcuni obiettivi. Ci torniamo tra poco.
Intanto ricordiamo alcune cose: quali erano i dieci settori industriali chiave considerati strategici per lo sviluppo economico e tecnologico del paese:
Tecnologia dell'informazione di nuova generazione
Robotica avanzata
Attrezzature aerospaziali e aeronautiche
Ingegneria marittima e attrezzature high-tech per la navigazione
Attrezzature ferroviarie moderne
Veicoli a risparmio energetico e veicoli a nuova energia
Attrezzature elettriche
Macchine agricole
Nuovi materiali
Biomedicina e dispositivi medici high-tech
Poi, gli obiettivi:
Aumentare la competitività delle industrie cinesi: Promuovere l'innovazione, migliorare la qualità dei prodotti e sviluppare marchi nazionali forti.
Ridurre la dipendenza dalle tecnologie straniere: Sviluppare tecnologie fondamentali indipendenti e promuovere la sostituzione delle importazioni.
Migliorare l'efficienza produttiva: Adottare tecnologie avanzate di produzione, come la robotica e l'automazione, per aumentare la produttività e ridurre i costi.
Promuovere lo sviluppo sostenibile: Incoraggiare l'uso di tecnologie verdi e ridurre l'impatto ambientale delle attività industriali.
Non sono per niente bravo con grafiche e tabelle ma qui ho provato a riassumere un po’….(:
Ora, torniamo all’Economist: di seguito un riassunto del pezzo con l’evidenziazione di alcuni passaggi salienti.
Il piano Made in China 2025 ha identificato dieci settori strategici, tra cui tecnologia dell'informazione, aerospaziale ed energia pulita, e ha stanziato ingenti risorse finanziarie per sostenere centinaia di industrie tramite sussidi, credito agevolato e terreni a basso costo.
I risultati, scrive Economist, “sono stati notevoli”:
Dominio in settori chiave: La Cina ha superato gli obiettivi di produzione di veicoli elettrici (vendendone oltre 10 milioni nel 2024) e droni, dominando il mercato globale.
Leadership nell'energia pulita: Le aziende cinesi producono circa il 90% dei pannelli solari e il 70% delle batterie a livello mondiale, grazie ai costi di produzione inferiori garantiti dal sostegno statale.
Aumento degli investimenti in R&S: Le aziende cinesi hanno raggiunto l'obiettivo di investire l'1,68% delle entrate in ricerca e sviluppo, superando anche gli obiettivi di deposito brevetti.
Nonostante i successi, secondo Economist, il piano presenta anche delle criticità:
Dipendenza da componenti esteri: La Cina non è ancora in grado di produrre autonomamente grandi aerei commerciali e la produzione di semiconduttori avanzati rimane un punto debole, aggravato dalle restrizioni americane.
Costi elevati: Il piano ha richiesto enormi investimenti finanziari, che avrebbero potuto essere destinati ad altri settori come la sanità.
Distorsioni economiche: L'enfasi sulla produzione ha comportato un eccessivo investimento di capitale e manodopera, a scapito della produttività totale dei fattori (TFP) e dello sviluppo del settore dei servizi.
Surplus commerciale e tensioni internazionali: La sovrapproduzione cinese ha generato un enorme surplus commerciale e accuse di dumping da parte dei partner commerciali, alimentando tensioni e indagini antidumping.
Conclusioni dell’Economist
Made in China 2025" ha raggiunto gran parte dei suoi obiettivi, ma a costo di distorsioni economiche, tensioni commerciali e dipendenza da tecnologie straniere in settori cruciali. L'enfasi sulla produzione e l'autosufficienza, ulteriormente rafforzata dalle politiche protezionistiche americane, ha limitato lo sviluppo di altri settori e la crescita della domanda interna.
In definitiva, il piano riflette la visione di Xi Jinping di una Cina leader nell'industria high-tech, ma solleva interrogativi sulla sostenibilità di questo modello e sulle sue conseguenze a lungo termine per l'economia cinese e le relazioni internazionali.
Dato che Baidu, come tanti altri motori di ricerca del mondo, ora offre anche una sua AI, visto che in questa newsletter si parla di AI, ho deciso di provare pure quella. E ho chiesto che bilancio si può trarre dal progetto Made in China 2025
Questa la traduzione:
"Made in China 2025" è il programma d'azione della strategia cinese per diventare una potenza manifatturiera. L'industria manifatturiera è il pilastro dell'economia nazionale, il fondamento della nazione, lo strumento per la sua prosperità e la base della sua forza. La creazione di un settore manifatturiero competitivo a livello internazionale è la strada obbligata per la Cina per migliorare la sua forza nazionale complessiva, garantire la sicurezza nazionale e costruire una potenza mondiale.
È interessante notare che negli ultimi anni la produzione cinese ha compiuto notevoli progressi in alcuni settori. Ad esempio, nel 2024 le dimensioni complessive dell'industria manifatturiera cinese si sono classificate al primo posto a livello mondiale per 15 anni consecutivi, l'industria dei veicoli a nuova energia si è sviluppata rapidamente, la produzione e le vendite annuali hanno raggiunto la soglia dei dieci milioni di veicoli, diventando un "biglietto da visita brillante" per la produzione cinese. Questi risultati sono inseparabili dalla guida e dalla promozione del documento strategico "Made in China 2025".
Inoltre, sebbene negli ultimi anni la frequenza con cui il termine "Made in China 2025" appare nella sfera pubblica sia diminuita, ciò non significa che la strategia sia stata abbandonata o ignorata. In realtà, gli obiettivi e le missioni principali della strategia sono stati gradualmente realizzati e promossi. In sintesi, "Made in China 2025" è un importante documento strategico formulato dal governo cinese per migliorare la competitività internazionale del settore manifatturiero. Ha un significato guida e un effetto trainante importanti per lo sviluppo dell'industria manifatturiera cinese.
Bene, per questa domenica è tutto perché ho avuto molti impegni, la newsletter torna domenica prossima (e a breve sarà di nuovo e per un bel po’ da Pechino )
E buon anno!
Grazie per aver letto la newsletter. Io sono un giornalista, lavoro a Chora Media, conduco due podcast “Altri Orienti” e “Fuori da Qui”. Ho vissuto a lungo in Cina e in Asia, dove ho fondato China Files. Provo a raccontare cosa succede in questi luoghi con la newsletter, con i libri, con dei video su Youtube. E pure qui su Instagram.
Per chi si fosse iscritto di recente, qui trovate gli archivi
Vi ricordo che questa newsletter è per tutte e tutti gli iscritti a Il Partito. Se volete ricevere le newsletter speciali e solo per abbonati potete modificare la vostra iscrizione alla newsletter trasformandola in abbonamento. Se non siete ancora iscritti potete farlo qui: