
La Cina supera i modelli di OpenAI con l’1% del budget – Arriva Deep Seek
La Cina supera i modelli di OpenAI con l’1% del budget
La società cinese DeepSeek, specializzata nell’intelligenza artificiale, sta sfidando i giganti come OpenAI con modelli avanzati che offrono prestazioni di punta utilizzando solo una minima parte del budget delle grandi aziende. Questa innovativa azienda ha rilasciato recentemente due modelli rivoluzionari:
DeepSeek R1: un modello progettato per simulare il ragionamento umano e apprendere autonomamente attraverso il Reinforcement Learning.
DeepSeek V3: un modello generalista che supera strumenti di alto livello come Claude Sonnet 3.5 e GPT-4o in vari benchmark, riducendo i costi di inferenza di ben 10 volte rispetto ai concorrenti.
Il segreto del successo
La chiave delle straordinarie prestazioni di DeepSeek è la loro architettura Mixture of Experts (MoE), basata su 671 miliardi di parametri, di cui solo 37 miliardi vengono attivati durante il processo di inferenza. Questo approccio consente di ottenere risultati di altissimo livello mantenendo un consumo di risorse incredibilmente contenuto.
Un futuro open source
La vera innovazione di DeepSeek non sta solo nelle prestazioni, ma anche nella filosofia di apertura. I modelli sviluppati dalla società sono open source e possono essere scaricati gratuitamente, rendendoli accessibili a sviluppatori e ricercatori di tutto il mondo.
Con costi ridotti, tecnologia di punta e un approccio open source, DeepSeek rappresenta una minaccia concreta per i leader del settore, ridefinendo le regole del gioco nell’ambito dell’intelligenza artificiale.