Čína je novým lídrom v oblasti umelej inteligencie. DeepSeek je lacnejší a ekologickejší
Čínska spoločnosť DeepSeek koncom decembra uviedla na trh bezplatný jazykový model s otvoreným zdrojovým kódom s označením R1 a tvrdí, že bol vyvinutý len za dva mesiace s nákladmi nižšími ako šesť miliónov dolárov. To sú výrazne menšie náklady, než aké vynakladajú západní konkurenti. R1 navyše údajne výkonom prekonal aj najnovší model OpenAI o1 v mnohých testoch tretích strán, na ktorého vývoj bolo použitých približne desaťnásobne viac finančných prostriedkov.
Nový model umelej inteligencie od spoločnosti DeepSeek sa tiež dostal na prvé miesto v rebríčku najsťahovanejších aplikácií amerického AppStoru.
V reakcii na to sa v pondelok prepadla hodnota Nvidie a ďalších amerických technologických firiem. Trhová kapitalizácia čipového gigantu, na ktorého mikročipoch bežia jazykové modely umelej inteligencie, v pondelok klesla takmer o 600 miliárd dolárov. Akcie Nvidie sa v pondelok prepadli o 17 percent a zaznamenali zrejme najväčší prepad od marca 2020.
Výpredaj Nvidie následne spôsobil pokles hodnoty ďalších technologických velikánov spojených s AI, ako Micron, Arm Holdings, Broadcom či Advanced Micro Devices. Akcie Microsoftu klesli o 4,2 percenta, Meta Platforms o 3,1 percenta a Alphabet takmer o tri percentá. Akcie energetických firiem Constellation Energy a Vistra, ktoré mali profitovať so zvýšeného dopytu po energii v súvislosti s AI, sa prepadli o 12 a 19 percent.
Spochybnená dominancia USA
DeepSeek podľa analytikov banky Citi „ohrozuje naratív o výnimočnosti USA“. Nebolo by to však prvýkrát. Spojené štáty podobné krízy zažili v automobilovom aj mikročipovom odvetví. V oboch prípadoch sa v USA zrodila technológia, ktorú si časom osvojili aj iné štáty a začali USA tvrdo konkurovať.
To, že dominanciu Spojených štátov v oblasti umelej inteligencie spochybnila práve Čína je však v každom prípade veľkým prekvapením, nakoľko Peking čelil v oblasti dovozu mikročipov tvrdým reštrikciám zo strany USA. Je totiž známe, že na vývoj jazykového modelu treba tri veci: šikovných programátorov, dáta a hrubú výpočtovú silu.
Čína podľa všetkého talentovaných programátorov má a takisto aj prístup k dátam potrebným na trénovanie umelej inteligencie. No dostatočne výkonný hardvér vedia v súčasnosti poskytnúť prakticky iba dve americké firmy – Nvidia a AMD –, ktorých najpokročilejšie procesory určené pre datacentrá pozostávajú z mikročipov, ktoré sa vyrábajú na jedinom mieste – v taiwanskej továrni TSMC. Všetky tri spomenuté spoločnosti sa riadia americkými exportnými obmedzeniami voči Číne.
Peking sa však predsa k niektorým výrobkom od Nvidie dostal, a to aj vďaka tomu, že americká spoločnosť mala silný záujem udržiavať s Čínou naďalej obchodné vzťahy. Pre potreby tamojších vývojárov vyrobila grafickú kartu (GPU) s menším výkonom, na ktorej export do Číny sa už americké sankcie nevzťahovali.
Grafická karta s označením H20 je najvýkonnejšia z troch GPU, ktoré Nvidia pre čínsky trh dodávala. Startup so sídlom v Chang-čou však uviedol, že DeepSeek na vytvorenie svojho modelu použil staršie a menej pokročilé čipy Nvidia H800. Tie spoločnosť nakúpila ešte pred októbrom 2023, teda skôr ako americká vláda rozšírila embargo, ktoré sa vzťahovalo už aj na H800.
Ohľadom efektívnosti R1 však vládne aj značná skepsa. Šéf spoločnosti Scale AI Alexander Wang tvrdí, že DeepSeek svoj model v skutočnosti vytrénovalo na 50-tisíc čipoch Nvidia H100, na ktoré sa vzťahuje americké embargo. Ak by čínska spoločnosť priznala ich vlastníctvo, doznala by sa tým pádom aj k tomu, že ich nadobudla nelegálne.
K Wangovej skepse sa pridal aj Elon Musk, ktorý jeho vyjadrenie komentoval slovom „samozrejme“.
R1 nie je jediný čínsky model
V novembri minulého roka predstavil model umelej inteligencie aj čínsky videoherný gigant Tencent. Jeho model Hunyuan-Large s otvoreným zdrojovým kódom je zameraný na generovanie obrázkov a videí. Podľa vyjadrenia spoločnosti prekonal v testovaní aj špičkové komerčné modely vyvinuté v USA, v niektorých ukazovateľoch dokonca aj najvýkonnejší variant modelu Llama 3.1 od spoločnosti Meta.
Aj v tomto prípade má ísť o efektívnejšiu a cenovo dostupnejšiu technológiu.
Výskumný pracovník v oblasti politiky pre umelú inteligenciu Ritwik Gupta vo svojom výskume konštatuje, že čínska spoločnosť Tencent na trénovanie modelu Hunyuan-Large využila grafické karty NVIDIA H20, ktoré sú lepšie ako ich predchodca H800, no oproti GPU predávaných v USA sú stále menej výkonné, a preto nepodliehajú americkým vývozným reštrikciám.
Prakticky to teda znamená, že Číňania majú v tomto momente oveľa efektívnejší softvér ako je ten, ktorý vyvinuli v USA. Vďaka tomu potrebujú pre svoje jazykové modely menej výpočtovej sily, a tým pádom spotrebujú aj menej elektrickej energie. Čínsky model tak tie americké prekonal aj v oblasti udržateľnosti s ohľadom na životné prostredie.
Môžeme preto konštatovať, že ekologicky, technologicky a aj s ohľadom na nákladovú efektívnosť sa tak Čína stala novým lídrom v oblasti umelej inteligencie.