TomaszTrela.com
The Memo
No. 2 · 14.05.2026
by Tomasz Trela | Listy do inwestorów

Pamiętacie jeszcze o Nvidii?

O tym, jak szybko rynek odwrócił się od najlepszej spółki świata i przeniósł swój kapitał zupełnie gdzie indziej

Drogi Czytelniku!

Wygląda na to, że pierwsza połowa 2026 roku zapowiada się bajecznie dla całej branży dostarczającej sprzęt do rozwoju AI. Dla całej, poza Nvidią. Od początku roku Intel wzrósł o 217%, AMD 103%, Marvell 90%, ARM 85%, Broadcom 24%. A Nvidia? Ledwie o 14%.

Co poszło nie tak i dlaczego inwestorzy bezlitośnie porzucili swoją ukochaną spółkę?

Tam, gdzie dzisiaj płyną pieniądze

Za tę historyczną rotację odpowiedzialne jest tylko jedno zjawisko: inferencja. Od kilku miesięcy stało się jasne, że wydatki na trenowanie modeli AI, w których specjalizują się chipy Nvidii, nie będą rosły już tak szybko, jak wydatki na bieżącą obsługę tych modeli.

Problem w tym, że chipy Nvidii są za dobre, za drogie i właściwie niepotrzebne do obsługi zapytań (czyli inferencji właśnie), bo równie dobrze sprawdzają się tutaj tańsze rozwiązania dostarczane nie tylko przez AMD czy Intela, ale też chipy projektowane pod konkretne zapotrzebowania operatorów data-center (tym zajmuje się choćby ARM, Broadcom i Marvell).

Już w tym momencie wydatki na obsługę modeli zrównały się z wydatkami na ich trening, ale w ciągu kilku kolejnych lat, aż 85% nowych inwestycji będzie skierowanych nie na potrzeby trenowania, tylko na potrzeby inferencji. Nie ma się temu co dziwić – model wystarczy wytrenować raz, a koszty jego obsługi trzeba ponosić na bieżąco.

Wykres wydania · I

Punkt zwrotny

Globalne zapotrzebowanie data-center na moc obliczeniową AI w gigawatach. Inferencja rośnie szybciej — ale trening, wbrew narracji o końcu jego ery, i tak niemal potraja się do 2030 roku.

100 GW 75 GW 50 GW 25 GW 0 INFERENCJA +35% rocznie TRENING +22% rocznie tzw. "inflection point" 23,1 20,9 62,4 93,7 2025 2026 2027 2028 2029 2030 MOC OBLICZENIOWA DATA-CENTER PRZEZNACZONA NA AI (GW)
Źródło: McKinsey Data Center Demand Model, „The future of AI workloads", luty 2026

To jednak dobra informacja. Przeniesienie wydatków z treningu na inferencję to moment, w którym firmy zaczynają monetyzować swoje inwestycje. Za wytrenowanie modeli nikt im nie płaci, ale za ich późniejsze wykorzystanie już jak najbardziej. Przeniesienie akcentów na inferencję to zatem punkt zwrotny, od którego w końcu zacznie być widać efekty finansowe dokonywanych inwestycji.

Chodzi o to, że dotychczasowe nakłady na trenowanie modeli były ryzykowne, bo na tym etapie nie wiadomo jeszcze, czy w przyszłości pojawi się klient chcący zapłacić za późniejszy dostęp do modelu. Wydatki na inferencję jednak są o wiele bezpieczniejsze, bo dostawcy ponoszą jej koszt tylko wtedy, gdy klient już realnie korzysta z modelu i zużywa jego zasoby, co czyni cały proces niesamowicie dochodowym i skalowalnym.

Rotacja kapitału do spółek produkujących sprzęt do inferencji jest więc jak najbardziej uzasadniona. Nvidia ze swoimi ekstremalnie potężnymi (ale też ekstremalnie drogimi GPU) przestała być po prostu atrakcyjnym wyborem. Używanie jej chipów do inferencji to trochę tak, jak stosowanie kosztującej miliony dolarów rakiety Patriot do zestrzelenia drona o wartości paru tysięcy dolarów. Nieefektywne. A przez to nie do podtrzymania w dłuższym terminie.

Dlatego inwestorzy zabierają kapitał z akcji Nvidii i przenoszą go do spółek, które projektują o wiele tańsze i bardziej wydajne rozwiązania do inferencji.

Brzmi sensownie, prawda? Na pozór tak, tylko że...

Wszyscy są w błędzie.

Prace na zapleczu

Nvidia wcale nie przespała transformacji. Jensen Huang, CEO Nvidii, jako jeden z pierwszych przyznał, że mamy do czynienia z tzw. "inflection point", czyli momentem zwrotnym w przekierowaniu wydatków inwestycyjnych z treningu do inferencji. I zaczął działać.

Patrząc z boku dzisiaj wygląda to tak, jakby Nvidia faktycznie została daleko w tyle za bardziej efektywnymi konkurentami, ale to mylne wrażenie. Nvidia bowiem po cichu pracuje nad czymś dużym. Naprawdę dużym.

Pod koniec tego roku spółka planuje wypuścić nową architekturę przeznaczoną do inferencji właśnie. Nowe układy typu Vera Rubin będą dziesięciokrotnie bardziej efektywne niż najnowszy chip Blackwell i pozwolą obniżyć koszt wygenerowania jednego tokena (najmniejszy fragment zapytania modelu AI) do 10% obecnego kosztu. W dodatku Vera Rubin ma być pięć razy szybsza w zastosowaniach do inferencji niż dotychczasowe chipy.

Nvidia szacuje, że dzięki temu nowe układy wygenerują jej 500% wyższe przychody z jednego gigawata wykorzystanej energii potrzebnej do zasilenia nowych układów. Na marcowej konferencji Jensen Huang podniósł prognozę przychodów dla całej spółki o ponad 100% w ciągu kolejnych dwóch lat, szacując, że do 2027 roku akumulacyjnie przychody spółki ze sprzedaży chipów AI sięgną co najmniej... jednego biliona dolarów (obecnie to 215 miliardów rocznie).

Ale Vera Rubin to tylko "drobne" odświeżenie obecnej architektury i ledwie preludium do tego, co Nvidia planuje wypuścić w kalendarzowym 2027 roku (Nvidia podaje datę premiery na 2028, ale spółka posługuje się innym rokiem fiskalnym).

Huang ogłosił bowiem całkowicie nową platformę o nazwie Feynman (od nazwiska legendarnego fizyka Richarda Feynmana), która w praktycznie każdym parametrze ma być o 300% bardziej wydajna niż zapowiadana na ten rok Vera Rubin. Feynman będzie rewolucją zaprojektowaną w 100% pod rozwiązania inferencji i obsługę agentów AI.

Nvidia przygotowuje go na najnowszej architekturze TSMC 1.6nm, która pozwoli na umieszczenie czterech kości jedna na drugiej. Takie rozwiązanie przypomina budowę wieżowca w świecie, w którym inni rozbudowują miasta horyzontalnie. Wieżowiec sprytniej wykorzystuje dostępną powierzchnię, przez co jest efektywniejszy.

Kolejną zmianą jest to, że w chipach Feynman to światło zastąpi przewody elektryczne. Po raz pierwszy w historii Nvidia użyje tzw. CPO (Co-Packaged Optics), czyli zastosuje przewody optyczne nie tylko do przesyłania danych pomiędzy serwerami, ale... w ramach pojedynczego układu. To taka sama idea, jak zastąpienie miedzianych kabli telefonicznych światłowodami. W praktyce dostajemy większą przepustowość, mniejsze wydzielanie ciepła i mniej zmarnowanej energii. To gigantyczny krok naprzód w świecie inferencji.

Jeszcze niedawno realnym zagrożeniem dla układów Nvidii były rozwiązania projektowane przez startupy takie, jak Groq, które tworzyły tzw. LPU (Language Processing Units), czyli chipy przeznaczone do generowania tokenów do inferencji. Obecne LPU zapewniają 35x szybszą obsługę inferencji niż najnowszy dostępny na rynku chip GPU Blackwell od Nvidii. Nie dziwne, że inwestorzy uznali, że Nvidia zostaje w tyle.

Tylko, że... kilka miesięcy temu Nvidia rozwiązała ten problem wypisując czek na 20 miliardów dolarów i przejmując nie tylko samą spółkę Groq, ale też jej rozwiązania, patenty oraz team inżynierów. Od tego momentu każdy chip Nvidii będzie posiadał wbudowane rozwiązania zaprojektowane przez Groq.

Jeśli wszystko pójdzie zgodnie z planem, to Feynman będzie game-changerem, na jaki lojalni akcjonariusza Nvidii czekają już od wielu miesięcy.

Wykres wydania · II

Trzy generacje, trzy skoki

Wydajność inferencji, koszt na token i efektywność energetyczna kolejnych chipów Nvidii

WYDAJNOŚĆ INFERENCJI PFLOPS NVFP4 na chip — względem Blackwella (= 1×) BLACKWELL RUBIN FEYNMAN ~15× * REDUKCJA KOSZTU OBSŁUGI Ile razy taniej obsłużyć milion tokenów — względem Blackwella BLACKWELL RUBIN 10× taniej FEYNMAN ~30× taniej * EFEKTYWNOŚĆ ENERGETYCZNA Tokeny wygenerowane na 1 wat energii — względem Blackwella BLACKWELL RUBIN 35× FEYNMAN ~100× * * projekcja dla architektury planowanej na 2027 r.
Źródło: NVIDIA — CES 2026, GTC 2026 oraz strona produktowa Vera Rubin NVL72. Wartości bazowe: Blackwell B200 ≈ 10 PFLOPS NVFP4 per chip; Rubin R100 = 50 PFLOPS (5×). Koszt obsługi: Vera Rubin NVL72 = 1/10 kosztu Blackwella per milion tokenów. Efektywność energetyczna: Vera Rubin NVL72 + LPU Groq 3 LPX = 35× tokenów/wat. Liczby dla Feynmana to szacunek na bazie zapowiadanego ~3× przyrostu wydajności na każdym wektorze (premiera 2027 rok kalendarzowy).

Co może pójść nie tak

Problem w tym, że zapowiadane procesory Feynman są tak innowacyjne (1.6 nanometrów, customowe HBM, zamiana kabli na optykę, integracja LPU), że na etapie produkcji mogą pojawić się nieprzewidziane kłopoty powodujące opóźnienia w sprzedaży. Gdyby tak się stało, cała teza inwestycyjna przesunie się z 2027 na 2028 rok.

Drugie zagrożenie jest takie, że najwięksi klienci Nvidii (Alphabet, Meta, Amazon, Microsoft), którzy odpowiadają za około połowę przychodów spółki, będą dalej pracować nad własnymi rozwiązaniami, aby uniezależnić się od Nvidii.

Rozwiązania tego problemu są dwa i nad oboma Nvidia mocno się pochyliła.

Po pierwsze spółka staje na głowie, żeby stworzyć chip tak dobry (Feynman), że inne projekty nie będą w stanie mu dorównać efektywnością, przez co klienci postawią na rozwiązania Nvidii ze zwykłego rozsądku i efektywności kosztowej.

Po drugie Nvidia stara się aktywnie dywersyfikować od wielkiej czwórki i coraz większą sprzedaż kieruje do tzw. Neo Cloud Providers, jak CoreWeave czy Nebius, które kupują chipy Nvidii i pakują je do operowanych przez siebie data-center, a potem leasingują moc obliczeniową innym firmom, mniejszym i większym.

Kolejnym drastycznie rosnącym segmentem klientów (+300% z roku na rok) są nie korporacje, ale instytucje i agencje rządowe poszczególnych krajów, którym Nvidia pomaga budować tzw. Sovereign AI, czyli gigantyczne lokalne data-center i niezależne modele uniezależnione od usług i produktów amerykańskich gigantów, jak Microsoft czy Alphabet.

Do tego dochodzi coraz więcej podpisywanych umów partnerskich z podmiotami odpowiedzialnymi za wprowadzanie zastosowań do dziedziny robotyki, medycyny czy farmakologii.

Czekając na kolejną rewolucję

To wszystko sprawia, że patrząc przez pryzmat tego, gdzie Nvidia jest dzisiaj, faktycznie można dojść do wniosku, że spółka nieco zaspała i przegapiła wyścig o inferencję. Ale rzeczywistość jest taka, że każda rewolucja kiełkuje po cichu, a dowiadujemy się o niej dopiero w momencie, w którym wybucha.

Nvidia ma natomiast całkiem spore doświadczenie w rewolucjach. Najpierw zrewolucjonizowała rynek gier komputerowych wprowadzając jakość grafiki na nowy poziom; potem przeprojektowując swoje układy pod kopanie Bitcoina i innych kryptowalut, na czym zarobiła miliardy dolarów; a kilka lat temu pomogła zapoczątkować rewolucję AI, dostarczając najlepsze chipy do treningu modeli sztucznej inteligencji.

Kto ma dokonać kolejnej rewolucji, jak nie ona?

Na korzyść inwestycji w akcje Nvidii przemawia też zresztą bardziej pragmatyczny fakt, a mianowicie taki, że... dzisiaj spółka jest po prostu tania (a przynajmniej w porównaniu do konkurencji). To oznacza, że nawet jeśli dywersyfikacja od największych klientów będzie wolniejsza niż się zakłada, albo produkcja Feynmana napotka na opóźnienia, to kurs akcji nie powinien spaść już o wiele niżej.

Z drugiej strony, jeśli wszystko pójdzie w zgodzie z planem, potencjał do dogonienia wycen konkurencji jest tu naprawdę znaczny.

Wykres wydania · III

Najtańsza, z największym potencjałem

Wycena (EV/EBITDA) i Upside wśród głównych spółek z koszyka „AI semis". Nvidia jako jedyna stoi po właściwej stronie obu kolumn naraz.

Spółka EV/EBITDA Upside .
NVDA 39× +25%
INTC 48× −27%
MRVL 56× −23%
AVGO 58× +10%
AMD 100× −2%
ARM 195× +12%
Źródło: Scrab.com/FactSet. EV/EBITDA na bazie TTM, Upside 1y forward. Dane na: 10 maja 2026
· · ·

Przyznam Państwu, że rzadko kiedy kłócę się z całym rynkiem i rzadko kiedy mam wrażenie, że wszyscy inni się mylą, a ja mam rację. Ale kiedy tak już się dzieje, zazwyczaj zarabiam potem na tym spore pieniądze. Czy tak będzie i tym razem?

No cóż, przekonamy się w ciągu kolejnego roku.

Do usłyszenia,
Tomasz Trela

Dubaj, 10 maja 2026