První využití AI při prognózování inflace v ČNB
1. Úvod
V tomto blogu si klademe otázku, zda a jak by využití umělé inteligence (AI) mohlo přispět ke zlepšení predikce inflace v Česku. Jedná se o první takovou úvahu v České národní bance (ČNB), a proto si zatím nedáváme za cíl tento problém vyřešit. Jde o testování a ukázku prvních možností využití AI při prognózování inflace v ČNB.
Výhodou AI modelů je, že nejsou zatíženy konkrétní ekonomickou teorií. Paradigma nové keynesiánské ekonomie či monetarismu zde nehraje roli. Tyto modely představují destilovanou zkušenost milionů lidí a pracují s petabity dat, ze kterých se učí. Přinášejí tak nový pohled na predikci inflace, který může být méně teoreticky zatížený a více orientovaný na data a jejich praktické využití. AI umožňuje analyzovat data v nebývalém rozsahu a hloubce, od historických statistik po aktuální trendy v reálném čase. Nevýhodou však je, že modely AI fungují jako „black box“ a při zpětném testování mohou lhát nebo vykazovat chyby, jako jsou „halucinace“ či nepřesné interpretace. Přesto se domníváme, že využití AI představuje slibnou cestu, jak doplnit a rozšířit stávající přístupy k prognózování inflace v ČNB.
Pro predikci inflace využijeme dvě hlavní podskupiny AI: velké jazykové modely (large language models, LLM) a modely strojového učení (pro jejich přehled viz Příloha). Konkrétně LLM modely OpenAI o1 a Grok 2 využijeme pro střednědobou predikci inflace. A metodu embeddings spadající do strojového učení využijeme pro zlepšení nowcastingu inflace (tzn. k odhadu současné, dosud nepublikované inflace).
2. První využití AI při střednědobé predikci inflace v ČNB
První možností je využití velkých jazykových modelů LLM pro střednědobé predikce inflace. Metodicky zde vyjdeme z článku Faria-e-Castro a Leibovici (2024). Novější velké jazykové modely mají přístup k tisícům aktuálních dat, jako jsou makroekonomické statistiky, zprávy a ekonomické výhledy. Ty mohou být využity k tvorbě vlastních predikcí inflace. Stačí se zeptat, jakou inflaci model očekává v následujícím roce, a jazykový model odpoví.
Nás zde zajímá, jak dobře mohou velké jazykové modely prognózovat inflaci. Pro tento experiment jsme využili dva špičkové modely: OpenAI o1 od OpenAI a Grok 2 od společnosti x.AI. Od obou modelů jsme chtěli, aby předpověděly meziroční inflaci v Česku na rok dopředu. Každému modelu jsme pro každé čtvrtletí od 1Q2019 do 3Q2024 zadali následující otázku:
„Předpokládej, že jsi v čase ?? a nejsou ti poskytnuty žádné další pozdější informace. Uveď, prosím, svou vlastní nejlepší prognózu meziroční sezónně neočištěné inflace CPI v ČR na příští rok. Uveď, prosím, číselné hodnoty pro tyto prognózy. K formulaci těchto prognóz nepoužívej žádné informace, které jsi neměl k dispozici ke dni ??.“
Proměnná ?? představuje jednotlivá čtvrtletí v období od 1Q2019 do 3Q2024.
Na základě tohoto dotazu jsme od AI získali predikce inflace pro následující rok. Pojďme se nyní podívat, jak AI modely obstály ve srovnání se skutečně pozorovanou inflací, prognózami analytiků finančních trhů a prognózami hlavního modelu ČNB. Měřítkem bude ukazatel RMSE (root mean square error), který vyjadřuje průměrnou velikost predikční chyby, přičemž vyšší hodnota RMSE značí větší odchylku mezi predikovanými a skutečnými hodnotami.
Celkovou chybovost prognóz AI modelů a analytiků shrnuje Tabulka 1. Na celém období dosáhl nejvyšší přesnosti model OpenAI o1 (RMSE = 5,28). Předčil model ČNB (RMSE = 5,48). Zatímco OpenAI o1 se ukázal jako lepší při prognózování inflace během jejího růstu, hlavní model ČNB vykazoval vyšší přesnost v období návratu inflace zpět k 2% cíli ČNB. V období stabilní inflace byl nejpřesnější model Grok 2.
Tabulka 1 – Chybovost prognózy inflace na rok dopředu pomocí metriky RMSE
Tabulka představuje RMSE odchylku prognóz inflace dvou testovaných AI modelů (OpenAI o1, Grok 2), analytiků finančního trhu a hlavního modelu ČNB od skutečně pozorované CPI inflace jeden rok dopředu. Sledované prognózy byly připraveny v období od 1Q2019 do 3Q2023, tj. prognózy odpovídají obdobím od 1Q2020 do 3Q2024. Pro srovnání byla využita CPI inflace s čtvrtletní frekvencí.
Období
(začátek– konec) |
Celkem
(1Q2020–3Q2024) |
Stabilní inflace
(1Q2020–1Q2021) |
Vysoká inflace
(2Q2021–1Q2023) |
Návrat k 2% cíli
(2Q2023–3Q2024) |
---|---|---|---|---|
OpenAI o1 | 5,28 | 1,09 | 7,94 | 1,81 |
Grok 2 | 6,19 | 0,50 | 9,05 | 3,45 |
Analytici finančního trhu | 6,63 | 0,96 | 9,99 | 2,31 |
Hlavní model ČNB | 5,48 | 0,79 | 8,41 | 0,50 |
Zdroj: autoři, ČNB
V Grafu 1 a Grafu 2 zobrazujeme detailněji výsledky AI modelů ve srovnání s analytiky finančního trhu. Grafy zobrazují prognózy inflace od AI modelů na rok dopředu pro celé sledované období (od 1Q2019 do 3Q2024) a porovnávají je se skutečně pozorovanou inflací CPI. V grafech tak ukazujeme tři klíčové prvky: i) červené body, které představují prognózy inflace od AI modelů, ii) modrou čáru představující skutečně pozorovanou meziroční inflaci a navíc přidáváme iii) žluté čáry představující prognózy analytiků finančního trhu. V grafu také pomocí šedých čar ukazujeme trajektorii inflace, kterou model OpenAI o1 předpovídal pro různá období.
Abychom mohli predikce správně porovnat, posunuli jsme prognózu analytiků finančního trhu o rok dopředu. Díky tomu obě prognózy v Grafech 1 a 2 ukazují výhled inflace, který byl vytvořen 12 měsíců předem. Pokud se prognóza (červené body nebo žlutá čára) shoduje s pozorovanou inflací (modrá čára), znamená to, že prognóza správně odhadla vývoj inflace. Pokud je prognóza pod modrou čarou, inflace byla prognózou podhodnocena, a pokud nad ní, byla nadhodnocena.
Graf 1 – Prognóza inflace na rok dopředu s AI modelem OpenAI o1 a pozorovaná inflace
Graf zobrazuje prognózy pozorované inflace (výhled před 12 měsíci) vytvořené modelem OpenAI o1 (červené body) a analytiky finančního trhu (žlutá čára). Tyto prognózy byly vždy sestaveny 12 měsíců před daným obdobím. Pro srovnání přesnosti predikcí slouží skutečně pozorovaná CPI inflace (modrá čára) s měsíční frekvencí. Trajektorie inflace predikovaná modelem OpenAI o1 je navíc znázorněna šedou čarou, která ilustruje její odhadovaný vývoj v čase.
Zdroj: autoři, ČNB
Graf 1 představuje prognózu pomocí AI modelu OpenAI o1. Ukazuje se, že během období relativně stabilní inflace (2019–2020) se prognózy modelu OpenAI o1 a analytiků finančního trhu shodovaly. Obě prognózy očekávaly, že inflace se rychle vrátí k cíli ČNB. Situace se však dramaticky změnila v letech 2021–2022, kdy došlo k prudkému nárůstu inflace, který nedokázala přesně předpovědět ani jedna z metod.
Model OpenAI o1 nicméně začal signalizovat možnost dalšího růstu inflace dříve a jeho prognózy naznačovaly perzistentní růst po většinu roku 2021. Naopak predikce analytiků finančního trhu ukazují, že vyšší inflaci analytici považovali za krátkodobý výkyv, po kterém očekávali rychlý návrat k cíli. Ani analytici, ani OpenAI o1 však nebyli schopni správně odhadnout skutečnou výši inflace během této doby. Celkově výsledky naznačují, že by model OpenAI o1 mohl sloužit jako jeden z indikátorů signalizujících budoucí růst inflace.
Pojďme se nyní zaměřit na druhý testovaný AI model – Grok 2. Z Grafu 2 je zřejmé, že Grok 2 více kopíruje prognózy analytiků finančního trhu, a to jak v období stabilní inflace, tak během jejího růstu. Prognózy Grok 2 nicméně nejsou zcela totožné, což může naznačovat, že model se jimi „tajně“ neinspiroval. Je to patrné především u konce roku 2023 a začátku roku 2024. V tomto období Grok 2 očekával, že se inflace bude déle udržovat na vyšších hodnotách, zatímco analytici finančního trhu – v souladu se skutečným vývojem –předpokládali rychlý pokles inflace směrem k 2% cíli.
Graf 2 – Prognóza inflace na rok dopředu s AI modelem Grok 2 a pozorovaná inflace
Graf zobrazuje prognózy pozorované inflace (výhled před 12 měsíci) vytvořené modelem Grok 2 (červené body) a analytiky finančního trhu (žlutá čára). Tyto prognózy byly vždy sestaveny 12 měsíců před daným obdobím. Pro srovnání přesnosti predikcí slouží skutečně pozorovaná CPI inflace (modrá čára) s měsíční frekvencí. Trajektorie inflace predikovaná modelem Grok 2 je navíc znázorněna šedou čarou, která ilustruje jeho odhadovaný vývoj v čase.
Zdroj: autoři, ČNB
Rozdíly mezi modely Grok 2 a OpenAI o1 naznačují, že schopnost AI predikovat inflaci se může výrazně lišit v závislosti na konkrétní architektuře modelu. OpenAI o1 dokáže lépe vyhodnocovat dostupné informace, protože je zpracovává opakovaně, než odpoví na otázku. Naopak Grok 2 odpovídá okamžitě a bez uvažování. Zásadním problémem obou modelů nicméně je, že se jedná o „black boxy“ – přesně nevíme, jak došly ke svým závěrům. Nevíme například, jaké předpokládají úrokové sazby, kurz a podobně. Také různé generace modelů mohou přemýšlet odlišně.
Mezinárodní srovnání a další metody pro střednědobou predikci inflace
Co se týče mezinárodního srovnání v metodách střednědobé predikce inflace, analytici z Fedu Faria-e-Castro a Leibovici (2024) rovněž ukázali, že velké jazykové modely mohou odhadovat vývoj inflace lépe než profesionální analytici. Pro analýzu období let 2019–2023 použili PaLM model od Googlu, který byl přesnější ve většině let a téměř ve všech časových horizontech. Problémem těchto odhadů nicméně je opět, že není úplně jasné, jak AI k daným predikcím dospěla – fungují totiž jako „black box“. Přesto může jít o cenný doplněk k již existujícím průzkumům inflačních očekávání, jaké získáváme od finančního trhu, domácností a podniků.
Další využití AI pro střednědobou predikci nabízejí modely strojového učení. Pokročilé metody zahrnují rozhodovací stromy (například Random Forest), které dokážou zpracovat velké množství vstupních proměnných, jako jsou ceny surovin, úrokové sazby či spotřebitelská důvěra. Gradient Boosting Machines, včetně XGBoost nebo LightGBM, se díky své přesnosti obzvláště hodí pro predikci krátkodobých inflačních tlaků. Je to výzva pro další výzkum. ECB je využívá jako doplňkový odhad vedle hlavního modelu. Hlavní výhodou těchto metod je schopnost zachytit nelineární vztahy a dynamiku inflace, což je klíčové především při náhlých šocích, jako bylo období covid-19 a následný růst cen. Lenza et al. (2023) z ECB používají nejnovější variantu strojového učení, quantile random forests, které umožňují nejen odhadovat budoucí vývoj inflace, ale také kvantifikují nejistotu odhadů. Díky tomu mohou bankovní rady lépe zvážit rizika spojená s inflací a získat detailní přehled o možných scénářích vývoje inflace, včetně těch extrémních. S modely strojového učení také experimentují mj. v BIS (Kohlscheen, 2021), IMF (Liu et al., 2024), Bank of England (Joseph et al., 2022) nebo Bank of Brasil (Boaretto a Medeiros, 2023).
3. První využití AI při nowcastingu inflace v ČNB
Druhou možností využití umělé inteligence je nowcasting, tedy odhad současné, dosud nepublikované inflace. Již dnes v rámci monitoringu cenového vývoje sledujeme v ČNB denní vývoj cen potravin pomocí milionů automaticky získávaných dat z internetu (tzv. web scraping).
Nicméně centrální banky po celém světě nevyužívají plný potenciál dostupných dat. Jedním z hlavních omezení totiž je, že u některých produktů známe pouze jejich marketingový název, ale tradiční metody mají potíž s tím přesně určit, do které kategorie spotřebního koše tyto produkty patří.
V současné době se k řazení produktů používá například ex ante přístup, kdy se při stahování cen produkty zařazují do kategorií spotřebního koše podle toho, v jaké sekci e-shopu jsou nabízeny. Tento přístup však má svá omezení – například potraviny určené pro děti mohou obchody prodávat v kategorii „pro děti“, což znemožňuje jejich jednoznačné zařazení do potravinové kategorie spotřebního koše. Alternativní metoda spočívá ve vytvoření vlastní knihovny produktů na základě klíčových slov, avšak tento přístup je extrémně časově náročný a naráží na omezenou flexibilitu.
Řešením může být metoda embeddings, která je páteří každého velkého jazykového modelu. Metoda embeddings funguje tak, že názvy produktů se převedou do číselné podoby (vektorů), kterou může zpracovat počítač. Názvy produktů s podobným významem budou mít podobnější čísla ve vektoru a tak budou blíže u sebe. Je to tím, že embeddings nespojují slova pouze na základě podobnosti slov, ale chápou jejich významy (například restaurace a kavárna jsou obě provozovny služeb, zatímco restaurace a traktor nemají příliš společného – budou mít méně podobné vektory). Díky tomu můžeme spojovat text s podobným významem dohromady.
Díky embeddings můžeme přetvořit chaos stamilionů online produktů do jasně definovaných kategorií spotřebního koše a posunout naše predikce inflace na zcela novou úroveň přesnosti a efektivity.
V Grafu 3 ilustrujeme celou myšlenku. Uvažujme tři produkty: „Dr. Halíř máslo“, „iPhone 16“ a „olivový olej“. Tyto tři produkty převedeme pomocí embeddings z AI modelů do vektoru čísel. Na levé straně grafu jsou tyto produkty zobrazeny ve vektorovém prostoru (každé číslo vektoru reprezentuje jednu osu, tj. jednu dimenzi). Již zde je patrné, že Dr. Halíř máslo a olivový olej jsou si více podobné a jsou si tedy blíže, zatímco iPhone 16 se nachází dále od ostatních produktů. Není jim totiž tak podobný. Na pravé straně grafu přidáváme dvě kategorie spotřebního koše – „oleje a tuky“ a „mobilní telefony“. Každá z těchto kategorií má opět své místo ve vektorovém prostoru a určitou vzdálenost od produktů. Nejmenší vzdálenost mezi každým produktem a kategorií (vyznačená šipkami) znamená, že produkt spadá do této kategorie. V našem případě se tak máslo a olivový olej vážou ke kategorii „oleje a tuky“, zatímco iPhone 16 k „mobilním telefonům“.
Graf 3 – Využití embeddings pro kategorizaci produktů do spotřebních košů
Levý graf zobrazuje pozice tří produktů ve vektorovém prostoru o třech dimenzích vytvořeném pomocí embeddings (Dr. Halíř máslo, olivový olej, iPhone 16). Pravý graf navíc ukazuje pozice dvou kategorií produktů (mobilní telefon, oleje a tuky). Šipky označují nejkratší vzdálenost mezi každým produktem a příslušnou kategorií. Oranžově jsou znázorněny produkty, modře kategorie. Osy představují embeddings vektorový prostor, který má v tomto případě tři dimenze. Osy reprezentují blízkost textu vůči jinému textu.
Zdroj: autoři
Tento proces můžeme zopakovat na všechny produkty, jejichž ceny získáme z internetu. Zmíněný produkt Dr. Halíř máslo nebo iPhone 16 převedeme na vektor čísel pomocí pokročilých AI modelů. Tyto vektory následně porovnáme s vektory reprezentujícími jednotlivé kategorie spotřebního koše, jako jsou „oleje a tuky“ nebo „mobilní telefony“. Na základě těchto porovnání pak dokážeme přesně zařadit produkty do správných kategorií a využít jejich ceny k nowcastingu. S tímto přístupem nyní začala experimentovat BIS v projektu Spectrum.
Pojďme se nyní podívat na praktický příklad na českých datech. Z českého internetového obchodu společnosti Tesco jsme stáhli tisíce produktů, které chceme s pomocí AI utřídit do jednotlivých kategorií spotřebního koše a zapojit tak online data do nowcastingu inflace. Jednotlivé produkty jsme zanalyzovali pomocí nejlepších embeddings na trhu (model text-embedding-3-large), opatřili je popisky pomocí ChatGPT 4o-mini a ty převedli do číselné podoby a přiřadili ke kategoriím spotřebního koše.
Graf 4 – Různé produkty nabízené v Tescu segmentované do kategorií spotřebního koše
Graf zobrazuje produkty nabízené v Tescu v embeddings vektorovém prostoru o třech dimenzích (tři osy). Každý produkt je na počátku pomocí embeddings popsán 3 072 čísly, tj. je tvořen 3 072 dimenzemi. Abychom data mohli vizualizovat, zredukovali jsme počet dimenzí na tři pomocí principal components metody. Tři osy v grafu reprezentují první, druhou a třetí komponentu embeddings dimenzí. Osy charakterizují podobnost produktu s jiným produktem: čím blíže jsou body u sebe, tím jsou si podobnější. Produkty v jedné kategorii spotřebního koše mají specifickou barvu – žlutá označuje produkty v kategorii „oleje a tuky“ (např. máslo), zelená v kategorii „nealkoholické nápoje“ (např. minerální a ochucené vody), oranžová v kategorii “piva” a šedá ostatní kategorie.
Zdroj: produkty nabízené v obchodě Tesco dne 17. ledna 2025.
Graf 4 ukazuje pozice jednotlivých produktů ve vektorovém prostoru. Body zde reprezentují každý jeden produkt. Barevně pak odlišujeme kategorie spotřebního koše, do kterých byly produkty přiřazeny. Vybrali jsme tři: oleje a tuky, nealkoholické nápoje a piva. Graf dobře ukazuje, že produkty v jednotlivých kategoriích se nachází blízko u sebe. Dokonce jednotlivé kategorie spotřebního koše, které jsou si podobnější, jsou blíže u sebe.
Přiřazení produktů do spotřebního koše pomocí embeddings jsme také porovnali s ex ante metodou (metoda přiřazení kategorie spotřebního koše podle kategorie, ve které je produkt nabízen v Tescu). Na běžné úrovni detailu se obě metody shodovaly v 89,2 % případů. Embeddings metoda tak ukazuje významný potenciál. Navíc je robustnější než ex ante metoda a výsledky lze dále výrazně zlepšovat. V Tabulce 2 pak ukazujeme, jak se embeddings metoda shodovala s ex ante metodou na všech dostupných úrovních spotřebního koše.
Tabulka 2 – Shoda řazení produktů do spotřebního koše pomocí embeddings a ex ante metody
Tabulka ukazuje, jak moc se shoduje zařazení produktů do spotřebního koše pomocí dvou různých metod: embeddings metody, která využívá AI pro automatické přiřazení produktů, a ex ante metody, kde je produkt zařazen podle kategorie, ve které jej prodává Tesco. Přiřazení produktů do spotřebního koše lze dělit podle různých úrovní detailu – na nejvyšší úrovni jsou produkty zařazeny do širokých kategorií, jako jsou „potraviny a nealkoholické nápoje“, zatímco na nejnižší úrovni se jedná o velmi konkrétní rozdělení, například „másla a margaríny“. Tabulka demonstruje, jak dobře se tyto dvě metody shodují při přiřazování všech nabízených produktů Tesca na každé úrovni detailu spotřebního koše.
Úroveň detailu spotřebního koše | Příklad kategorie v rámci spotřebního koše | Kód kategorie | Shoda mezi embeddings a ex ante metodou |
---|---|---|---|
1. úroveň (nejširší) | Potraviny a nealkoh. nápoje | E01 | 99,7 % |
2. úroveň | Potraviny | E01.1 | 98,5 % |
3. úroveň | Oleje a tuky | E01.15 | 89,2 % |
4. úroveň (nejdetailnější) | Másla a margaríny | E01.151 | 80,1 % |
Zdroj: autoři, ČNB
Díky embeddings můžeme dostat řádově více položek do přesných kategorií definovaného spotřebního koše a v následném kroku připravit prognózu spotřebitelské inflace.
Co se týče mezinárodního srovnání, BIS společně s ECB a Bundesbankou v listopadu 2024 zahájila projekt Spectrum (externí odkaz), který má za cíl vylepšit nowcasting s pomocí AI. V Polsku (Macias et al., 2023) stahují data z obchodů již od roku 2009 – nicméně k nowcastingu zatím používají pouze 25 % stažených dat. V Rakousku (Beer et al., 2024) pak jsou schopni využít pouze 13 % stažených dat. I přesto jsou již nyní schopni zlepšit nowcasting inflace. Vedle toho ECB rozvíjí vlastní výzkumnou síť Prisma (externí odkaz), se kterou jsou experti ČNB dlouhodobě v kontaktu, a máme tak možnost stavět na nejnovějších poznatcích a aplikovat je v Česku. AI zde může zlepšit, jak využíváme data z internetu pro přesnější nowcasting. Dalšími příklady nowcastingu jsou Knotek a Zaman (2024) nebo Schnorrenberger et al. (2024).
4. Závěr, možnosti a omezení AI
V článku uvádíme dva příklady využití AI při prognózování inflace – střednědobou predikci inflace pomocí modelu LLM a nowcasting pomocí metody embeddings.
Závěry:
(1) Jazykové modely ChatGPT a Grok dokázaly vytvořit predikce inflace, které byly v některých obdobích úspěšnější než profesionální analytici i než samotný model ČNB
Náš experiment ukázal, že pokročilé jazykové modely byly obzvláště úspěšné při zachycení změn trendů, například prudkého nárůstu inflace. Tyto modely mohou sloužit jako cenný nástroj pro identifikaci potenciálních rizik spojených s inflačními tlaky. Přesto je třeba zdůraznit, že AI zatím nelze považovat za plnohodnotnou náhradu tradičních predikčních metod. Hlavní překážkou zůstává charakter „black box“, kdy není možné přesně určit, které faktory vedly k prognózám. Modely navíc vykazují omezenou spolehlivost mimo vzorek dat, na kterých byly trénovány. Prognózy obsahují prvek náhody, což ztěžuje jejich replikovatelnost a zvyšuje nutnost odborné kontroly výsledků. Podobně analytici z Fedu Faria-e-Castro a Leibovici (2024) ukázali, že model PaLM od Googlu byl přesnější ve většině let a téměř ve všech časových horizontech než profesionální analytici. Identifikovali ale i podobná rizika využití současné generace AI.
(2) AI má potenciál výrazně zpřesnit nowcasting inflace díky přesnému rozdělení milionů internetových cen do spotřebitelského koše
Naše výsledky ukázaly, že pomocí metod, jako jsou embeddings, lze zpracovat a kategorizovat rozsáhlé množství dat z internetových obchodů, což přináší přesnější odhady aktuálních inflačních tlaků. Embeddings jsou technika, která převádí textové informace, jako jsou názvy produktů nabízených na internetu, do číselné podoby. Díky tomu lze produkty se stejným nebo podobným významem (například „máslo“ a „olej“) seskupit do příslušné kategorie spotřebitelského koše, zatímco produkty odlišné (například „máslo“ a „telefon“) budou od sebe vzdáleny. Tato metoda umožňuje efektivnější třídění nestrukturovaných dat a jejich využití při odhadu spotřebitelské inflace.
(3) Současná generace AI je vhodná jako podpora analytiků
I přes svá omezení přináší AI významnou podporu pro analytickou práci. Zrychluje zpracování dat, umožňuje vytvářet alternativní prognózy a poskytuje další úhly pohledu na vývoj střednědobé inflace. Tím zlepšuje kvalitu analytických procesů a podporuje rozhodování na základě širšího spektra informací.
(4) Výzvou v oblasti AI je poskytnutí střednědobé predikce inflace založené na stovkách makroekonomických ukazatelů – strojové učení
V ČNB vzniká hlavní scénář prognózy na základě DSGE modelu g3+. Model ale vykázal v letech 2021–2023 relativně vyšší chybovost predikce inflace na rok dopředu měřenou RMSE než modely Bank of England, ECB, švédské Riksbank nebo norské Norges Bank. Od ledna letošního roku pracujeme na novém semistrukturálním modelu jako alternativě k dosavadnímu hlavnímu modelu. Tato diverzifikace modelového rámce navazuje na doporučení z loňského externího posouzení. Vedle toho můžeme tyto modely doplnit i prognózami pomocí strojového učení, které jsou schopné lépe poukázat na makroekonomické zlomy (viz přehled literatury v Příloze). Modely strojového učení mohou odhalit skryté vztahy v historických datech a přispět k přesnějším predikcím makroekonomických změn. Tyto metody dokážou identifikovat vzorce v historických vztazích mezi stovkami časových řad. Evropská centrální banka je využívá jako doplněk k tradičním makroekonomickým modelům, aby ověřila robustnost prognóz svého hlavního modelu (Lenza et al., 2023).
(5) Kvalitní a široká datová základna je nezbytným předpokladem pro jakýkoliv model založený na metodách AI
Úspěšná implementace metod AI vyžaduje spolehlivá a kvalitní data. Modely trénované na výstupech předešlých generací mohou postupně ztrácet schopnost správně odpovídat, což zdůrazňuje význam dostupnosti a přesnosti dat (Shumailov et al., 2024). V ČNB proto klademe důraz na přesnost a dostupnost dat v našem veřejném prezentačním systému ARAD a zlepšujeme procesy sdílení informací napříč institucí prostřednictvím interního datového skladu. Centralizovali jsme ekonomický výzkum ČNB ze dvou sekcí, ze sekce měnové a ze sekce finanční stability, do jedné sekce výzkumu a statistiky. Užší propojení se statistikou zároveň umožní efektivnější využití podkladových dat a díky těsnější spolupráci uživatelů a tvůrců statistik i zkvalitnění produkovaných datových sad.
Literatura
Beck, G. W., Carstensen, K., Menz, J.-O., Schnorrenberger, R., & Wieland, E. (2024). Nowcasting Consumer Price Inflation Using High-Frequency Scanner Data: Evidence from Germany. Working Paper No. 2024/2930, European Central Bank.
Beer, C., Ferstl, R., & Graf, B. (2024). Improving Disaggregated Short-term Food Inflation Forecasts With Webscraped Data. https://ssrn.com/abstract=5016579
Boaretto, G., & Medeiros, M. C. (2023). Forecasting inflation using disaggregates and machine learning. https://arxiv.org/abs/2308.11173
Faria-e-Castro, M., & Leibovici, F. (2024). Artificial Intelligence and Inflation Forecasts. Working Paper 2023, 15, Federal Reserve Bank of St. Louis.
Joseph, A., Potjagailo, G., Kalamara, E., Chakraborty, C., & Kapetanios, G. (2022). Forecasting UK inflation bottom up (Staff Working Paper No. 915). Bank of England.
Knotek II, E. S., & Zaman, S. (2024). Nowcasting Inflation. Federal Reserve Bank of Cleveland, Working Paper No. 24-06.
Kohlscheen, E. (2021). What does machine learning say about the drivers of inflation? (Working Paper No. 980). Bank for International Settlements.
Lenza, M., Moutachaker, I., & Paredes, J. (2023). Density forecasts of inflation: a quantile regression forest approach (Working Paper Series No. 2830). European Central Bank.
Liu, Y., Pan, R., & Xu, R. (2024). Mending the Crystal Ball: Enhanced Inflation Forecasts with Machine Learning (Working Paper WP/24/206). International Monetary Fund.
Macias, P., Stelmasiak, D., & Szafranek, K. (2023). Nowcasting food inflation with a massive amount of online prices. International Journal of Forecasting, 39(2), 809–826.
Shumailov, I., Shumaylov, Z., Zhao, Y. et al. AI models collapse when trained on recursively generated data. Nature 631, 755–759 (2024).
Schnorrenberger, R., Venes Schmidt, A., & Moura, G. V. (2024). Harnessing Machine Learning for Real-Time Inflation Nowcasting. De Nederlandsche Bank Working Paper No. 806.
Příloha
P1. Přehled literatury
Velké jazykové modely a strojové učení se využívají ve dvou zásadních typech predikce inflace: nowcastingu a predikci střednědobé inflace. Nejnovější články shrnujeme v následující Tabulce P.1. Ukazujeme, jaké metody autoři používají a k jakým dospěli závěrům:
Tabulka P.1 – Shrnutí literatury v nowcastingu a střednědobé predikci
Oblast | Instituce | Autoři/Projekt | Metoda | Výsledek |
---|---|---|---|---|
Nowcasting | BIS | Projekt Spectrum | Strukturování miliard produktů pomocí LLM pro nowcasting | Projekt byl zahájen v listopadu 2024 a zatím nemá výstupy |
Cleveland Fed | Knotek a Zaman (2024) | Smíšené frekvenční modely | Parsimonický smíšený frekvenční model poskytuje přesnější nowcasty pro celkovou inflaci a konkurenceschopné nowcasty pro jádrovou inflaci | |
DNB | Schnorrenberger et al. (2024) | Strojové učení s vysokofrekvenčními makrofinančními indikátory | Strojové učení zlepšuje týdenní nowcasty inflace, zejména během inflace po covid-19 | |
ECB | Beck et al. (2023) (Projekt PRISMA) | Využití MIDAS metody a strojového učení na scanner datech | Zlepšení nowcastingu celkové inflace | |
NBP | Macias et al. (2023) | Využití SARMAX modelu na webscrapovaných cenách | Zlepšení nowcastingu inflace potravin | |
OeNB | Beer et al. (2024) | Modely časových řad a strojové učení pro nowcasting z webscrapovaných cen | Rychlejší a detailnější dostupnost inflace potravin před oficiálním výsledkem | |
Střednědobá predikce | BdB | Boaretto a Medeiros (2023) | Využití individuálních cen ze statistického úřadu k predikci inflace až do 11 měsíců a testování efektivity modelů časových řad a strojového učení | Využití individuálních cen vede ke srovnatelným výsledkům oproti modelům založeným na agregátní inflaci. Metody strojového učení jsou efektivnější než klasické modely |
BIS | Kohlscheen (2021) | Random forests pro predikci inflace v 20 rozvinutých zemích | Random forests mají lepší predikční hodnotu než klasická OLS | |
BoE | Joseph et al. (2022) | Využití individuálních cen k predikci celkové inflace | Nelineární metody strojového učení jako random forests jsou efektivní především v období výrazných změn inflace | |
ECB | Lenza et al. (2023) | Quantile random forests | Zlepšené predikce se zachycením nelineární inflační dynamiky a nejistoty predikce | |
Fed | Faria-e-Castro a Leibovici (2024) | Využití genAI pro predikci US inflace | LLM byl přesnější než Survey of Professional Forecasters | |
IMF | Liu et al. (2024) | Strojové učení pro predikci postpandemické jádrové inflace v Japonsku | Metody lépe predikují vývoj inflace s nejvyšší efektivitou u LASSO přístupu |
Poznámka: BdB = Brazilská centrální banka, BIS = Banka pro mezinárodní platby, BoE = Bank of England, ECB = Evropská centrální banka, Fed = Federální rezervní systém, IMF = Mezinárodní měnový fond, NBP = Polská národní banka, OeNB = Rakouská národní banka.
P2. Přehled metod v rámci AI
Velké jazykové modely (LLM)
Velké jazykové modely (LLM) představují moderní nástroje umělé inteligence, které nacházejí široké uplatnění v různých oblastech, včetně predikce inflace.
Mezi nejvýznamnější modely této kategorie patří GPT (Generative Pre-trained Transformer) od společnosti OpenAI, zahrnující varianty jako GPT-4 a OpenAI o1. Tyto modely jsou široce implementovány v aplikacích typu ChatGPT, kde slouží pro generování textu, analýzu dat, překlad či správu konverzačních systémů. V kontextu predikce inflace nabízejí schopnost zpracovat a analyzovat rozsáhlé objemy ekonomických dat, zahrnujících makroekonomické statistiky, finanční zprávy, obsah médií či sociálních sítí, a identifikovat klíčové trendy signalizující možné budoucí cenové tlaky.
Další významný model, Grok, pochází od společnosti X.AI a je integrován s platformou X (dříve známou jako Twitter). Tento model je navržen pro analýzu textu v reálném čase a zaměřuje se na sentimentální analýzu a detekci trendů v prostředí sociálních médií. Díky těmto funkcionalitám poskytuje cenné informace o změnách nálad spotřebitelů a podnikatelských subjektů, které mohou významně ovlivnit inflační očekávání.
Pokročilé modely jako PaLM (Pathways Language Model) a Gemini od společnosti Google přinášejí další inovace. PaLM je známý svými schopnostmi hlubokého porozumění textu a integrací s produkty Google, zatímco Gemini je navržen s ohledem na autonomní agenty, kteří zvládají složité úkoly s minimální nutností lidské intervence. Tyto modely mohou být využity pro analýzu historických i aktuálních dat, jako jsou cenové trendy, geopolitické události či změny v poptávce spotřebitelů, a poskytují tak relevantní predikce ekonomických ukazatelů.
Copilot od Microsoftu je dalším příkladem praktické aplikace LLM, zejména v nástrojích, jako jsou Microsoft Office a Teams. Tento model umožňuje automatizaci administrativních úkolů, generování textových dokumentů, analýzu dat a návrh scénářů na základě široké škály ekonomických parametrů. V oblasti inflace pak může sloužit k rychlé analýze dat a tvorbě detailních ekonomických reportů.
Model Claude od společnosti Anthropic vyniká svou orientací na bezpečnost a uživatelskou přívětivost. V ČNB je Claude testován zejména pro úlohy související s psaním kódu a vývojem algoritmů, které mohou urychlit automatizaci klíčových procesů. Tento model umožňuje práci s citlivými ekonomickými daty, a to jak strukturovanými, tak nestrukturovanými, například při analýze interních dokumentů nebo zpráv o cenách. Díky těmto vlastnostem může být užitečným nástrojem nejen pro přesnější predikce inflace, ale také pro vývoj aplikací podporujících různé analytické procesy.
Metoda RAG (Retrieval-Augmented Generation) představuje další zajímavou technologii, kterou ČNB testuje v oblasti souladu dokumentů se zákonnými požadavky. Tato metoda kombinuje schopnosti jazykových modelů generovat text s možností získávat a kontrolovat relevantní informace z externích datových zdrojů. V ČNB je využívána k testování automatizované kontroly prospektů při vydávání dluhopisů, kde by mohla nahradit časově náročnou manuální kontrolu souladu s legislativou.
Volně dostupný model LLaMA (Large Language Model Meta AI) od společnosti Meta je oblíbený především v akademické sféře. Jeho flexibilita umožňuje testování alternativních přístupů k predikci inflace a výzkum komplexních ekonomických jevů na základě historických dat.
Tento výčet zdaleka nepokrývá veškeré možnosti současného dynamického rozvoje LLM. Každý z modelů přináší jedinečný přístup k analýze dat a predikci inflace, přičemž nelze jednoznačně předpovědět, který z nich se v budoucnu stane dominantním nástrojem v této oblasti.
Modely strojového učení
Vedle tradičních ekonomických přístupů nabývají na významu metody strojového učení, které otevírají nové možnosti predikce inflace a analýzy ekonomických dat. Základní metody, jako je lineární regrese, umožňují jednoduchou analýzu vztahů mezi makroekonomickými ukazateli, například vlivu mezd či nezaměstnanosti na inflaci. Logistická regrese je pak vhodná k modelování pravděpodobnosti překročení určitých inflačních cílů.
Pokročilé metody zahrnují rozhodovací stromy, jako je Random Forest, které dokážou analyzovat velké množství proměnných, například ceny surovin, úrokové sazby či spotřebitelskou důvěru. Tyto metody se ukazují jako užitečné zejména při identifikaci klíčových faktorů ovlivňujících krátkodobé inflační tlaky. Gradient Boosting Machines jako XGBoost nebo LightGBM poskytují vyšší predikční přesnost, což je důležité při krátkodobých odhadech inflace v turbulentních obdobích, jako jsou ekonomické šoky nebo změny v měnové politice.
Speciální místo mezi metodami predikce má model MIDAS (Mixed Data Sampling), který umožňuje kombinovat data s různou frekvencí – například denní ceny ropy s měsíčními statistikami nezaměstnanosti. Tato metoda je mimořádně užitečná při nowcastingu inflace, protože integruje aktuální data s tradičními makroekonomickými ukazateli. V ČNB by tato metoda mohla být využita k rychlejším odhadům současné inflace na základě širokého spektra datových zdrojů.
Další pokročilou metodou je SARMAX (Seasonal AutoRegressive Moving Average with eXogenous variables), která zohledňuje sezónní vlivy a externí proměnné, což je zásadní při predikci inflace v oblastech, jako jsou ceny potravin nebo energií. V ČNB se SARMAX může uplatnit například při modelování vlivu sezónních faktorů na celkový inflační vývoj.
Bayesovské modely jako Naive Bayes a bayesovské sítě umožňují modelovat pravděpodobnostní závislosti mezi ekonomickými faktory. Naive Bayes je často využíván pro rychlou klasifikaci textových dat, například analýzu sentimentu ve zprávách médií, zatímco bayesovské sítě poskytují hlubší pohled na příčiny a důsledky inflačních jevů.
Reinforcement learning, například Q-learning, může být použit k simulaci různých scénářů měnové politiky a jejich dopadů na inflaci. Tento přístup umožňuje centrálním bankám optimalizovat rozhodování při reakcích na inflační tlaky.
Další významné přístupy zahrnují AutoML a meta-learning, které automatizují výběr a optimalizaci modelů, čímž urychlují proces predikce inflace a umožňují efektivnější využití dostupných dat. Neuronové sítě a techniky hlubokého učení navíc poskytují možnost analýzy složitých časových řad, například při sledování cen zboží a služeb nebo při modelování makroekonomických ukazatelů.
Důležitou roli hrají také dimenzionalitní a shlukovací metody. K-means clustering umožňuje seskupování regionů nebo trhů s podobnými inflačními vzorci, zatímco Principal Component Analysis (PCA) zjednodušuje komplexní datové sady a identifikuje klíčové faktory ovlivňující inflaci. Tyto metody se v ČNB aktivně využívají při tvorbě makroekonomických analýz a při interpretaci výsledků modelování.
Více zpráv k tématu Inflace
Poslední zprávy z rubriky Makroekonomika:
Přečtěte si také:
Obrázky na stránce
Příbuzné stránky
- Inflace - 2020, míra inflace a její vývoj v ČR , Meziroční inflace v %
- Kurzy ČNB - Kurzovní lístek České Národní Banky
- Kurzy historie, kurzovní lístek ČNB 23.11.2020, historie kurzů měn
- Graf USD / Kč, ČNB, grafy kurzů měn
- Kurzy měn - kurzovní lístek ČNB
- Graf EUR / Kč, ČNB, grafy kurzů měn
- Graf CHF / Kč, ČNB, grafy kurzů měn
- Kurzy historie, kurzovní lístek ČNB 24.11.2020, historie kurzů měn
- Graf PLN / Kč, ČNB, grafy kurzů měn
- Graf GBP / Kč, ČNB, grafy kurzů měn
- Graf RUB / Kč, ČNB, grafy kurzů měn
- Graf EUR a USD/ Kč, ČNB, grafy kurzů měn
Prezentace
12.02.2025 iPhone 16 Pro za 699 Kč! Nová služba nemá v…
29.01.2025 Xiaomi má nový bestseller. Je extrémně nadupaný a
28.01.2025 České firmy stále častěji místo banky…