ČEPS implementovala prostředky pro využívání umělé inteligence
Česká energetika v posledních letech prochází velkými změnami ve způsobu využívání a shromažďování dat mezi jednotlivými účastníky trhu. Zejména objem vyměňovaných dat zásadně roste. ČEPS, a.s., jako výhradní provozovatel přenosové soustavy ČR vidí velký potenciál ve vznikajících „energetických big datech“ a aktivně se zabývá jejich efektivním využíváním pomocí metod umělé inteligence (AI) již od roku 2020.

ABSTRACT: The operator of the Czech transmission system, ČEPS, is moving from pilot studies to the deployment of artificial intelligence tools for network modelling and transmission system loss prediction. The implementation of the models will begin in 2023, while work continues in other areas where deploying AI makes sense.
OD PRŮZKUMU K REALIZACI
Pilotní projekt ARTIC měl za cíl prozkoumat aktuální stav technik a poznání AI, posoudit využitelnost pro provozovatele přenosové soustavy a připravit první modely AI k nasazení do praxe. V roce 2020 proběhly první dvě etapy, nyní přinášíme shrnutí těch zbývajících, které interní projektový tým od té doby zrealizoval.
Obrázek č. 1: Schéma postupu nasazení umělé inteligence v ČEPS, a.s.
Modely AI vytvořené ve studii proveditelnosti představovaly ucelený experiment, který ověřil potenciál pro rozpracování do produkčního řešení. Pro zajištění efektivního vývoje a správy modelů byla ve spolupráci s firmou IBM vytvořena metodologie řízení životního cyklu projektů AI. Přehled nejdůležitějších kroků při realizaci projektů AI ilustruje obrázek 2. Pro oblast umělé inteligence jsme zvolili specifickou formu DevOps principu nazývanou MLOps, která byla upravena na míru specifickým potřebám technologické infrastruktury provozovatele přenosové soustavy (PS). Metodologie je navržena tak, aby zejména pro úlohy z oblasti řízení PS byla provedena důkladná analýza přínosů a rizik a aby byl pečlivě řízen postup nasazení do praxe. Dále umožňuje v krátkém čase efektivně identifikovat vhodnost použití AI pro daný případ užití a zapojení klíčových expertů do jeho vývoje při využití standardizovaných nástrojů a postupů. Tři velmi odlišné pilotní případy užití, které jsme představili v článku v PRO-ENERGY magazínu v č. 1/2021, metodologii důkladně prověřily a výsledný stav tak umožní společnosti efektivně řídit implementaci AI v jakékoliv technologické oblasti.
Obrázek č. 2: Etapy realizace projektů AI
INFRASTRUKTURA PRO SPRÁVU A ROZVOJ MODELŮ AI
Realizace projektů AI podle naší metodologie vyžaduje technologické zázemí, ve kterém je možné:
-
ukládat a třídit data,
-
provádět datové analýzy,
-
vytvářet nové modely umělé inteligence či upravovat stávající,
-
nasazovat modely umělé inteligence do praxe a využívat jejich výstupy a
-
monitorovat běh a vyhodnocovat stanovené indikátory.
Na základě detailní analýzy dostupných řešení jsme se v ČEPS rozhodli pro následující koncepci:
-
maximální využití open source nástrojů, které se běžně využívají pro úlohy AI (MLflow, ELK Stack, MongoDB),
-
úplná virtualizace (databáze vstupních a výstupních dat, analytické a vývojové prostředí, monitorovací server, správa modelů AI a zdrojových kódů),
-
využití programovacího jazyka Python pro všechny skripty,
-
napojení na existující SW ve společnosti (MS SQL, XWiki).
Takto nastavené prostředí umožní využití AI pro celou škálu úloh, je jednoduše adaptovatelné a umožnuje interakci mezi klíčovými experty. Open Source řešení dovoluje další interní rozvoj těchto nástrojů a zjednodušuje spolupráci s externími partnery.
Podle výše uvedené metodiky byly ve spolupráci s výzkumným centrem NTIS (https://www.ntis.zcu.cz/) vyvinuty první modely AI při využití interního prostředí. Součástí řešení tří prototypů byl návrh datových struktur, analytické činnosti spojené s transformací dat a definicí příznaků pro model AI, návrh datových pump, návrh a tvorba modelu AI a dokumentace celého řešení. Rozdílnost jednotlivých úloh byla zásadní a pro každou jsme museli využít rozdílné přístupy.
Obrázek č. 3: Základní architektura prostředí pro správu modelů AI
HODNOCENÍ KVALITY MODELU SÍTĚ
Pro spolehlivé dispečerské řízení je zcela nezbytné pracovat s kvalitním modelem energetické sítě. Model se skládá z energetických objektů (vedení, transformátorů, generátorů, spotřeb a dalších), signalizací stavu spínacích prvků a z měření fyzikálních veličin a je zásadním vstupem do rozhodování o řízení přenosové soustavy. Velikost modelu (tj. jak velké území zahrnuje) má přímý vliv na přesnost energetických výpočtů. Součástí výpočetního modelu ČEPS je proto síť ČR a přiměřené okolí. Rozsah modelu sítě v řídicím systému ČEPS ilustruje obrázek 4. V současnosti model zahrnuje přibližně 7 500 energetických objektů a 33 000 měřicích bodů, které jsou vzájemně provázané a aktualizované v reálném čase.
Obrázek č. 4: Model sítě v řídicím systému ČEPS
Nicméně, model PS skutečnou PS pouze aproximuje. Obsahuje chyby (odchylky modelu od skutečnosti), které je nutné včas identifikovat a co nejdříve opravit. Vzhledem k ohromnému množství dat a jejich změnám v reálnem čase slibovalo využití AI pro identifikaci chyb zásadní vylepšení kvality modelu. Mezi nejčastější chyby modelu se řadí:
-
náhodné chyby měření,
-
hrubé chyby měření – svojí velikostí se vymykají předpokládané náhodné chybě,
-
chyby v topologii sítě – např. nesprávný stav zapnutí nebo vypnutí větve v důsledku nesprávné stavové signalizace,
-
chyby pasivních parametrů – např. chybná admitance vedení,
-
chyby převodů transformátorů – chybná hodnota odbočky transformátoru.
Náhodné chyby měření jsou z modelu odstraněny pomocí výpočtu stavové estimace, která každou minutu hledá nejpravděpodobnější stav modelu PS. Výpočtem se snaží najít takové hodnoty pro všechny proměnné v modelu, které odpovídají fyzikálním zákonům a zároveň mají co možná nejmenší rozdíl proti hodnotám naměřeným. Z matematického hlediska se jedná o optimalizační úlohu řešenou metodou vážených nejmenších čtverců. V současnosti tak umíme náhodné chyby měření úspěšně opravovat.
Pro chyby 2–5 jsme vytvořili model AI, jehož úkolem bylo chybu odhalit a klasifikovat. Pro realizaci a natrénování klasifikátorů byl zvolen přístup multi-label klasifikace. Cílové příznaky v tomto případě reprezentuje sada binárních výstupů indikujících, zda se v daném čase na daném prvku vyskytuje chyba daného typu, nebo nikoli. Přestože v simulovaných datech se vyskytuje na každém prvku nejvýše jedna chyba, takto zvolená reprezentace úlohy umožňuje výstup, který indikuje více chyb zároveň na jednom prvku v daném časovém řezu.
Dostupná data pro trénování modelu obsahovala přibližně 5 700 výskytů událostí různých typů chyb (2–5). Každý výskyt reprezentovala časová řada, která obsahovala šest (minutových) řezů před navozením chyby a šest řezů navazujících. Datová sada pro jednotlivé typy klasifikátorů čítala stovky tisíc příznakových vektorů. Výsledkem vývoje je sada čtyř binárních klasifikátorů určujících pravděpodobnost výskytu chyby na prvku modelu. Nejlepší výsledky pro všechny typy chyb dával klasifikátor HistGradientBoostingClassifier (více viz sklearn.ensemble.HistGradientBoostingClassifier — scikit-learn 1.1.2 documentation).
Pro vyhodnocení korektnosti detekce a klasifikace chyby bylo využito několik metrik, zachycující dílčí aspekty hodnocení přesnosti. Z výsledků, které shrnuje tabulka 1, lze odvodit, že ve všech případech dosahují klasifikátory vysoké míry přesnosti (Acc). Pro praktické využití je vhodnější použít F1-míru, která vyjadřuje harmonický průměr přesnosti (P) a úplnosti (R). Nejlépe detekovatelnou chybou je chyba odbočky a topologie. Naopak chyba parametrů a měření vykazuje nižší (avšak stále přijatelnou) míru detekce. Všechny klasifikátory splnily požadavky na kvalitu a přesnost a rozhodli jsme se je nasadit do praxe v průběhu příštího roku.
Typ chyby |
Acc |
P |
R |
F1 |
Rozh. práh |
AP |
2 – Měření |
0,989 |
0,665 |
0,483 |
0,559 |
0,23 |
0,616 |
3 – Topologie |
0,996 |
0,970 |
0,805 |
0,880 |
0,32 |
0,920 |
4 – Parametry |
0,987 |
0,785 |
0,523 |
0,627 |
0,38 |
0,674 |
5 – Odbočka |
0,992 |
0,982 |
0,635 |
0,772 |
0,41 |
0,898 |
Tabulka č. 1: Přehled metrik vytvořených klasifikátorů
Vysvětlivky: P – poměr TP / (TP + FP), kde TP (true positive) je počet správně určených pozitivních příkladů a FP (false positive) je počet chybně detekovaných pozitivních příkladů; R – poměr TP / (TP + FN), kde TP (true positive) je počet správně určených pozitivních příkladů a FN (false negative) je počet chybně nedetekovaných (vynechaných) příkladů;
F1 – harmonický průměr přesnosti a úplnosti: F1 = 2 * (P * R) / (P + R)
Hlavní přidanou hodnotou této aplikace AI je úspora času při lokalizaci chyby a její včasná identifikace. Eliminací chyb zároveň zvyšujeme přesnost modelu sítě v dispečerském řídicím systému a s ním i přesnost všech navazujících funkcí.
KLASIFIKACE PROVOZNÍ BEZPEČNOSTI MODELU SÍTĚ
Úkolem této úlohy bylo najít model sítě (řez), který je nejpodobnější predikčnímu modelu vytvářenému v rámci koordinovaného evropského výpočtu kapacit na přeshraničních vedeních. To umožní ČEPS lépe posoudit bezpečnost predikovaného modelu.
Zásadní výzvou bylo vytvoření spolehlivé metriky, jež umožní jednoznačně stanovit, že porovnané modely jsou si opravdu podobné. Po sérii experimentů jsme nakonec formulovali vícerozměrné skóre, které představuje soubor odhadů kvantilů (resp. kumulativní distribuční funkce) relativního zatížení kritických prvků sítě (CNE) přes všechny definované kontingence (výpadky). Výsledné skóre je definováno jako vektor
Skóre = [xq10,xq25,xq50,xq75,xq90],
jenž obsahuje první decil, první kvartil, medián, třetí kvartil a devátý decil relativního zatížení. Nad takto definovaným skórem jsou následně definovány metriky podobnosti. Příklad podobných a nepodobných modelů včetně ukázky zvolené metriky ilustruje obrázek 5. V našem případě vícerozměrného skóre je na vodorovné ose vyneseno relativní zatížení CNE. Svislá osa představuje pravděpodobnost, že hodnota zatížení CNE je menší či rovna danému průmětu distribuční funkce na vodorovnou osu.
Obrázek č. 5: Příklad podobnosti modelů a zvolené metriky
V modelu AI se na základě historických vstupů a hodnot skóre odhaduje kumulativní distribuční funkce (CDF). Pokud budeme předpokládat, že skutečný průběh CDF je na obrázku vyznačen čárkovanou modrou a zelenou čárou (ref1, ref2) a odhad CDF plně (hyp1, hyp2), pak lze vypočítat chybu predikce. Na obrázku je rozdíl predikcí vynesen červenou barvou, kde plná čára odpovídá rozdílu predikce a čárkovaná pro reálné hodnoty. Podobnost modelů elektrických sítí je vyjádřena jako integrál (tj. plocha) rozdílu CDF pro oba modely – Integral Error (IE). V případě podobných modelů je tento rozdíl nepatrný, avšak pro nepodobné modely je rozdíl markantní, jak je naznačeno v pravé části.
Cílem bylo nalézt nejpřesnější model („co nejvíce sblížit plné a čárkované skóre“) a na druhou stranu co nejlépe odlišit nepodobné modely. Experiment se prováděl nad sadou desítek tisíc modelů sítě. Metoda podpůrných vektorů (SVM), která dosahovala nejlepších výsledků, pracuje přibližně se stovkou příznaků, jež se zaměřují na agregované vlastnosti prvků a stavové veličiny.
Experiment prokázal, že zvolená metodika poskytuje dostatečně přesné výstupy, které lze dále využít i v praxi. Produkční model je trénován nad 3 000 datovými vzorky (125 dní) a přetrénování probíhá každý den. Výsledkem je natrénovaný model AI, který k náhodnému modelu sítě najde seřazenou sadu nejpodobnějších historických modelů. Největší přidaná hodnota využití strojového učení je v rychlosti. Jelikož přesnost je nižší oproti analytickému výpočtu, bude model AI nasazen v průběhu příštího roku jako doplňkový nástroj.
PREDIKCE TECHNICKÝCH ZTRÁT V PS
Přenos elektrické energie od zdroje ke spotřebě má za následek ztráty. Ty se vypočítávají jako rozdíl mezi naměřenou elektřinou vstupující do soustavy a elektřinou z ní vystupující. ČEPS jako provozovatel přenosové soustavy ČR nese odpovědnost za pokrytí ztrát vzniklých přenosem energie přes síť.
Obstarávání elektrické energie pro pokrytí ztrát v přenosové soustavě je potřeba provádět v předstihu. ČEPS tak musí dopředu odhadnout, kolik energie musí obstarat. Jeho motivací je mít co nejmenší odchylku v každém obchodním intervalu.
Tento případ užití AI představuje úlohu predikce časové řady. V rámci realizace jsme vyvinuli tři prediktory pro rozdílné časové horizonty:
-
model 15M – model predikující technické ztráty na 15 minut dopředu,
-
model 2H – model predikující technické ztráty na 2 hodiny dopředu,
-
model 1.5D – model predikující technické ztráty celý následující den, předpokládané spuštění v 9 hodin dopoledne.
Při využití strojového učení pro realizaci prediktorů byly uvažovány dvě implementační linie, které shrnuje obrázek 6. První z nich (trénovací) je u určena k parametrizaci modelu strojového učení. Na základě historických dat jsou extrahovány příznaky, na jejíchž základě se trénuje predikční model. Výsledná parametrizace modelu strojového učení (struktura modelu, konfigurace modelu apod.) jsou přeneseny do prediktoru technických ztrát. Na ten navazuje druhá (provozní) linie, jež z on-line provozních dat extrahuje příznaky, které jsou vstupem do prediktoru technických ztrát. Ten je konfigurován z trénovací fáze a na základě nastavení a vstupních příznaků odhaduje technické ztráty na daném predikčním horizontu.
Obrázek č. 6: Obecké schéma systému pro predikci technických ztrát
Tabulka 2 shrnuje vybrané metody strojového učení včetně orientačních hodnot MAPE (Mean Absolute Percentage Error) a maximální chyby na vybraném testovacím období. V tabulce jsou uvedeny konzervativní odhady sady prediktorů na zvoleném validačním období.
Horizont |
Zvolený prediktor |
MAPE (%) |
Max. chyba (MW) |
15M |
HistGBRegressor |
8 |
60 |
2H |
HistGBRegressor |
9 |
70 |
1.5D |
HistGBRegressor |
19 |
110 |
1.5D |
LinearRegression |
21 |
95 |
Tabulka č. 2: Vyhrané metody a orientační metriky prediktorů
Vytvořené modely dosahují velmi dobrých výsledků a budou zařazeny do již fungujícího portfolia prediktorů technických ztrát. Pro další zlepšování prediktorů budeme rozšiřovat dostupnou datovou sadu a zaměříme se na možnosti sdružování (ensembling) dílčích modelů.
AI V ČEPS POKRAČUJE
Pro všechny představené modely AI byl vytvořen implementační plán definující konkrétní kroky směřující k jejich pravidelnému využívání. První modely AI budou nasazeny do prostředí již na začátku roku 2023. Na základě výstupů pilotního projektu formuluje společnost ČEPS střednědobou strategii k využívání umělé inteligence v letech 2023 až 2025. Navržené hardwarové a softwarové řešení je robustní a lze ho úspěšně využívat pro další projekty. Budoucí kroky budou směřovat k jeho kontejnerizaci pro zvýšení dostupnosti, efektivnímu škálování a balancování zátěže.
Potenciál využití metod umělé inteligence byl identifikován u desítek dalších případů užití v ČEPS. Nástroje, infrastruktura a know-how představené v tomto článku budou základními stavebními kameny pro tvorbu nových modelů AI.
O AUTORECH
Ing. PAVEL BAXANT, Ing. TOMÁŠ MAREČEK, Ing. PETR SOUČEK a Ing. PŘEMYSL VORÁČ, Ph.D., pracují v oddělení EMS ve společnosti ČEPS, které spravuje analytické nástroje pro řízení bezpečnosti provozu přenosové soustavy České republiky.
Kontakt: baxant@ceps.cz, marecekt@ceps.cz, soucekp@ceps.cz, vorac@ceps.cz
Tomáš Brejcha
Související články
Greenpeace bojuje proti LNG terminálu v Bratislave. Envirorezort ešte nerozhodol o odvolaní
Rezort životného prostredia vydalo koncom marca záverečné stanovisko v rámci procesu posudzovania vplyvov na životné prostredie a…
Seznam Zprávy: Areál bývalého Dolu Barbora koupí od Bakaly developer Panattoni
Průmyslový developer Panattoni koupí od společnosti Asental Zdeňka Bakaly areál bývalého karvinského Dolu Barbora, společnosti uza…
Ministr Hladík: Potřebujeme navýšit obnovitelné zdroje. Na podzim chystáme nové dotace pro firmy na FVE a tepelná čerpadla
Co myslíte, že čeká českou energetiku v budoucnu a na co by se stát i firmy měly více zaměřit? Na to se ptá ve svém komentáři na …
Toyota oznámila průlom v oblasti Li-Ion baterií
Japonská společnost Toyota dosáhla technologického průlomu oblasti lithium-iontových (Li-Ion) baterií, která je považovaná za tech…
Dnešní elektromobily dříve zreziví, než aby jim selhala baterie, říká Jan Dedek z AAA Auto
Současné elektromobily jsou vybavené bateriovými články, které jsou navržené na 2000 nabíjecích cyklů. Při dojezdu 300 kilometrů t…
Kalendář akcí
„ENERGETIKA KOLEM NÁS – investice do OZE, transformace teplárenství, role komunitní energetiky“
Európsky energetický summit 2023
Dny kogenerace
ENERGY-HUB je moderní nezávislá platforma pro průběžné sdílení zpravodajství a analytických článků z energetického sektoru. V rámci našeho portfolia nabízíme monitoring českého, slovenského i zahraničního tisku.