Analýza rozsiahlych dát v energetických a dopravných aplikáciách
Autor práce: Ing. Milan StrakaŠkoliteľ: prof. Ing. Ľuboš BUZNA, PhD.
Dátum obhajoby: 19.8.2020
Študijný program: inteligentné informačné systémy
Oponent 1: prof. Ing. Vladimír GAZDA, PhD.
Oponent 2: doc. Ing. Roman JARINA, PhD.
Slovenský abstrakt:
STRAKA, Milan: Analýza rozsiahlych dát v energetických a dopravných aplikáciách. [Dizertacná
práca] Žilinská Univerzita v Žiline. Fakulta riadenia a informatiky. Katedra matematických
metód a operacnej analýzy. - Vedúci dizertacnej práce: prof. Ing. Luboš Buzna,
PhD. - Žilina: FRI UNIZA, 2020, 147 s.
Elektromobilita je rozvíjajúce sa odvetvie, spadajúce do energetiky a dopravy a prináša
vysoký potenciál na zníženie emisií. Jej rozvoj do znacnej miery v súcasnosti ovplyvnujú
politiky na rôznych úrovniach a ekonomické záujmy a spolieha sa na procesy založené
na ludskom rozhodovaní. Vyššia efektivita investícii do tejto oblasti si vyžaduje úcinnú
podporu pre rozhodovanie a to aj s využitím prostriedkov dátovej analýzy, co je ústredná
téma tejto dizertacnej práce.
Základným zdrojom sú dáta pochádzajúce z verejnej nabíjacej infraštruktúry, rozmiestnenej
po celom území Holandska, ktoré patrí, v tomto ohlade, medzi najrozvinutejšie
krajiny sveta. Na základe konzultácií s firmami pôsobiacimi v oblasti elektromobility sme
identifikovali tri ciastkové ciele. Hlavným cielom je vytvorit metodológiu pre analýzu dát
a dátové modelovanie v prostredí elektromobility, ktorá bude mat potenciál zväcšit množinu
dostupných nástrojov pre podporu rozhodovania v oblasti budovania a prevádzky
nabíjacej infraštruktúry pre EV, pricom sa sústredíme na tri, nižšie uvedené ciele.
Prvým cielom je identifikácia skupín podobných nabíjacích staníc a používatelov, za
úcelom identifikácie vznikajúcich segmentov, na ktoré je potrebné reagovat prostredníctvom
obchodných modelov a stratégií. Tento ciel dosahujeme aplikáciou metód zhlukovania
a agregacných prístupov, na základe ktorých identifikujeme 4 interpretovatelné zhluky
staníc.
Druhý ciel sa zameriava na výber vhodných metód a množiny dát pre získanie predikcie
spotreby energie nabíjacej infraštruktúry. Takéto predikcie sú aplikovatelné, napríklad,
pri nákupe elektrickej energie alebo inteligentnom nabíjaní. Pomocou metód casových
radov, strojového ucenia a externých prediktorov, predikujeme casopriestorovo agregovanú
spotrebu, kde dosahujeme presnost MAPE približne 12 %.
V tretom cieli sa venujeme identifikácii vhodného umiestnenia nabíjacej infraštruktúry.
Využívame rozsiahle GIS dáta, reprezentujúce okolie nabíjacích staníc. Jednoduchými metódami,
ktoré sme navrhli, extrahujeme prediktory z GIS dát. Vplyvné prediktory získavame
pomocou regresných metód, urcených na výber premenných. Pomocou dostupných
metód sa vysporadúvame so vzájomnou závislostou dát, multikolinearitou. V rámci identifikácie
vhodného umiestnenia najskôr na základe dát predikujeme popularitu nabíjacej
infraštruktúry spolu s interpretáciou vplyvu prediktorov. Následne, aj na základe dát z
okolia, sa zameriavame na vysvetlenie priestorovej spotreby energie nabíjacou infraštruktúrou.
V praxi môže byt navrhovaná metodológia použitá na podporu rozhodovania pri
budovaní novej alebo prípadné rozširovanie existujúcej nabíjacej infraštruktúry.
Klúcové slová: analýza dát, elektrické vozidlá, nabíjacie stanice, dátová veda, strojové
ucenie, elektromobilita
Anglický abstrakt:
STRAKA, Milan: Large scale data analysis in energy and transport applications. [Dissertation
thesis] - University of Žilina. Faculty of Management Science and Informatics.
Department of Software Technology. - Supervisor: prof. Ing. Luboš Buzna, PhD. - Žilina,
FRI UNIZA, 2020, 147 p.
Electromobility is regarded as a modern trend, falling within energetics and transport
and brings a high potential for reducing emissions. Its development is currently largely
influenced by policies at various levels and economic interests, and it relies on processes
based on human decision-making. Higher efficiency of investments in this area requires
effective decision support based on the use of data analysis tools, which is the central
topic of this dissertation.
The basic source is data from public charging infrastructure located throughout the
Netherlands, which is one of the most developed countries in the world in this respect.
Based on a detailed literature review and consultations with companies operating in the
field of electromobility, we identified three goals. The main goal is to create a methodology
for data analysis and data modelling in the electromobility environment, which will have
the potential to enrich the set of tools available to support decision-making in the processes
of deployment and operation of charging infrastructure for EVs, focusing on the three
objectives below.
The first goal is to identify groups of similar charging stations and EV users, to identify
emerging segments, that need to be addressed through incentivisation strategies and
business models. We achieved this goal by applying clustering methods and aggregation
approaches, based on which we identify 4 interpretable clusters of stations.
The second goal focuses on the selection of appropriate methods and data sets to obtain
a prediction of the energy consumption of the charging infrastructure. Such predictions
are applicable, for example, when purchasing electricity or in smart charging technologies.
Using time-series methods, machine learning and exogenous predictors, we predicted spatiotemporally
aggregated consumption while achieving MAPE accuracy of approximately
12 %.
In the third goal, we are motivated by the problem of identifying the appropriate
locations of the charging infrastructure. We use extensive GIS data, representing the
vicinity of charging stations. Using simple methods, that we have proposed, we extract
predictors from GIS data. Influential predictors are obtained using regression variable
selection methods. Using available methods, we deal with the interdependence of data
and multicollinearity. To characterize suitable locations, we first predict the popularity of
the charging infrastructure based on data, together with the interpretation of influential
predictors. Subsequently, based on GIS data, we focus on the problem of explaining the
relationship between the characteristics of the environment surrounding the infrastructure
and energy consumption. In practice, the proposed methodologies and new knowledge can
be used in the development of decision making support tools dedicated to the problem of
deploying new or expanding the existing charging infrastructure.
Key words: data analysis, electric vehicles, charging stations, data science, machine
learning, electromobility
Autoreferát dizertačnej práce
Text práce