Analytické spracovanie dát
Autor práce: Ing. Martina Hrínová DurnekováŠkoliteľ: doc. Ing. Michal Kvet, PhD.
Dátum obhajoby: 22.8.2024
Študijný program: aplikovaná informatika
Oponent 1: prof. RNDr. Valerie Novitzká, PhD.
Oponent 2: doc. Ing. Jarmila Škrinárová, PhD.
Slovenský abstrakt:
HRÍNOVÁ DURNEKOVÁ, Martina: Analytické spracovanie dát [dizertačná práca]
– Žilinská univerzita v Žiline. Fakulta riadenia a informatiky; Katedra informatiky. –
Školiteľ: doc. Ing. Michal Kvet, PhD. – Stupeň odbornej kvalifikácie: Doktor filozofie
v študijnom odbore Informatika. Žilina: FRI ŽU v Žiline, 2024.
V dizertačnej práci sa venujeme analytickému spracovaniu dát, vďaka ktorému
dokážeme transformovať dostupné dáta do cenných informácií, ktoré sú kľúčové pre úspech
našej spoločnosti, mnohých firiem a organizácií. Tieto informácie slúžia ako podklad pre
strategické rozhodnutia, ktoré vedú k optimalizácii procesov, zvýšeniu efektivity a celkovej
prosperite. Naším cieľom je orientovať sa na efektívne ukladanie veľkého množstva dát do
databáz a dátových skladov, pričom je potrebné klásť dôraz na rýchlosť a efektivitu
vyhľadávania položiek v rámci úložiska. Správny návrh a optimalizácia dátových a
indexových štruktúr pokladá základy pre dosahovanie vhodných výkonnostných úrovní.
Okrem toho je nutné dbať na adekvátny návrh algoritmov pre analytické spracovanie dát,
vyhľadávanie a spracovanie nedefinovaných údajov, a v neposlednom rade aj efektívnu
prácu s agregačnými a analytickými funkciami v rámci analýzy dát.
Celý výskum je založený na reálnych dátach získaných z dopravných systémov
a z leteckej dopravy. Navrhli a vytvorili sme dátové sklady a dátové modely, pričom sme
kládli dôraz na efektivitu ukladania dát. Následne sme sa venovali optimalizácii dátovej
štruktúry. Časť výskumu v dizertačnej práci sa venuje porovnávaniu rýchlostí metód
importu dát do databázy a exportu dát z databázy, okrem toho sme porovnávali efektivitu
vyhľadávania údajov v interných a externých tabuľkách. Práca s analytickými funkciami
tvorí dôležitý aspekt efektivity riešenia, preto sme navrhli a experimentálne overili vplyv
vytvorených indexov pre príkaz Select, ktorý obsahuje analytické funkcie. Taktiež sme
vytvorili koncept pre referencie funkcií v príkaze Select a spracovanie odkazov
temporálnych funkcií v relačných databázach. V samotnej časti sa venujeme problematike
nedefinovaných hodnôt, ktorých nesprávne spracovanie môže viesť ku skresleným
výsledkom, pričom sme vytvorili metodiku spracovania záznamov s nedefinovanými
hodnotami v tabuľkách rozdelených na partície.
Kľúčové slová: analytické spracovanie dát, dátový sklad, indexy, analytické funkcie,
optimalizácia
Anglický abstrakt:
HRÍNOVÁ DURNEKOVÁ, Martina: Analytical data processing [dissertation thesis]
– University of Žilina. Faculty of Management Science and Informatics; Department of
Informatics. – Supervisor: doc. Ing. Michal Kvet, PhD. – Qualification level: Philosophiae
doctor in the study field Informatics. Žilina: FRI ŽU in Žilina, 2024.
The dissertation is focused on analytical data processing, which allows us to
transform available data into valuable information that is crucial for the success of
companies and organizations. This information serves as the basis for strategic decisions that
lead to process optimization, increased efficiency, and overall prosperity. Our aim is to focus
on the effective storage of large amounts of data in databases and data warehouses, while
emphasizing the speed and efficiency of retrieving records within the storage. Proper design
and optimization of data and index structures lay the foundation for achieving appropriate
performance level. In addition, it is necessary to pay attention to the adequate design of
algorithms for analytical data processing, searching, and processing of undefined data, and
efficient work with aggregation and window functions within data analysis.
The entire research is based on real-world data obtained from intelligent transport
systems and aviation systems. We designed and created data warehouses and data models,
placing emphasis on data storage efficiency. Subsequently, we focused on optimizing the
data structure. Part of the research is dedicated to comparing the speed of data import
methods into the database and data export methods from the database. In addition, we
compared the efficiency of searching for data in internal and external tables. Working with
window functions is an important aspect of the solution's efficiency. Therefore, we designed
and experimentally verified the impact of the created indexes for the Select statement, which
contains window functions. We also created a concept for function references in the Select
statement and treating temporal function references in relational database management
system. The section itself deals with the problem of undefined values, the incorrect
processing of which can lead to distorted results. We created a methodology for processing
records with undefined values in partitioned tables.
Key words: analytical data processing, data warehouse, indexes, window functions,
optimization
Autoreferát dizertačnej práce
Text práce