Classification of Mammography Findings Using Convolutional Neural Networks and their Interpretation
Autor práce: Ing. Adam MračkoŠkoliteľ: prof. Mgr. Ivan Cimrák, Dr.
Dátum obhajoby: 20.8.2024
Študijný program: aplikovaná informatika
Oponent 1: prof. Ing. Vanda Benešová, PhD.
Oponent 2: prof. Ing. Martin Klimo, PhD.
Slovenský abstrakt:
Dizertačná práca sa ponorí do preniku mamografie a strojového učenia, so zameraním na
tvorbu a hodnotenie konvolučných neurónových sietí (CNN) pre klasifikáciu mamografických
výrezov. Prvotne sa zameria na mamografických proces hodnotenia a analýzu štyroch databáz:
MIAS, INbreast, CBIS-DDSM a OMI-DB. Popíše tvorbu vlastnej databázy v spolupráci
s Onkologickým ústavom Sv. Alžbety. Následne preskúma aplikáciu CNN v mamografii,
kde bude pozorovať rôzne hypotézy pomocou experimentov pozorujúcich presnosť modelov.
Medzi kľúčové pozorovania je možné zaradiť efektivitu použitia pretrénovaných váh, dôležitosť
adresovania nevyváženosti tried a vplyv zmenšenia rozlíšenia výrezov na presnosť modelu.
Štúdia tiež objaví limitácie modelov ako napr. nesprávna klasifikácia nálezov pri prítomnosti
viacerých typov abnormalít a prítomnosti šumu v interpretácii, hlavne pri benígnych nálezoch.
Experiment s cieľom adresovať limitácie pomocou predspracovania databázy, zahrňujúceho
nahradenie okolitého prsného tkaniva čiernymi pixelmi neprinieslo očakávané výsledky. V
niektorých prípadoch došlo k zlepšeniu, avšak celkovo bolo pozorované zhoršenie presnosti
modelov. Bol vykonaný pokus na zreplikovanie výsledkov z inej štúdie používajúcich SVM
modely založené na príznakoch z CNN. Výsledky sa nepodarilo zreplikovať z dôvodu poten
ciálnej závislosti dát. Ďalšie experimenty využili kombináciu dátových množín CBIS-DDSM a
OMI-DB na preskúmanie prenosu znalosti medzi databázami a preskúmanie rôznych CNN
architektúr. Bolo preukázane, že kombinácia databáz zlepší presnosť modelu a boli identifiko
vané výrezy, ktorých predikcia bola konzistentne zlá naprieč viacerými modelmi. Nakoniec,
pomocou prechodu na troj-triedový klasifikátor sa podarilo zlepšiť interpretačné výsledky za
cenu zníženia počtu správne klasifikovaných malígnych nálezov.
Kľúčové slová: mamografia, konvolučné neurónové siete, rakovina prsníka, klasifikácia
zhlukov mikrokalcifikátov, strojové učenie
Anglický abstrakt:
CLASSIFICATION OF MAMMOGRAPHY FINDINGS USING CONVO
LUTIONAL NEURAL NETWORKS AND THEIR INTERPRETATION. [Dissertation].
University of Žilina. Faculty of Management Science and Informatics. Department of Software
Technologies.– Supervisor: prof. Mgr. Ivan Cimrák, Dr.– Žilina: FRI UNIZA, 2024– 114 p.
Dissertation delves into the intersection of mammography and machine learning, focusing
on the development and evaluation of convolutional neural networks (CNN) for classifying
mammography patches. The initially it details the mammography assessment process and
analyze four databases: MIAS, INbreast, CBIS-DDSM, and OMI-DB. Own database creation
in collaboration with Oncological Institute of St. Elizabeth was described. Subsequently,
it explores the application of CNN in mammography, investigating various hypotheses and
experimental setups to improve model accuracy. Key findings include the effectiveness of
using pre-trained weights, the necessity of addressing class imbalance, and the impact of patch
resolution reduction on model performance. The study also reveals limitations related to
misclassification of abnormalities when multiple types coexist in a patch and the presence of
noise in interpretation, particularly in the benign class. Efforts to address these limitations
through database preprocessing, including the replacement of breast tissue with black pixels
to reduce noise, resulted in mixed outcomes, with improvements in some cases but overall
deterioration in model accuracy. Additionally, attempts to replicate superior accuracy results
reported in other studies using SVM models based on CNN features were unsuccessful,
highlighting potential issues with data dependency. Further experiments combine datasets
from CBIS-DDSM and OMI-DB, exploring the transferability of knowledge across databases
and the impact of different CNN architectures. The study finds that combining databases
enhances model accuracy but also identifies challenging patches consistently misclassified
across models. Finally, transitioning to three-class classification improves interpretation results
but reduces correct malignant predictions.
Key words: mammography, convolutional neural networks, breast cancer, classification of
microcalcification clusters, machine learning
Autoreferát dizertačnej práce
Text práce