Dizertačné práce

Classification of Mammography Findings Using Convolutional Neural Networks and their Interpretation

Autor práce: Ing. Adam Mračko
Školiteľ: prof. Mgr. Ivan Cimrák, Dr.
Dátum obhajoby: 20.8.2024
Študijný program: aplikovaná informatika
Oponent 1: prof. Ing. Vanda Benešová, PhD.
Oponent 2: prof. Ing. Martin Klimo, PhD.

Slovenský abstrakt:

Dizertačná práca sa ponorí do preniku mamografie a strojového učenia, so zameraním na tvorbu a hodnotenie konvolučných neurónových sietí (CNN) pre klasifikáciu mamografických výrezov. Prvotne sa zameria na mamografických proces hodnotenia a analýzu štyroch databáz: MIAS, INbreast, CBIS-DDSM a OMI-DB. Popíše tvorbu vlastnej databázy v spolupráci s Onkologickým ústavom Sv. Alžbety. Následne preskúma aplikáciu CNN v mamografii, kde bude pozorovať rôzne hypotézy pomocou experimentov pozorujúcich presnosť modelov. Medzi kľúčové pozorovania je možné zaradiť efektivitu použitia pretrénovaných váh, dôležitosť adresovania nevyváženosti tried a vplyv zmenšenia rozlíšenia výrezov na presnosť modelu. Štúdia tiež objaví limitácie modelov ako napr. nesprávna klasifikácia nálezov pri prítomnosti viacerých typov abnormalít a prítomnosti šumu v interpretácii, hlavne pri benígnych nálezoch. Experiment s cieľom adresovať limitácie pomocou predspracovania databázy, zahrňujúceho nahradenie okolitého prsného tkaniva čiernymi pixelmi neprinieslo očakávané výsledky. V niektorých prípadoch došlo k zlepšeniu, avšak celkovo bolo pozorované zhoršenie presnosti modelov. Bol vykonaný pokus na zreplikovanie výsledkov z inej štúdie používajúcich SVM modely založené na príznakoch z CNN. Výsledky sa nepodarilo zreplikovať z dôvodu poten ciálnej závislosti dát. Ďalšie experimenty využili kombináciu dátových množín CBIS-DDSM a OMI-DB na preskúmanie prenosu znalosti medzi databázami a preskúmanie rôznych CNN architektúr. Bolo preukázane, že kombinácia databáz zlepší presnosť modelu a boli identifiko vané výrezy, ktorých predikcia bola konzistentne zlá naprieč viacerými modelmi. Nakoniec, pomocou prechodu na troj-triedový klasifikátor sa podarilo zlepšiť interpretačné výsledky za cenu zníženia počtu správne klasifikovaných malígnych nálezov. Kľúčové slová: mamografia, konvolučné neurónové siete, rakovina prsníka, klasifikácia zhlukov mikrokalcifikátov, strojové učenie

Anglický abstrakt:

CLASSIFICATION OF MAMMOGRAPHY FINDINGS USING CONVO LUTIONAL NEURAL NETWORKS AND THEIR INTERPRETATION. [Dissertation]. University of Žilina. Faculty of Management Science and Informatics. Department of Software Technologies.– Supervisor: prof. Mgr. Ivan Cimrák, Dr.– Žilina: FRI UNIZA, 2024– 114 p. Dissertation delves into the intersection of mammography and machine learning, focusing on the development and evaluation of convolutional neural networks (CNN) for classifying mammography patches. The initially it details the mammography assessment process and analyze four databases: MIAS, INbreast, CBIS-DDSM, and OMI-DB. Own database creation in collaboration with Oncological Institute of St. Elizabeth was described. Subsequently, it explores the application of CNN in mammography, investigating various hypotheses and experimental setups to improve model accuracy. Key findings include the effectiveness of using pre-trained weights, the necessity of addressing class imbalance, and the impact of patch resolution reduction on model performance. The study also reveals limitations related to misclassification of abnormalities when multiple types coexist in a patch and the presence of noise in interpretation, particularly in the benign class. Efforts to address these limitations through database preprocessing, including the replacement of breast tissue with black pixels to reduce noise, resulted in mixed outcomes, with improvements in some cases but overall deterioration in model accuracy. Additionally, attempts to replicate superior accuracy results reported in other studies using SVM models based on CNN features were unsuccessful, highlighting potential issues with data dependency. Further experiments combine datasets from CBIS-DDSM and OMI-DB, exploring the transferability of knowledge across databases and the impact of different CNN architectures. The study finds that combining databases enhances model accuracy but also identifies challenging patches consistently misclassified across models. Finally, transitioning to three-class classification improves interpretation results but reduces correct malignant predictions. Key words: mammography, convolutional neural networks, breast cancer, classification of microcalcification clusters, machine learning

Autoreferát dizertačnej práce
Text práce

Späť

Partneri FRI