Υπερανάλυση εικόνας με τη μέθοδο Deep Unfolding και χρήση εικόνων πολλαπλών τύπων

dc.contributor.authorΚαραμπάσης, Αλέξανδροςel
dc.date.accessioned2022-07-28T08:55:51Z
dc.date.available2022-07-28T08:55:51Z
dc.identifier.urihttps://olympias.lib.uoi.gr/jspui/handle/123456789/31878
dc.identifier.urihttp://dx.doi.org/10.26268/heal.uoi.11693
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectΥπερανάλυση εικόναςel
dc.subjectΜηχανική μάθησηel
dc.subjectΜοντέλα πολλαπλών τύπωνel
dc.subjectΑραιή αναπαράστασηel
dc.subjectImage super resolutionen
dc.subjectMachine learningen
dc.subjectMultimodal modelsen
dc.subjectSparse representationen
dc.titleΥπερανάλυση εικόνας με τη μέθοδο Deep Unfolding και χρήση εικόνων πολλαπλών τύπωνel
dc.titleMultimodal image super-resolution via Deep Unfoldingen
heal.abstractH παρούσα διπλωματική εργασία πραγματεύεται την υπερανάλυση εικόνας με την βοήθεια των μοντέλων πολλαπλών τύπων. Η υπερανάλυση εικόνας είναι ένα γνωστό αντίστροφο πρόβλημα της μηχανικής όρασης για το οποίο υπάρχουν διάφορες προσεγγίσεις, μεταξύ των οποίων στατιστικές μέθοδοι, αλγόριθμοι που στηρίζονται σε αραιές αναπαραστάσεις και μέθοδοι που χρησιμοποιούν βαθιά μάθηση. Μια πρόσφατη κατηγορία έρευνας στη βαθιά μάθηση για αντίστροφα προβλήματα αποτελεί το deep unfolding δηλαδή η ανάπτυξη ενός επαναληπτικού αλγορίθμου με τη μορφή βαθιών νευρωνικών δικτύων. Πρακτικές εφαρμογές, όπως η ιατρική απεικόνιση, χρειάζονται εικόνες πολλαπλών τύπων που αποτυπώνουν την ίδια σκηνή, επομένως, μια άλλη προσέγγιση είναι η κοινή χρήση πολλαπλών τύπων εικόνας. Το πρόβλημα της υπερανάλυσης εικόνας με την βοήθεια μοντέλων πολλαπλών τύπων αναφέρεται στην ανακατασκευή μιας εικόνας υψηλής ανάλυσης από μια εικόνα χαμηλής ανάλυσης χρησιμοποιώντας μια εικόνα καθοδήγησης άλλου τύπου, που ονομάζεται πλευρική πληροφορία. Στόχος της παρούσας διπλωματικής εργασίας είναι η ανάπτυξη ενός μοντέλου πολλαπλών τύπων που θα ενσωματώνει στοιχεία από την θεωρία αραιών αναπαραστάσεων και θα επιτρέπει την αποτελεσματική ενσωμάτωση του τύπου καθοδήγησης για την επίτευξη μιας αποδοτικής υπερανάλυσης εικόνας. Σε αντίθεση με τα περισσότερα μοντέλα νευρωνικών δικτύων πολλαπλών τύπων η αρχιτεκτονική του μοντέλου που αναπτύχθηκε στην παρούσα εργασία καθιστά το μοντέλο ερμηνεύσιμο, με την έννοια ότι το μοντέλο εκτελεί βήματα παρόμοια με έναν επαναληπτικό αλγόριθμο, ενώ παρέχει τη δυνατότητα θεωρητικής μελέτης του μοντέλου με χρήση της θεωρίας αραιών αναπαραστάσεων.el
heal.abstractThis thesis deals with image super-resolution using multimodal models. Image super-resolution is a common inverse problem of computer vision for which a plethora of different approaches have been demonstrated over the past years, including statistical methods, algorithms based on sparse representation and methods utilizing machine learning. A recent research in deep learning for inverse problems considers deep unfolding i.e., the unfolding of an iterative algorithm into the form of a DNN. Practical applications, such as medical imaging, involve different image modalities capturing the same scene, therefore, another approach in imaging is the joint use of multiple image modalities. The problem of multimodal image super-resolution refers to the reconstruction of a high resolution image from an lower resolution image using a guidance image from another modality, also referred to as side information. In this present work, we present an multimodal model which incorporates sparse priors and enables efficient integration of the guidance modality into the solution of super-resolution image. In contrast to most other neural network models, the architecture of the model make the model interpretable, in the sense that the model performs steps similar to an iterative algorithm, while also enabling its theoretical study using sparse representation theory.en
heal.academicPublisherΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικήςel
heal.academicPublisherIDuoi
heal.accessfree
heal.advisorNameΚόντης, Λυσίμαχος-Παύλοςel
heal.bibliographicCitationΒιβλιογραφία: σ. 62-65el
heal.classificationΜηχανική μάθηση
heal.committeeMemberNameΚόντης, Λυσίμαχος-Παύλοςel
heal.committeeMemberNameΤσιλιγιάννη, Ευαγγελίαel
heal.committeeMemberNameΝίκου, Χριστόφοροςel
heal.committeeMemberNameΠαρσόπουλος, Κωνσταντίνοςel
heal.dateAvailable2022-07-28T08:56:51Z
heal.fullTextAvailabilitytrue
heal.languageel
heal.numberOfPages65 σ.
heal.publicationDate2022
heal.recordProviderΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικήςel
heal.typemasterThesis
heal.type.elΜεταπτυχιακή εργασίαel
heal.type.enMaster thesisen

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Προβολή: 1 - 1 of 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Μ.Ε. ΚΑΡΑΜΠΑΣΗΣ ΑΛΕΞΑΝΔΡΟΣ 2022.pdf
Μέγεθος:
3.21 MB
Μορφότυπο:
Adobe Portable Document Format
Περιγραφή:

Φάκελος/Πακέτο αδειών

Προβολή: 1 - 1 of 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
license.txt
Μέγεθος:
1.71 KB
Μορφότυπο:
Item-specific license agreed upon to submission
Περιγραφή: