Computational optimization for association rule mining using weighted transactions
dc.contributor.author | Kypriadis, Adam | en |
dc.contributor.author | Κυπριάδης, Αδάμ | el |
dc.date.accessioned | 2023-02-13T08:04:03Z | |
dc.date.available | 2023-02-13T08:04:03Z | |
dc.identifier.uri | https://olympias.lib.uoi.gr/jspui/handle/123456789/32376 | |
dc.identifier.uri | http://dx.doi.org/10.26268/heal.uoi.12187 | |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | * |
dc.rights | info:eu-repo/semantics/openAccess | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
dc.subject | Association rules | en |
dc.subject | Computational optimization | en |
dc.subject | Weighted transactions | en |
dc.subject | Particle Swarm Optimization (PSO) | en |
dc.subject | Κανόνες συσχέτισης | el |
dc.subject | Υπολογιστική βελτιστοποίηση | el |
dc.subject | Βάρη στις συναλλαγές | el |
dc.subject | Σμήνος σωματιδίων | el |
dc.title | Computational optimization for association rule mining using weighted transactions | en |
dc.title | Υπολογιστική βελτιστοποίηση για την εξόρυξη κανόνων συσχέτισης με χρήση βαρών στις συναλλαγές | el |
dc.type | masterThesis | * |
dc.type | info:eu-repo/semantics/masterThesis | * |
heal.abstract | Association rules determine high-utility relations between items present in a transactional dataset. Despite the fact that several studies have attempted to develop effective association rule mining algorithms in order to handle the growing size of real-world data, these efforts have largely focused on mining frequent item combinations rather than information about item combination, quantity, and monetary value. The present study builds on recent developments to propose an efcient algorithm for mining numerical association rules, in the context of rough values, by utilizing state-of-the-art metaheuristics such as the particle swarm optimization and the realvalued genetic algorithms. The novelty of the proposed approach lies in in the use of revenue-based weights of the dataset’s transactions in order to improve the quality and usability of the obtained association rule solutions. Consequently, the proposed method is enabled to provide additional information regarding proftable item combinations alongside their quantities. Typical statistical experimentation was used to extract the best-suited parameters for the proposed algorithms. Their assessment was based on a large real-world transactional dataset, providing insight regarding the algorithm’s ability to extract association rules from real world data as well as the implications of using weighted transactions. | en |
heal.abstract | Στόχος της παρούσας εργασίας είναι η ανάπτυξη ενός αποτελεσματικού αλγορίθ- μου για την εξόρυξη αριθμητικών κανόνων συσχέτισης από ένα εκτεταμένο σύνολο συναλλαγών που βασίζεται σε δεδομένα μιας πραγματικής εταιρείας. Επιπλέον, εισάγεται η έννοια της ανάθεσης βαρών στις συναλλαγές με στόχο την εξόρυξη ποιοτικότερων κανόνων συσχέτισης, μέσω της μέγιστης αξιοποίησης των διαθέσι- μων δεδομένων. Οι κανόνες συσχέτισης αποτελούν ενδιαφέρουσες σχέσεις μεταξύ αντικειμένων που εμφανίζονται σε ένα σύνολο συναλλαγών. Κάθε κανόνας αποτελείται από δύο μέρη, την «υπόθεση» (antecedent) και το «συμπέρασμα» (consequent). Για την ποιο- τική αξιολόγηση των κανόνων αυτών αλλά και για την προσαρμογή των αλγορίθ- μων που αφορούν στην εξόρυξή τους, χρησιμοποιούνται δύο βασικές μετρικές. Η πρώτη από αυτές είναι η «υποστήριξη» (support), η οποία ορίζεται ως το ποσο- στό των συναλλαγών που περιέχουν όλα τα αντικείμενα που συμπεριλαμβάνονται στην υπόθεση και στο συμπέρασμα του εκάστοτε κανόνα. Η δεύτερη ονομάζεται «εμπιστοσύνη» (confdence) και είναι ο αριθμός των συναλλαγών που περιέχουν τα αντικείμενα της υπόθεσης και του συμπεράσματος, προς τον αριθμό των συ- ναλλαγών που περιέχουν τουλάχιστον τα αντικείμενα της υπόθεσης του κανόνα. Οι αριθμητικοί κανόνες συσχέτισης εμπεριέχουν πληροφορία που σχετίζεται με την ποσότητα των αντικειμένων της υπόθεσης και του συμπεράσματος, σε αντίθεση με τους απλούς κανόνες συσχέτισης που περιέχουν πληροφορία μόνο για την παρουσία ή μη του κάθε αντικειμένου. Στον σύγχρονο κόσμο των επιχειρήσεων είναι φανερό πως η αξία μιας συναλ λαγής δεν μπορεί να εκτιμηθεί πλήρως μέσω της παρουσίας και της ποσότητας των αντικειμένων που συμπεριλαμβάνει. Λόγω αυτού, στην παρούσα εργασία ανα θέτουμε επίσης βάρη στις συναλλαγές που, για την συγκεκριμένη εφαρμογή και σύνολο δεδομένων, εκφράζουν το ποσοστό του κέρδους που έχει αποφέρει στην επιχείρηση η κάθε συναλλαγή. Τα παραπάνω βάρη μπορούν να αντιστοιχηθούν με οποιαδήποτε εναλλακτική ποσότητα που εκφράζει σημαντικότητα σε διαφορετικές εφαρμογές, προσφέροντας έτσι έναν άμεσο τρόπο προσαρμογής τους αλγόριθμου σε διαφορετικά σύνολα δεδομένων. Τα βάρη χρησιμοποιούνται για να ορίσουμε εκ νέου την υποστήριξη και την εμπιστοσύνη, έτσι ώστε ο αλγόριθμος να παράγει πιο κερδοφόρους κανόνες συσχέτισης. Το σύνολο δεδομένων που χρησιμοποιήθηκε για την εργασία αποτελείται από τις συναλλαγές μιας πραγματικής επιχείρησης σε διάστημα τριών ετών. Η έκταση του συνόλου αυτού, το οποίο περιέχει χιλιάδες αντικείμενα που συμμετέχουν σε εκατοντάδες χιλιάδες συναλλαγές, καθώς επίσης η αραιότητά του και οι ασυνέχειες της προς μεγιστοποίηση συνάρτησης καθιστούν την χρήση παραδοσιακών μεθόδων βελτιστοποίησης με παραγώγους αδύνατη. Έτσι επιλέχθηκαν οι στοχαστικές μέ θοδοι της βελτιστοποίησης με σμήνος σωματιδίων και των γενετικών αλγόριθμων, οι οποίες αντιμετωπίζουν επιτυχώς την ασυνέχεια της αντικειμενικής συνάρτησης απαιτώντας παράλληλα μικρό υπολογιστικό κόστος. Τέλος, παρουσιάζονται τα απο- τελέσματα στατιστικής ανάλυσης για την εξαγωγή των καλύτερων παραμέτρων του αλγορίθμου στο παραπάνω σύνολο δεδομένων, καθώς επίσης και η μέθοδος που χρησιμοποιήθηκε για την παράλληλη εκτέλεση των απαιτούμενων δοκιμών σε μία συστάδα υπολογιστών. | el |
heal.academicPublisher | Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής | el |
heal.academicPublisherID | uoi | |
heal.access | free | |
heal.advisorName | Παρσόπουλος, Κωνσταντίνος | el |
heal.classification | Association rule mining | |
heal.committeeMemberName | Παρσόπουλος, Κωνσταντίνος | el |
heal.committeeMemberName | Λύκας, Αριστείδης | el |
heal.committeeMemberName | Σκούρη, Κωνσταντίνα | el |
heal.dateAvailable | 2023-02-13T08:05:04Z | |
heal.fullTextAvailability | true | |
heal.language | en | |
heal.numberOfPages | 58 σ. | |
heal.publicationDate | 2023 | |
heal.recordProvider | Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή | el |
heal.type | masterThesis | |
heal.type.el | Μεταπτυχιακή εργασία | el |
heal.type.en | Master thesis | en |
Αρχεία
Πρωτότυπος φάκελος/πακέτο
1 - 1 of 1
Φόρτωση...
- Ονομα:
- Μ.Ε. ΚΥΠΡΙΑΔΗΣ ΑΔΑΜ 2023.pdf
- Μέγεθος:
- 1.92 MB
- Μορφότυπο:
- Adobe Portable Document Format
- Περιγραφή:
Φάκελος/Πακέτο αδειών
1 - 1 of 1
Φόρτωση...
- Ονομα:
- license.txt
- Μέγεθος:
- 3.22 KB
- Μορφότυπο:
- Item-specific license agreed upon to submission
- Περιγραφή: