Computational optimization for association rule mining using weighted transactions

dc.contributor.authorKypriadis, Adamen
dc.contributor.authorΚυπριάδης, Αδάμel
dc.date.accessioned2023-02-13T08:04:03Z
dc.date.available2023-02-13T08:04:03Z
dc.identifier.urihttps://olympias.lib.uoi.gr/jspui/handle/123456789/32376
dc.identifier.urihttp://dx.doi.org/10.26268/heal.uoi.12187
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rightsinfo:eu-repo/semantics/openAccess*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectAssociation rulesen
dc.subjectComputational optimizationen
dc.subjectWeighted transactionsen
dc.subjectParticle Swarm Optimization (PSO)en
dc.subjectΚανόνες συσχέτισηςel
dc.subjectΥπολογιστική βελτιστοποίησηel
dc.subjectΒάρη στις συναλλαγέςel
dc.subjectΣμήνος σωματιδίωνel
dc.titleComputational optimization for association rule mining using weighted transactionsen
dc.titleΥπολογιστική βελτιστοποίηση για την εξόρυξη κανόνων συσχέτισης με χρήση βαρών στις συναλλαγέςel
dc.typemasterThesis*
dc.typeinfo:eu-repo/semantics/masterThesis*
heal.abstractAssociation rules determine high-utility relations between items present in a transactional dataset. Despite the fact that several studies have attempted to develop effective association rule mining algorithms in order to handle the growing size of real-world data, these efforts have largely focused on mining frequent item combinations rather than information about item combination, quantity, and monetary value. The present study builds on recent developments to propose an efcient algorithm for mining numerical association rules, in the context of rough values, by utilizing state-of-the-art metaheuristics such as the particle swarm optimization and the realvalued genetic algorithms. The novelty of the proposed approach lies in in the use of revenue-based weights of the dataset’s transactions in order to improve the quality and usability of the obtained association rule solutions. Consequently, the proposed method is enabled to provide additional information regarding proftable item combinations alongside their quantities. Typical statistical experimentation was used to extract the best-suited parameters for the proposed algorithms. Their assessment was based on a large real-world transactional dataset, providing insight regarding the algorithm’s ability to extract association rules from real world data as well as the implications of using weighted transactions.en
heal.abstractΣτόχος της παρούσας εργασίας είναι η ανάπτυξη ενός αποτελεσματικού αλγορίθ- μου για την εξόρυξη αριθμητικών κανόνων συσχέτισης από ένα εκτεταμένο σύνολο συναλλαγών που βασίζεται σε δεδομένα μιας πραγματικής εταιρείας. Επιπλέον, εισάγεται η έννοια της ανάθεσης βαρών στις συναλλαγές με στόχο την εξόρυξη ποιοτικότερων κανόνων συσχέτισης, μέσω της μέγιστης αξιοποίησης των διαθέσι- μων δεδομένων. Οι κανόνες συσχέτισης αποτελούν ενδιαφέρουσες σχέσεις μεταξύ αντικειμένων που εμφανίζονται σε ένα σύνολο συναλλαγών. Κάθε κανόνας αποτελείται από δύο μέρη, την «υπόθεση» (antecedent) και το «συμπέρασμα» (consequent). Για την ποιο- τική αξιολόγηση των κανόνων αυτών αλλά και για την προσαρμογή των αλγορίθ- μων που αφορούν στην εξόρυξή τους, χρησιμοποιούνται δύο βασικές μετρικές. Η πρώτη από αυτές είναι η «υποστήριξη» (support), η οποία ορίζεται ως το ποσο- στό των συναλλαγών που περιέχουν όλα τα αντικείμενα που συμπεριλαμβάνονται στην υπόθεση και στο συμπέρασμα του εκάστοτε κανόνα. Η δεύτερη ονομάζεται «εμπιστοσύνη» (confdence) και είναι ο αριθμός των συναλλαγών που περιέχουν τα αντικείμενα της υπόθεσης και του συμπεράσματος, προς τον αριθμό των συ- ναλλαγών που περιέχουν τουλάχιστον τα αντικείμενα της υπόθεσης του κανόνα. Οι αριθμητικοί κανόνες συσχέτισης εμπεριέχουν πληροφορία που σχετίζεται με την ποσότητα των αντικειμένων της υπόθεσης και του συμπεράσματος, σε αντίθεση με τους απλούς κανόνες συσχέτισης που περιέχουν πληροφορία μόνο για την παρουσία ή μη του κάθε αντικειμένου. Στον σύγχρονο κόσμο των επιχειρήσεων είναι φανερό πως η αξία μιας συναλ λαγής δεν μπορεί να εκτιμηθεί πλήρως μέσω της παρουσίας και της ποσότητας των αντικειμένων που συμπεριλαμβάνει. Λόγω αυτού, στην παρούσα εργασία ανα θέτουμε επίσης βάρη στις συναλλαγές που, για την συγκεκριμένη εφαρμογή και σύνολο δεδομένων, εκφράζουν το ποσοστό του κέρδους που έχει αποφέρει στην επιχείρηση η κάθε συναλλαγή. Τα παραπάνω βάρη μπορούν να αντιστοιχηθούν με οποιαδήποτε εναλλακτική ποσότητα που εκφράζει σημαντικότητα σε διαφορετικές εφαρμογές, προσφέροντας έτσι έναν άμεσο τρόπο προσαρμογής τους αλγόριθμου σε διαφορετικά σύνολα δεδομένων. Τα βάρη χρησιμοποιούνται για να ορίσουμε εκ νέου την υποστήριξη και την εμπιστοσύνη, έτσι ώστε ο αλγόριθμος να παράγει πιο κερδοφόρους κανόνες συσχέτισης. Το σύνολο δεδομένων που χρησιμοποιήθηκε για την εργασία αποτελείται από τις συναλλαγές μιας πραγματικής επιχείρησης σε διάστημα τριών ετών. Η έκταση του συνόλου αυτού, το οποίο περιέχει χιλιάδες αντικείμενα που συμμετέχουν σε εκατοντάδες χιλιάδες συναλλαγές, καθώς επίσης η αραιότητά του και οι ασυνέχειες της προς μεγιστοποίηση συνάρτησης καθιστούν την χρήση παραδοσιακών μεθόδων βελτιστοποίησης με παραγώγους αδύνατη. Έτσι επιλέχθηκαν οι στοχαστικές μέ θοδοι της βελτιστοποίησης με σμήνος σωματιδίων και των γενετικών αλγόριθμων, οι οποίες αντιμετωπίζουν επιτυχώς την ασυνέχεια της αντικειμενικής συνάρτησης απαιτώντας παράλληλα μικρό υπολογιστικό κόστος. Τέλος, παρουσιάζονται τα απο- τελέσματα στατιστικής ανάλυσης για την εξαγωγή των καλύτερων παραμέτρων του αλγορίθμου στο παραπάνω σύνολο δεδομένων, καθώς επίσης και η μέθοδος που χρησιμοποιήθηκε για την παράλληλη εκτέλεση των απαιτούμενων δοκιμών σε μία συστάδα υπολογιστών.el
heal.academicPublisherΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικήςel
heal.academicPublisherIDuoi
heal.accessfree
heal.advisorNameΠαρσόπουλος, Κωνσταντίνοςel
heal.classificationAssociation rule mining
heal.committeeMemberNameΠαρσόπουλος, Κωνσταντίνοςel
heal.committeeMemberNameΛύκας, Αριστείδηςel
heal.committeeMemberNameΣκούρη, Κωνσταντίναel
heal.dateAvailable2023-02-13T08:05:04Z
heal.fullTextAvailabilitytrue
heal.languageen
heal.numberOfPages58 σ.
heal.publicationDate2023
heal.recordProviderΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολήel
heal.typemasterThesis
heal.type.elΜεταπτυχιακή εργασίαel
heal.type.enMaster thesisen

Αρχεία

Πρωτότυπος φάκελος/πακέτο

Προβολή: 1 - 1 of 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
Μ.Ε. ΚΥΠΡΙΑΔΗΣ ΑΔΑΜ 2023.pdf
Μέγεθος:
1.92 MB
Μορφότυπο:
Adobe Portable Document Format
Περιγραφή:

Φάκελος/Πακέτο αδειών

Προβολή: 1 - 1 of 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
license.txt
Μέγεθος:
3.22 KB
Μορφότυπο:
Item-specific license agreed upon to submission
Περιγραφή: