Data storytelling via sibling queries and highlight extraction
Φόρτωση...
Ημερομηνία
Συγγραφείς
Dougia, Aggeliki
Δούγια, Αγγελική
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής
Περίληψη
Τύπος
Είδος δημοσίευσης σε συνέδριο
Είδος περιοδικού
Είδος εκπαιδευτικού υλικού
Όνομα συνεδρίου
Όνομα περιοδικού
Όνομα βιβλίου
Σειρά βιβλίου
Έκδοση βιβλίου
Συμπληρωματικός/δευτερεύων τίτλος
Περιγραφή
Η Επιχειρησιακή νοημοσύνη (Business Intelligence) στηρίζεται σε α) σε ιεραρχικά πολυδιάστατα δεδομένα, που έρχονται με τη μορφή κύβων δεδομένων και δια-στάσεων με ιεραρχίες για την αναπαράσταση πληροφοριών και β) προηγμένους τελεστές ερωτημάτων για την εξαγωγή ενδιαφέροντών φαινομένων από τα διαθέσιμα δεδομένα.
Σε αυτή την εργασία, προτείνουμε έναν τελεστή ερωτήματος που παίρνει τον προσδιορισμό ενός γραφήματος ως είσοδο και παράγει μια ιστορία δεδομένων (data story) ως έξοδο. Το κίνητρο για αυτόν τον τελεστή Query-As-A-Chart έγκει-ται στην παρατήρηση ότι τα παραδοσιακά ερωτήματα, συμπεριλαμβανομένων αυτών της επιχειρησιακής νοημοσύνης, είναι ανεπαρκή για να εκφράσουν τους στόχους γνώσης υψηλότερου επιπέδου που έχουν επί του παρόντος οι αναλυτές.
Στην περίπτωση που τα αποτελέσματα του ερωτήματος μπορούν να οπτικοποιη-θούν, ο τελεστής λαμβάνει το ερώτημα ως είσοδο μαζί με τον προσδιορισμό της γραφικής παράστασης (γραφήματος) που επέλεξε ο αναλυτής για να δει. Οι διαθέσιμες επιλογές είναι γραμμικό γράφημα (line-chart), ραβδόγραμμα (bar-chart) και γράφημα διασποράς (scatter-plot).
Εκτός από την πρώτη επέκταση στην παραδοσιακή αναζήτηση, με τον προσδιο-ρισμό γραφήματος μαζί με το ερώτημα, μια δεύτερη επέκταση περιλαμβάνει την επέκταση του τρόπου χειρισμού των αποτελεσμάτων των ερωτημάτων. Στο πλαί-σιο της εργασίας, προστίθενται δύο επεκτάσεις στην αρχική εκτέλεση ερωτήμα-τος. Η πρώτη αφορά του αρχικού ερωτήματος με βοηθητικά ερωτήματα, ονομα-ζόμενα (sibling), τα οποία παρέχουν αποτελέσματα παρόμοιων υποσυνόλων του χώρου δεδομένων με του αρχικού. Έτσι, για παράδειγμα, εάν το αρχικό ερώτημα αφορά ένα ατομικό φίλτρο της μορφής «πόλη = Ιωάννινα», θέλουμε να δημιουρ-γήσουμε αυτόματα ερωτήματα sibling για όλες τις πόλεις που αφορούν την ίδια χώρα με τα Ιωάννινα, δηλαδή την Ελλάδα, και να αντιπαραβάλουμε τα αποτελέ-σματα τους. Η δεύτερη επέκταση, αφορά την εφαρμογή μοντέλων στα δεδομένα των αποτελεσμάτων. Υποθέτοντας ότι μία από τις διαστάσεις ομαδοποίησης είναι ο χρόνος, δημιουργώντας έτσι μια χρονοσειρά ως αποτέλεσμα του ερωτήματος, μοντέλα όπως trend, unimodality, bimodality, or dominance, μπορούν να εφαρ-μόζονται σε διαφορετικές παραγόμενες χρονοσειρές για τα διάφορα ερωτήματα και συγκρίνοντας τα μεταξύ τους για ομοιότητες και διαφορές. Τα εξαγόμενα highlight βαθμολογούνται, ταξινομούνται και φιλτράρονται με ένα φίλτρο rank-n-prune.
Το αποτέλεσμα ολόκληρης της διαδικασίας είναι (α) ένα σύνολο γραφημάτων που απεικονίζουν τα αποτελέσματα, αλλά το πιο σημαντικό, (β) μια συνδυασμέ-νη αναφορά ή ιστορία δεδομένων, που συνδυάζει τις γραφικές παραστάσεις, μαζί με μια περιγραφή κειμένου των κυριότερων ανιχνευόμενων σημείων, για να επι-στραφεί στον αναλυτή.
Business Intelligence relies on (a) hierarchical multidimensional data, coming in the form of data cubes and dimension hierarchies for the representation of infor-mation, and (b) advanced querying operators for the extraction of interesting facts from the available data. In this Thesis, we propose a querying operator that takes a chart specification as its input and produces a data story as its output. The motivation for this Query-As-A-Chart operator lies in the observation that traditional queries, including Business Intelligence ones, are inadequate to express the higher-level knowledge goals that analysts currently have. To the extent that query results are typically visualized, the operator takes this fact as input, and complements its specification with the type of graphical representa-tion (chart) expected to be produced, in the form of a line-chart, bar-chart, or scat-ter plot. Apart from this first extension to traditional querying, in the form of extending the query specification, a second extension includes the extension of how query results are handled. In the context of this Thesis, two extensions are added to the original query execution. The first concerns complementing the original query with auxilia-ry, sibling queries that provide results of similar subsets of the data space to the original one. So, for example, if the original query concerns an atomic filter of the form “city = Ioannina”, we want to automatically generate sibling queries for all the cities that pertain to the same country as Ioannina, i.e., Greece, and contrast the re-sults. A second extension has to do with the application of models to the resulting data. Assuming one of the grouper dimensions is time, thus producing a timeseries as a result of the query, models like trend, unimodality, bimodality, or dominance, can be applied over the different timeseries produced for the different queries and compared for commonalities and exceptions. The extracted highlights are appropri-ately scored, ranked and pruned on the basis of a simple rank-n-prune filter. The result of the entire process is (a) a set of charts that visualize the results, but most importantly, (b) a combined report, or data story, that combines the graphical representations, along with a textual description of the detected highlights, to be returned to the analyst.
Business Intelligence relies on (a) hierarchical multidimensional data, coming in the form of data cubes and dimension hierarchies for the representation of infor-mation, and (b) advanced querying operators for the extraction of interesting facts from the available data. In this Thesis, we propose a querying operator that takes a chart specification as its input and produces a data story as its output. The motivation for this Query-As-A-Chart operator lies in the observation that traditional queries, including Business Intelligence ones, are inadequate to express the higher-level knowledge goals that analysts currently have. To the extent that query results are typically visualized, the operator takes this fact as input, and complements its specification with the type of graphical representa-tion (chart) expected to be produced, in the form of a line-chart, bar-chart, or scat-ter plot. Apart from this first extension to traditional querying, in the form of extending the query specification, a second extension includes the extension of how query results are handled. In the context of this Thesis, two extensions are added to the original query execution. The first concerns complementing the original query with auxilia-ry, sibling queries that provide results of similar subsets of the data space to the original one. So, for example, if the original query concerns an atomic filter of the form “city = Ioannina”, we want to automatically generate sibling queries for all the cities that pertain to the same country as Ioannina, i.e., Greece, and contrast the re-sults. A second extension has to do with the application of models to the resulting data. Assuming one of the grouper dimensions is time, thus producing a timeseries as a result of the query, models like trend, unimodality, bimodality, or dominance, can be applied over the different timeseries produced for the different queries and compared for commonalities and exceptions. The extracted highlights are appropri-ately scored, ranked and pruned on the basis of a simple rank-n-prune filter. The result of the entire process is (a) a set of charts that visualize the results, but most importantly, (b) a combined report, or data story, that combines the graphical representations, along with a textual description of the detected highlights, to be returned to the analyst.
Περιγραφή
Λέξεις-κλειδιά
Data storytelling, Chart queries, Highlights
Θεματική κατηγορία
Παραπομπή
Σύνδεσμος
Γλώσσα
en
Εκδίδον τμήμα/τομέας
Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής
Όνομα επιβλέποντος
Vassiliadis, Panos
Εξεταστική επιτροπή
Vassiliadis, Panos
Mamoulis, Nikolaos
Zarras, Apostolos
Mamoulis, Nikolaos
Zarras, Apostolos
Γενική Περιγραφή / Σχόλια
Ίδρυμα και Σχολή/Τμήμα του υποβάλλοντος
Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή
Πίνακας περιεχομένων
Χορηγός
Βιβλιογραφική αναφορά
Ονόματα συντελεστών
Αριθμός σελίδων
74 p.
Λεπτομέρειες μαθήματος
item.page.endorsement
item.page.review
item.page.supplemented
item.page.referenced
Άδεια Creative Commons
Άδεια χρήσης της εγγραφής: Attribution-NonCommercial-NoDerivs 3.0 United States