Μοτίβα εξέλιξης πινάκων σε σχεσιακές βάσεις δεδομένων

Φόρτωση...
Μικρογραφία εικόνας

Ημερομηνία

Συγγραφείς

Καλάκου, Θεολογία

Τίτλος Εφημερίδας

Περιοδικό ISSN

Τίτλος τόμου

Εκδότης

Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής

Περίληψη

Τύπος

Είδος δημοσίευσης σε συνέδριο

Είδος περιοδικού

Είδος εκπαιδευτικού υλικού

Όνομα συνεδρίου

Όνομα περιοδικού

Όνομα βιβλίου

Σειρά βιβλίου

Έκδοση βιβλίου

Συμπληρωματικός/δευτερεύων τίτλος

Περιγραφή

Το λογισμικό που είναι σχεδιασμένο για να κάνει τη διαχείριση μιας σχεσια-κής βάσης δεδομένων εξελίσσεται με την πάροδο του χρόνου- Η εξέλιξη αυτή μπορεί να είναι απόρροια λαθών στην αρχική σχεδίαση ή οι χρήστες να ανακαλύπτουν πώς θα ήθελαν επιπλέον δυνατότητες από το λογισμικό- Συνεπώς, για να συνεχίσει το λογισμικό να είναι λειτουργικό και βιώσιμο, θα πρέπει να προσαρμόζεται στις νέες απαιτήσεις- Οι νέες πληροφορίες που αποθηκεύονται καθώς και η εξέλιξη του λογισμικού για την διαχείριση αυτών των νέων πληροφοριών είναι ζητήματα μεγάλης σημασίας- Σε κάθε αλλαγή τα δεδομένα και ο κώδικας εφαρμογής πρέπει να συγχρονιστούν με το νέο σχήμα- Συνεπώς, η κατανόηση της εξέλιξης του σχήματος είναι πολύ σημαντική ώστε να συνεχίζεται ο κύκλος ζωής της εφαρμογής. Το βασικό ερώτημα που θέλουμε να απαντήσουμε στην παρούσα εργασία είναι αν η εξέλιξη των βάσεων δεδομένων ακολουθεί κάποια πρότυπα- Τα πρότυπα αυτά είναι (α) το πρότυπο Γάμμα που συνδυάζει το μέγεθος ενός πίνακα κατά τη γέννηση με την διάρκειας ζωής του και (β) το πρότυπο του αντίστροφο Γ που συνδυάζει την διάρκεια ζωής ενός πίνακα με το πλήθος των αλλαγών. Το πρώτο μέρος της εργασίας (κεφάλαιο 2 και 3) ασχολείται με po ακόλουθο ερώτημα: Τι έρευνα έχει γίνει πάνω στην εξέλιξη του σχήματος; Καταγράφονται αποτελέσματα 8 ερευνών και τι απαντήσεις έδωσαν σε 3 βασικές κατηγορίες ερωτημάτων: (α) σχετικά με την μακροσκοπική περιγραφή της εξέλιξης στο χρόνο (πόσο συχνά και σε τι βαθμό αλλάζουν τα σχήματα από έκδοση σε έκδοση), (β) σχετικά με την εσωτερική δομή και ανάλυση των αλλαγών (ποσοτικές μετρήσεις) και (γ) σχετικά με την εξωτερική σχέση των αλλαγών του σχήματος με τον περιβάλλοντα κώδικα- Μελετήθηκαν επίσης τα πρότυπα που εξάγονται κατά τη μελέτη πληροφοριών σχετικών με τις ’’γεννήσεις”, του “θανάτους” και τις ενημερώσεις πινάκων και πεδίων, μαζί με την εξέλιξη του μεγέθους του σχήματος- Το δεύτερο μέρος της εργασίας αποτελείται από τα κεφάλαια 4 και 5. Στο κεφάλαιο 4 τίθεται po ακόλουθο ερώτημα: ποια είναι η συμπεριφορά όσον αφορά την επιβίωση των wide πινάκων (δηλαδή των πινάκων με πάνω από 10 attributes); Η κατανόηση του κύκλου ζωής των wide πινάκων βοηθά στην έρευνα του προτύπου Γάμμα καθώς αυτό το πρότυπο βασίζεται στην διάρκεια ζωής των πινάκων- Η έρευνα έγινε σε 35 σύνολα δεδομένων- Τα βασικά ερωτήματα που απαντήθηκαν είναι (α) Ποια είναι η πιθανότητα να ζήσουν οι wide πίνακες; (β) Ποια είναι η πιθανότητα να επιβιώσουν οι wide πίνακες σε σχέση με τους not wide ; και (γ) αν επιβιώνουν οι wide πίνακες με μεγαλύτερη πιθανότητα όταν είναι λίγοι; Στο κεφάλαιο 5 το βασικό ερώτημα αφορά στο να εντοπιστούν τα χαρακτηριστικά των συνόλων δεδομένων στα οποία μπορεί να μελετηθεί το πρότυπο του αντίστροφου Γ- Η μελέτη έγινε σε 195 σύνολα δεδομένων και η βασική έρευνα αφορά του πίνακες με πολλές αλλαγές και πως αυτές οι αλλαγές συνδυάζονται με την διάρκεια ζωής των πινάκων- Η έρευνα των παραπάνω ερωτημάτων έγινε στο σύνολο των συνόλων δεδομένων αλλά και ανά κατηγορία- Τα σύνολα δεδομένων κατηγοριοποιήθηκαν με βάση τις ουσιαστικές αλλαγές πάνω στο σχήμα (όχι σε αλλαγές που αφορούν σχολιασμό, δημιουργία δεικτών ή οτιδήποτε δεν διαφοροποιεί το σχήμα) και με βάση το πλήθος των attributes που αλλάχθηκαν- Οι κατηγορίες που μελετήθηκαν είναι : 0_FROZEN (totalActivity = 0), 1_ALMOST_FROZEN (totalActivity <= 10 updated attributes), 1_FocusedShot_n_FROZEN (totalActivity > 10 updated attributes), 2_MODERATE (totalActivity <= 90 updated attributes), 3_FocusedShot_n_LOW, 5_ACTIVE (totalActivity > 90 updated attributes).
Software designed to operate on top of a relational database evolves over time. This development may take place to fix errors in the original design or the demand of the users to have additional features in the software. Therefore, in order for the software to continue to be functional and viable, it will have to update to the new requirements. The new information stored and the updates of the software for managing this are very important issues. At each change the data and the software must be synchronized with the new format. Therefore, understanding the evolution of the schema is very important in order to continue the life cycle of the application. In this Thesis, we want to answer the key question if the evolution of databases follows certain patterns. These patterns are (a) the model that combines the size of a table at birth with the duration of its life. (Gamma pattern) and (b) the inverse Gamma pattern that combines the duration of the life of a table with the number of updates. The first part of the Thesis (chapters 2 and 3), deals with the following question: What research has been done on the evolution of the schema? We record the results of 8 papers and the answers they gave to 3 main categories of questions: (a) about the macroscopic description of evolution over time (how often and to what extent the patterns change from version to version), (b) about the internal structure and analysis of changes (quantitative measurements) and (c) on the external relationship of schema changes to the surrounding code. We studied also to the patterns extracted during the study of information related to "births", "deaths" and table updates along with the evolution of the database schema'. The second part of the work consists of chapters 4 and 5. In chapter 4, the following question is asked: what is the behavior regarding the survival of wide tables (i.e., tables with more than 10 attributes)? Understanding the life cycle of wide tables helps in researching the Gamma pattern as this pattern is based on the circle of tables life. The research was conducted on 35 datasets. The questions answered are (a) what is the probability of wide tables survival? (b) What is the probability of wide tables to survive in relation of the probability of the not wide ones? and (c) are wide tables more likely to survive when they are few? In Chapter 5, the main question is to identify the characteristics of the data sets in which the inverse C model can be studied. The study was conducted on 195 data sets and the basic research concerns the tables with many changes and how these changes are combined with the lifespan of this tables. The research of the above questions was done in the whole of data sets but also separated by category. Datasets were categorized based on substantial changes to the schema (not changes to annotation, indexing, or anything that does not differentiate the schema) and on the number of attributes changed. The categories studied are: 0_FR0ZEN (totalActivity = 0), 1_ALMOST_FROZEN (totalActivity <= 10 updated attributes), 1_FocusedShot_n_FR0ZEN (totalActivity > 10 updated attributes), 2_MODERATE (totalActivity <= 90 updated attributes), 3_FocusedShot_n_L0W, 5_ACTIVE (totalActivity > 90 updated attributes).

Περιγραφή

Λέξεις-κλειδιά

Σχεσιακές βάσεις δεδομένων, Relational databases

Θεματική κατηγορία

Σχεσιακές βάσεις δεδομένων

Παραπομπή

Σύνδεσμος

Γλώσσα

el

Εκδίδον τμήμα/τομέας

Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής

Όνομα επιβλέποντος

Βασιλειάδης, Παναγιώτης

Εξεταστική επιτροπή

Βασιλειάδης, Παναγιώτης
Μαμουλής, Νικόλαος
Πιτουρά, Ευαγγελία

Γενική Περιγραφή / Σχόλια

Ίδρυμα και Σχολή/Τμήμα του υποβάλλοντος

Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής

Πίνακας περιεχομένων

Χορηγός

Βιβλιογραφική αναφορά

Βιβλιογραφία: σ. 111

Ονόματα συντελεστών

Αριθμός σελίδων

112 σ.

Λεπτομέρειες μαθήματος

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced

Άδεια Creative Commons

Άδεια χρήσης της εγγραφής: Attribution-NonCommercial-NoDerivs 3.0 United States