Migrating a data warehouse from a relational database to a document store and lessons learned
dc.contributor.author | Lazos, Ioannis | en |
dc.date.accessioned | 2020-12-21T11:48:02Z | |
dc.date.available | 2020-12-21T11:48:02Z | |
dc.identifier.uri | https://olympias.lib.uoi.gr/jspui/handle/123456789/30431 | |
dc.identifier.uri | http://dx.doi.org/10.26268/heal.uoi.10290 | |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
dc.subject | Data warehouses | en |
dc.subject | Relational database | en |
dc.subject | Document store database | en |
dc.subject | Αποθήκες δεδομένων | el |
dc.subject | Σχεσιακή βάση δεδομένων | el |
dc.subject | Βάση δεδομένων εγγράφων | el |
dc.title | Migrating a data warehouse from a relational database to a document store and lessons learned | en |
dc.title | Διδάγματα που αποκτήθηκαν μεταφέροντας μια αποθήκη δεδομένων από μια σχεσιακή βάση δεδομένων σε μια βάση δεδομένων εγγράφων | el |
heal.abstract | Traditional database systems have been based on the relational model for storage. These are widely known as SQL databases named after the language they were queried by. In the last few years, however, non-relational databases have dramatically risen in popularity. These databases are commonly known as NoSQL databases, clearly marking them different from the traditional SQL databases. A big number of these databases are based on document stores which provides flexibility on schema creation and are claimed to perform better than SQL databases. Medium to big sized companies use huge amounts of structured, semi structured, and unstructured corporate data. With the availability of cheap storage, this data is stored for reporting, decision taking and other various applications. Processing such vast amount of data requires speed and flexible schemas. Document stores claim to satisfy these requirements. In this thesis we are migrating a medium sized company's SQL database to a document store, taking notes on all procedures needed and finally evaluating the performance of both databases on query execution times, using alternative hardware configurations. We used two market leading products from the same vendor, Microsoft SQL Server and Microsoft Azure Cosmos. The reason we chose Microsoft Azure Cosmos DB document store is because it is also a cloud database solution, that provides all the tools needed to deploy a datastore to the cloud. In the experimental evaluation we conducted, it has been shown that document store, does not perform better on all cases, compared to SQL database. | en |
heal.abstract | Τα παραδοσιακά συστήματα βάσεων δεδομένων βασίζονται στο σχεσιακό μοντέλο. Είναι ευρέως γνωστά ως βάσεις δεδομένων SQL από τη γλώσσα που χρησιμοποιείται για την διαχείρισή τους. Τα τελευταία χρόνια, ωστόσο, οι μη σχεσιακές βάσεις δεδομένων έχουν αυξηθεί δραματικά σε δημοτικότητα. Αυτές οι βάσεις δεδομένων είναι κοινώς γνωστές ως βάσεις δεδομένων NoSQL, σηματοδοτώντας σαφώς ότι είναι διαφορετικές από τις παραδοσιακές βάσεις δεδομένων SQL. Ένας μεγάλος αριθμός αυτών, χρησιμοποιεί για την αποθήκευση των δεδομένων έγγραφα (documents) τα οποία παρέχουν ευελιξία στη δημιουργία των σχημάτων της βάσης και θεωρείται πως επιτυγχάνουν καλύτερες επιδόσεις από τις βάσεις δεδομένων SQL. Εταιρείες μεσαίου έως μεγάλου μεγέθους χρησιμοποιούν τεράστιες ποσότητες, δομημένων, ημιδομημένων και αδόμητων εταιρικών δεδομένων. Με την πληθώρα χαμηλού κόστους μέσων αποθήκευσης, τα δεδομένα αυτά αποθηκεύονται και χρησιμοποιούνται για τη δημιουργία αναφορών, τη λήψη αποφάσεων και πολλές άλλες εφαρμογές. Η επεξεργασία τόσο μεγάλου όγκου δεδομένων απαιτεί ταχύτητα και ευέλικτα σχήματα. Οι βάσεις δεδομένων εγγράφων θεωρείται ότι μπορούν να καλύψουν αυτές τις απαιτήσεις. Σε αυτή τη διατριβή μεταφέρουμε τα δεδομένα μιας βάσης SQL μιας εταιρείας μεσαίου μεγέθους σε μια βάση δεδομένων εγγράφων, καταγράφοντας όλα τα βήματα που απαιτούνται και αξιολογώντας την απόδοση των δύο βάσεων δεδομένων κατά την εκτέλεση ερωτημάτων αναζήτησης, χρησιμοποιώντας διαφορετικές διαμορφώσεις υλικού. Χρησιμοποιήσαμε δύο κορυφαία προϊόντα της αγοράς του ίδιου προμηθευτή, τον Microsoft SQL Server και το Microsoft Azure CosmosDB. Επιλέξαμε το Microsoft Azure CosmosDB σαν βάση δεδομένων εγγράφων, καθώς υποστηρίζει την τεχνολογία νέφους (cloud) και παρέχει όλα τα εργαλεία που απαιτούνται για την μεταφορά της βάσης στο νέφος. Στην πειραματική αξιολόγηση που διεξαγάγουμε, παρατηρείται ότι οι βάσεις δεδομένων αποθήκευσης εγγράφων, δεν αποδίδουν καλύτερα σε όλες τις περιπτώσεις, σε σύγκριση με τις βάσεις δεδομένων SQL. | el |
heal.academicPublisher | Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής | el |
heal.academicPublisherID | uoi | |
heal.access | free | |
heal.advisorName | Αναστασιάδης, Στέργιος | el |
heal.bibliographicCitation | Βιβλιογραφία: σ. 61-63 | el |
heal.classification | Data warehouses | |
heal.committeeMemberName | Αναστασιάδης, Στέργιος | el |
heal.committeeMemberName | Μαμουλής, Νικόλαος | el |
heal.committeeMemberName | Νομικός, Χρήστος | el |
heal.dateAvailable | 2020-12-21T11:49:02Z | |
heal.fullTextAvailability | true | |
heal.language | en | |
heal.numberOfPages | 67 σ. | |
heal.publicationDate | 2020 | |
heal.recordProvider | Πανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής | el |
heal.type | masterThesis | |
heal.type.el | Μεταπτυχιακή εργασία | el |
heal.type.en | Master thesis | en |
Αρχεία
Πρωτότυπος φάκελος/πακέτο
1 - 1 of 1
Φόρτωση...
- Ονομα:
- Μ.Ε. LAZOS IOANNIS 2020.pdf
- Μέγεθος:
- 1.24 MB
- Μορφότυπο:
- Adobe Portable Document Format
- Περιγραφή:
Φάκελος/Πακέτο αδειών
1 - 1 of 1
Φόρτωση...
- Ονομα:
- license.txt
- Μέγεθος:
- 1.71 KB
- Μορφότυπο:
- Item-specific license agreed upon to submission
- Περιγραφή: