Ένα συνθετικό σημείο αναφοράς (Benchmark) για την αξιολόγηση συστημάτων δεδομένων ροής RDF.
Φόρτωση...
Ημερομηνία
2025-01-23
Συγγραφείς
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
ΕΛΜΕΠΑ, Σχολή Μηχανικών (ΣΜΗΧ), ΠΜΣ Μηχανικών Πληροφορικής
Επιβλέπων
Περίληψη
Η Επεξεργασία Ροών RDF (RDF Stream Processing - RSP) έχει αναδειχθεί σε έναν κρίσιμο
τομέα έρευνας, υποκινούμενο από την αυξανόμενη ζήτηση για ανάλυση και διαχείριση
συνεχών ροών δεδομένων RDF σε πραγματικό χρόνο. Παρά την πρόοδό του, ο τομέας
εξακολουθεί να αντιμετωπίζει σημαντικές προκλήσεις, ιδίως όσον αφορά την τυποποίηση,
την αποδοτικότητα των συστημάτων και την αξιολόγηση τους. Η παρούσα μελέτη εξετάζει
την τρέχουσα κατάσταση των συστημάτων RSP, με έμφαση στην αξιολόγηση των διαθέσιμων
benchmarks. Αναλύουμε αυτά τα benchmarks με βάση καίρια κριτήρια απόδοσης, όπως η
ταυτόχρονη εκτέλεση join, οι δυνατότητες αναζήτησης πλήρους κειμένου και η αφαίρεση
διπλότυπων, εντοπίζοντας σημαντικές ελλείψεις στην ικανότητά τους να αξιολογήσουν
ολιστικά την απόδοση των συστημάτων. Για την αντιμετώπιση αυτών των αδυναμιών,
υλοποιήθηκε ένα benchmark σε Java, βασισμένο στο RSP4J, το οποίο χρησιμοποιεί την
γλώσσα RSP-QL για τη δημιουργία επερωτήσεων. Το συγκεκριμένο benchmark εισάγει
επιπλέον κριτήρια αξιολόγησης, με στόχο την υπέρβαση των περιορισμών των υπαρχόντων
προσεγγίσεων και προσφέρει ένα πιο αξιόπιστο μέτρο της απόδοσης των συστημάτων σε
διάφορα σενάρια. Η εργασία αυτή στοχεύει στην προώθηση του πεδίου της επεξεργασίας
ροών RDF, συμβάλλοντας τόσο στις προσπάθειες τυποποίησης όσο και στην ανάπτυξη πιο
αποδοτικών και ολοκληρωμένων εργαλείων αξιολόγησης.
RDF Stream Processing (RSP) has emerged as a critical research area, driven by the growing demand for real-time analysis and management of continuous RDF data streams. Despite recent progress, the field still faces significant challenges, particularly regarding standardization, system efficiency, and evaluation. This study examines the current state of RSP systems, with a focus on evaluating available benchmarks. We analyze these benchmarks based on key performance criteria, such as concurrent join execution, full-text search capabilities, and duplicate removal, and identify significant shortcomings in their ability to holistically assess system performance. To address these shortcomings, we implemented a Java-based benchmark using RSP4J, which utilizes the RSP-QL language for query creation. This benchmark introduces additional evaluation criteria to overcome the limitations of existing approaches and provides a more reliable measure of system performance across various scenarios. This master’s thesis aims to advance the field of RDF Stream Processing by contributing to standardization efforts and by developing more efficient and comprehensive evaluation tools
RDF Stream Processing (RSP) has emerged as a critical research area, driven by the growing demand for real-time analysis and management of continuous RDF data streams. Despite recent progress, the field still faces significant challenges, particularly regarding standardization, system efficiency, and evaluation. This study examines the current state of RSP systems, with a focus on evaluating available benchmarks. We analyze these benchmarks based on key performance criteria, such as concurrent join execution, full-text search capabilities, and duplicate removal, and identify significant shortcomings in their ability to holistically assess system performance. To address these shortcomings, we implemented a Java-based benchmark using RSP4J, which utilizes the RSP-QL language for query creation. This benchmark introduces additional evaluation criteria to overcome the limitations of existing approaches and provides a more reliable measure of system performance across various scenarios. This master’s thesis aims to advance the field of RDF Stream Processing by contributing to standardization efforts and by developing more efficient and comprehensive evaluation tools
Περιγραφή
Λέξεις-κλειδιά
Επεξεργασία ροών δεδομένων RDF, Συγκριτική αξιολόγηση, RDF stream processing, Benchmarking