Generating a benchmark for RDF stream processing.

Φόρτωση...
Μικρογραφία εικόνας
Ημερομηνία
2025-01-23
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
ΕΛΜΕΠΑ, Σχολή Μηχανικών (ΣΜΗΧ), ΠΜΣ Μηχανικών Πληροφορικής
Περίληψη
RDF Stream Processing (RSP) has become a vital area of research, driven by the growing need to process and analyze continuous streams of RDF data in real-time. However, the domain still faces several challenges, particularly in the areas of standardization, system performance, and benchmarking. This paper explores the current state of RSP systems, with a specific focus on the evaluation of existing benchmarks. We assess these benchmarks based on key performance choke points, such as parallel join execution, full-text search capabilities, and duplicate elimination, identifying significant gaps in their ability to comprehensively evaluate system performance. To address these shortcomings, a benchmark was implemented in Java, built on top of RSP4J and uses the RSP-QL language to create queries. This benchmark tries to introduce additional evaluation criteria aimed at overcoming existing limitations and provides a more robust measure of system performance across various scenarios. Through this work, the goal is the advance of the field in RDF stream processing by contributing both to the ongoing standardization efforts and to the development of more effective and comprehensive benchmarking tools.
Η Επεξεργασία Ροών RDF (RDF Stream Processing - RSP) έχει γίνει ένας σημαντικός τομέας έρευνας, ο οποίος οδηγείται από την αυξανόμενη ανάγκη για επεξεργασία και ανάλυση συνεχών ροών δεδομένων RDF σε πραγματικό χρόνο. Ωστόσο, ο τομέας εξακολουθεί να αντιμετωπίζει αρκετές προκλήσεις, ιδιαίτερα στους τομείς της τυποποίησης, της απόδοσης των συστημάτων και της αξιολόγησης. Αυτή η εργασία εξετάζει την τρέχουσα κατάσταση των συστημάτων RSP, με συγκεκριμένη εστίαση στην αξιολόγηση των υπαρχόντων benchmarks. Αξιολογούμε αυτά τα benchmarks με βάση βασικά σημεία απόδοσης, όπως η παράλληλη εκτέλεση join, οι δυνατότητες αναζήτησης πλήρους κειμένου και η εξάλειψη των διπλότυπων, εντοπίζοντας σημαντικά κενά στην ικανότητά τους να αξιολογήσουν συνολικά την απόδοση των συστημάτων. Για την αντιμετώπιση αυτών των αδυναμιών, υλοποιήθηκε ένα benchmark σε Java, το οποίο βασίζεται στο RSP4J και χρησιμοποιεί την γλώσσα RSP-QL για την δημιουργία επερωτήσεων. Αυτό το benchmark εισάγει πρόσθετα κριτήρια αξιολόγησης με στόχο την υπέρβαση των υπαρχόντων περιορισμών και προσπαθεί να παρέχει ένα πιο αξιόπιστο μέτρο απόδοσης των συστημάτων σε διάφορα σενάρια. Μέσω αυτής της εργασίας, ο στόχος είναι η προώθηση του τομέα της επεξεργασίας ροών RDF, συνεισφέροντας τόσο στις συνεχιζόμενες προσπάθειες τυποποίησης όσο και στην ανάπτυξη πιο αποτελεσματικών και ολοκληρωμένων εργαλείων αξιολόγησης.
Περιγραφή
Λέξεις-κλειδιά
Επεξεργασία ροών δεδομένων RDF, RDF stream processing, Συγκριτική αξιολόγηση, Benchmarking
Παραπομπή