Automated process of digitizing scanned documents using Optical Character Recognition (OCR) services in the cloud, and semantically linking them based on keywords.

dc.contributor.advisorMalamos,Athanasiosel
dc.contributor.advisorΜαλάμος, Αθανάσιοςen
dc.contributor.authorPsyris, Emmanouilel
dc.contributor.authorΨυρής, Εμμανουήλen
dc.date.accessioned2025-07-04T09:54:45Z
dc.date.available2025-07-04T09:54:45Z
dc.date.issued2025-07-04
dc.description.abstractThis thesis focuses on the automated digitization of printed documents using OCR and NLP technologies. The goal is to develop a system that enables Greek businesses to convert physical documents into digital format and organize them efficiently. The study addresses the challenge of limited Greek language support in existing NLP tools and proposes solutions through Google Cloud Vision OCR and Google Cloud Translation API. The application provides accurate text recognition, automatic classification, and secure cloud storage via Firebase. Additionally, it allows users to search and retrieve documents easily. The development was carried out using the Go programming language, ensuring speed and reliability. The research evaluates the application’s performance, highlighting improvements in business productivity through automation. The proposed solution serves as a practical tool for helping small businesses transition into the digital world, reducing the need for manual document processing. Future improvements include the integration of additional AI technologies for further automation.en
dc.description.abstractΗ παρούσα πτυχιακή εργασία επικεντρώνεται στην αυτοματοποιημένη ψηφιοποίηση έντυπων εγγράφων χρησιμοποιώντας τεχνολογίες OCR και NLP. Στόχος είναι η δημιουργία ενός συστήματος που επιτρέπει στις ελληνικές επιχειρήσεις να μετατρέπουν φυσικά έγγραφα σε ψηφιακή μορφή και να τα οργανώνουν αποτελεσματικά. Η μελέτη εξετάζει τα προβλήματα περιορισμένης υποστήριξης της ελληνικής γλώσσας από τα υπάρχοντα εργαλεία NLP και προτείνει λύσεις μέσω του Google Cloud Vision OCR και του Google Cloud Translation API. Η εφαρμογή προσφέρει ακριβή αναγνώριση κειμένου, αυτόματη ταξινόμηση και ασφαλή αποθήκευση στο cloud μέσω Firebase. Επιπλέον, δίνει στους χρήστες τη δυνατότητα αναζήτησης και ανάκτησης εγγράφων με ευκολία. Η ανάπτυξη βασίστηκε σε γλώσσα προγραμματισμού Go, εξασφαλίζοντας ταχύτητα και αξιοπιστία. Η έρευνα αξιολογεί την απόδοση της εφαρμογής, επισημαίνοντας τη βελτίωση στην παραγωγικότητα των επιχειρήσεων μέσω της αυτοματοποίησης. Η λύση που προτείνεται αποτελεί ένα πρακτικό εργαλείο για τη μετάβαση μικρών επιχειρήσεων στον ψηφιακό κόσμο, μειώνοντας την ανάγκη χειροκίνητης επεξεργασίας εγγράφων. Μελλοντικές βελτιώσεις περιλαμβάνουν την ενσωμάτωση πρόσθετων τεχνολογιών Τεχνητής Νοημοσύνης για περαιτέρω αυτοματοποίηση.el
dc.identifier.urihttps://apothesis.hmu.gr/handle/123456789/11331
dc.language.isoen
dc.publisherΕΛΜΕΠΑ, Σχολή Μηχανικών (ΣΜΗΧ), Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Statesen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/
dc.subjectOptical character recognition
dc.subjectCloud computing
dc.subjectNatural language processing (NLP)
dc.subjectΟπτική αναγνώριση χαρακτήρων
dc.subjectΥπολογιστικό νέφος
dc.titleAutomated process of digitizing scanned documents using Optical Character Recognition (OCR) services in the cloud, and semantically linking them based on keywords.en
dc.titleΑυτόματη διαδικασία αποδελτίωσης τοπογραφημένων κειμένων με τη χρήση υπηρεσιών μετατροπής εικόνων σε χαρακτήρες (OCR) στο υπολογιστικό νέφος και νοηματική συσχέτιση τους με βάση λέξεις κλειδιά.el
dc.typeΠτυχιακή Εργασία
heal.academicPublisherIDΕΛΜΕΠΑ Ελληνικό Μεσογειακό Πανεπιστήμιο
Αρχεία
Πρωτότυπος φάκελος/πακέτο
Τώρα δείχνει 1 - 1 of 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
PsyrisEmmanouil2024.pdf
Μέγεθος:
3.79 MB
Μορφότυπο:
Adobe Portable Document Format
Φάκελος/Πακέτο αδειών
Τώρα δείχνει 1 - 1 of 1
Δεν υπάρχει διαθέσιμη μικρογραφία
Ονομα:
license.txt
Μέγεθος:
2.17 KB
Μορφότυπο:
Item-specific license agreed upon to submission
Περιγραφή: