Malamos,AthanasiosΜαλάμος, ΑθανάσιοςPsyris, EmmanouilΨυρής, Εμμανουήλ2025-07-042025-07-042025-07-04https://apothesis.hmu.gr/handle/123456789/11331This thesis focuses on the automated digitization of printed documents using OCR and NLP technologies. The goal is to develop a system that enables Greek businesses to convert physical documents into digital format and organize them efficiently. The study addresses the challenge of limited Greek language support in existing NLP tools and proposes solutions through Google Cloud Vision OCR and Google Cloud Translation API. The application provides accurate text recognition, automatic classification, and secure cloud storage via Firebase. Additionally, it allows users to search and retrieve documents easily. The development was carried out using the Go programming language, ensuring speed and reliability. The research evaluates the application’s performance, highlighting improvements in business productivity through automation. The proposed solution serves as a practical tool for helping small businesses transition into the digital world, reducing the need for manual document processing. Future improvements include the integration of additional AI technologies for further automation.Η παρούσα πτυχιακή εργασία επικεντρώνεται στην αυτοματοποιημένη ψηφιοποίηση έντυπων εγγράφων χρησιμοποιώντας τεχνολογίες OCR και NLP. Στόχος είναι η δημιουργία ενός συστήματος που επιτρέπει στις ελληνικές επιχειρήσεις να μετατρέπουν φυσικά έγγραφα σε ψηφιακή μορφή και να τα οργανώνουν αποτελεσματικά. Η μελέτη εξετάζει τα προβλήματα περιορισμένης υποστήριξης της ελληνικής γλώσσας από τα υπάρχοντα εργαλεία NLP και προτείνει λύσεις μέσω του Google Cloud Vision OCR και του Google Cloud Translation API. Η εφαρμογή προσφέρει ακριβή αναγνώριση κειμένου, αυτόματη ταξινόμηση και ασφαλή αποθήκευση στο cloud μέσω Firebase. Επιπλέον, δίνει στους χρήστες τη δυνατότητα αναζήτησης και ανάκτησης εγγράφων με ευκολία. Η ανάπτυξη βασίστηκε σε γλώσσα προγραμματισμού Go, εξασφαλίζοντας ταχύτητα και αξιοπιστία. Η έρευνα αξιολογεί την απόδοση της εφαρμογής, επισημαίνοντας τη βελτίωση στην παραγωγικότητα των επιχειρήσεων μέσω της αυτοματοποίησης. Η λύση που προτείνεται αποτελεί ένα πρακτικό εργαλείο για τη μετάβαση μικρών επιχειρήσεων στον ψηφιακό κόσμο, μειώνοντας την ανάγκη χειροκίνητης επεξεργασίας εγγράφων. Μελλοντικές βελτιώσεις περιλαμβάνουν την ενσωμάτωση πρόσθετων τεχνολογιών Τεχνητής Νοημοσύνης για περαιτέρω αυτοματοποίηση.enAttribution-NonCommercial-NoDerivs 3.0 United StatesOptical character recognitionCloud computingNatural language processing (NLP)Οπτική αναγνώριση χαρακτήρωνΥπολογιστικό νέφοςAutomated process of digitizing scanned documents using Optical Character Recognition (OCR) services in the cloud, and semantically linking them based on keywords.Αυτόματη διαδικασία αποδελτίωσης τοπογραφημένων κειμένων με τη χρήση υπηρεσιών μετατροπής εικόνων σε χαρακτήρες (OCR) στο υπολογιστικό νέφος και νοηματική συσχέτιση τους με βάση λέξεις κλειδιά.Πτυχιακή Εργασία