Ανάπτυξη και αξιολόγηση βάσης δεδομένων ομιλίας καταγεγραμμένης μέσω οπτικών τεχνικών λέιζερ

dc.creatorΜοβσεσιάν, Αράel
dc.creatorMovsesian, Araen
dc.date.accessioned2016-03-15T13:27:50Z
dc.date.available2016-03-15T13:27:50Z
dc.date.issued2014-10-05T13:00:46Z
dc.description.abstractΣτην παρούσα διπλωματική εργασία υλοποιείται μια οπτοηλεκτρονική διάταξη ανίχνευσης ήχων εξ' αποστάσεως, που βασίζεται στην τεχνική εκτροπής δέσμης laser από δονούμενη επιφάνεια. Με την χρήση αυτής της διάταξης καταγράφεται ηχητικό υλικό από μια πλήρως χαρακτηρισμένη βάση δεδομένων συναισθηματικής ομιλίας. Εν συνεχεία το καταγεγραμμένο ηχητικό υλικό εισέρχεται σε αλγόριθμους βελτίωσης. Έπειτα από την ολοκλήρωση της επεξεργασίας διεξάγεται μια σειρά από ειδικά σχεδιασμένα στατιστικά πειράματα με την συμμετοχή 10 ακροατών όπου τους ζητείται να αναγνωρίσουν το λεξιλογικό και το συναισθηματικό περιεχόμενο της ομιλίας στην επεξεργασμένη και την μη επεξεργασμένη εκδοχή των αρχείων. Η ανάλυση των απαντήσεων γίνεται με σκοπό την εξαγωγή συμπερασμάτων για την επίδοση των αλγορίθμων, της οπτοηλεκτρονικής διάταξης, και των ακροατών σε συνθήκες υψηλής και χαμηλής καταληπτότητας, μέσω σύγκρισης γραφημάτων ράβδων.el
dc.description.abstractIn the present study an optoelectronic arrangement for the remote detection of sound is developed, based on the laser beam deflection technique. Using this, sound material from a fully characterized speech data base is detected. The recorded material is then processed using appropriate algorithms. After the processing, the recorded material is used in a series of specially designed statistical experiments in which a total of 10 listeners are asked to recognise the lexical and emotional content of speech in both the processed and unprocessed versions. The answers are analysed in order to extract useful conclusions used to evaluate the performance of the algorithm, the optoelectronic arrangement, and the listeners, under conditions of high and low intelligibility, while the results are presented in appropriate bar graphs.en
dc.identifier.urihttp://hdl.handle.net/20.500.12688/2277
dc.languageel
dc.publisherΤ.Ε.Ι. Κρήτης, Σχολή Εφαρμοσμένων Επιστημών (Σ.Εφ.Ε), Τμήμα Μηχανικών Μουσικής Τεχνολογίας και Ακουστικής Τ.Ε. (Ρέθυμνο)el
dc.publisherT.E.I. of Crete, School of Applied Sciences, Department of Music Technology and Acoustics Engineering (in Rethymno)en
dc.rightsAttribution-ShareAlike 4.0 International (CC BY-SA 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-sa/4.0/
dc.titleΑνάπτυξη και αξιολόγηση βάσης δεδομένων ομιλίας καταγεγραμμένης μέσω οπτικών τεχνικών λέιζερel
dc.titleDevelopment and evaluation of speech data base detected via optical laser techniques.en
heal.academicPublisherIDteicrete
heal.advisorNameΜπακαρέζος, Ευθύμιοςel
heal.advisorNameΠαπαδογιάννης, Νεκτάριοςel
heal.advisorNameΖέρβας, Παναγιώτηςel
heal.advisorNameMpakarezos, Efthymiosen
heal.advisorNamePapadogiannis, Nektariosen
heal.advisorNameZervas, Panagiotisen
heal.fullTextAvailabilitytrue
heal.keywordλέιζερ, φωνή, ήχος, ταλάντωση, ομιλία, αντήχηση, αλγόριθμος, βάση δεδομένωνel
heal.keywordlaser, voice, sound, ταλάντωση, speech, reverberation, algorithm, data baseen
heal.typebachelorThesis
nm.hasExtrafalse
nm.originalItem/home/admin/content_to_import/browse/sefe/mta/2014/MovsesianAra
tcd.distinguishedfalse
tcd.surveyfalse
Αρχεία
Πρωτότυπος φάκελος/πακέτο
Τώρα δείχνει 1 - 1 of 1
Φόρτωση...
Μικρογραφία εικόνας
Ονομα:
MovsesianAra2014.pdf
Μέγεθος:
1.31 MB
Μορφότυπο:
Adobe Portable Document Format