Categorical assessment of depression based on low level features.

Φόρτωση...
Μικρογραφία εικόνας
Ημερομηνία
2018-06-01
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Τ.Ε.Ι. Κρήτης, Σχολή Τεχνολογικών Εφαρμογών (Σ.Τ.Εφ), ΠΜΣ Πληροφορική και Πολυμέσα
T.E.I. of Crete, School of Engineering (STEF), PPS in Informatics and Multimedia
Επιβλέπων
Περίληψη
Mental illness is a disease which usually causes behavior disturbances. Nowadays, mental disorders are commonplace, affecting a large number of people. There are more than 200 forms of mental illness. Depression, bipolar disorder, dysthymia and anxiety disorder are some of the most common mood disorders that are inherently related to emotions. According to the European Statistical System [1], 7.1% of the European citizens reported having chronic depression. Whereas, the World Health Organization ranks major depressive disorder as the 4th leading cause of disability worldwide. Major depressive disorder (MDD), also known as clinical depression, is a mood disorder involving bad mood, low self-esteem and loss of interest in normal pleasurable activities. Depression affects the way of thinking, feeling and acting in daily duties. Major depressive disorder has observable behavioral symptoms. Actually, some behavioral cues are closely associated with depression, such as body language, speech, head and face movement. In most cases, facial expressions indicate individual’s depressed feelings. Technology has the potential to assess those cues for depression diagnosis. There are numerous research groups focused on automated depression detection based on audio and visual signals analysis. Automatic recognition of human emotions have a lot of applications in Human Computer Interaction and Affective Computing field. However until now the performance of such applications is still not satisfying. The aim of this work is to develop a framework for the assessment of major depressive disorder, as a supportive application for the clinical care of patients. In so doing we utilize the dataset of the depression recognition sub-challenge of the Audiovisual Emotion Recognition challenge (AVEC), as it is the only publically available dataset consisted by video recordings that are annotated with a depression index. Algorithmic methods were developed, using MATLAB, for the detection of depression using low level image-based features. In the proposed framework, two different motion representation methods were tested, namely: a) Motion History Image (MHI), and b) Gabor Motion History Image (GMHI). Appearance-based descriptors employed were the employed, namely Local Binary Pattern (LBP), Local Phase Quantization (LPQ), and Histogram of Oriented Gradients (HOG). Additionally, some statistical features were utilized. Subsequently, machine learning algorithms were selected in order to define the specificity of the proposed framework. The selected classification algorithms are k-Nearest Neighbors (kNN), Random Forest, Support Vector Machine (SVM) and Naïve Bayes. For the MHI approach the best performance 81.93% achieved by appearance-based descriptor HOG, and with combination of HIST-MEAN-STD using SVM classifier for 100 selected features. The execution time for those results are 1.46 seconds and 0.15 seconds respectively. As for GMHI approach the maximum F1 score is 81.93% achieved by the combination of statistical features HIST-MEAN-STD for 10 selected features and the execution time is 0.12 seconds.
Η ψυχική ασθένεια είναι μια ασθένεια η οποία συνήθως προκαλεί διαταραχές στη συμπεριφορά. Στην εποχή μας, οι ψυχικές διαταραχές είναι συνηθισμένες, επηρεάζοντας ένα μεγάλο αριθμό ανθρώπων. Υπάρχουν περισσότερες από 200 μορφές ψυχικής ασθένειας. Η κατάθλιψη, η διπολική διαταραχή, η δυσθυμία και η διαταραχή άγχους είναι μερικές από τις συνήθεις διαταραχές της διάθεσης που σχετίζονται εγγενώς με τα συναισθήματα. Σύμφωνα με το Ευρωπαϊκό Στατιστικό Σύστημα [1], το 7,1% των ευρωπαίων πολιτών ανέφερε ότι πάσχει από χρόνια κατάθλιψη. Ενώ, ο Παγκόσμιος Οργανισμός Υγείας κατατάσσει τη Μείζονα Καταθλιπτική Διαταραχή ως την 4η κύρια αιτία αναπηρίας παγκοσμίως. Η Μείζονα Καταθλιπτική Διαταραχή (MDD), επίσης γνωστή ως κλινική κατάθλιψη, είναι μια διαταραχή της διάθεσης που περιλαμβάνει κακή διάθεση, χαμηλή αυτοεκτίμηση και απώλεια ενδιαφέροντος για φυσιολογικές ευχάριστες δραστηριότητες. Η κατάθλιψη επηρεάζει τον τρόπο σκέψης, τα συναισθήματα και τη συμπεριφορά σε καθημερινά καθήκοντα. Η Μείζονα Καταθλιπτική Διαταραχή έχει παρατηρήσιμα συμπεριφορικά συμπτώματα. Στην πραγματικότητα, ορισμένα συμπεριφορικά σημάδια σχετίζονται στενά με την κατάθλιψη, όπως η γλώσσα του σώματος, η ομιλία, η κίνηση του κεφαλιού και του προσώπου. Στις περισσότερες περιπτώσεις, οι εκφράσεις του προσώπου υποδηλώνουν τα καταθλιπτικά συναισθήματα του ατόμου. Υπάρχουν πολυάριθμες ερευνητικές ομάδες που επικεντρώνονται στην αυτοματοποιημένη ανίχνευση της κατάθλιψης βασισμένη στην ανάλυση ακουστικών και οπτικών σημάτων. Η αυτόματη αναγνώριση των ανθρώπινων συναισθημάτων έχει πολλές εφαρμογές στον τομέα αλληλεπίδρασης ανθρώπου υπολογιστή και της συναισθηματικής πληροφορικής. Ωστόσο, μέχρι στιγμής η απόδοση τέτοιων εφαρμογών δεν είναι ακόμα ικανοποιητική. Ο στόχος αυτής της εργασίας είναι να αναπτυχθεί ένα πλαίσιο για την αξιολόγηση της μείζονος καταθλιπτικής διαταραχής, ως υποστηρικτική εφαρμογή για την κλινική φροντίδα των ασθενών. Για να γίνει αυτό, χρησιμοποιούμε το σύνολο των δεδομένων για την αναγνώριση της κατάθλιψης από τον διαγωνισμό Οπτικοακουστική Αναγνώριση Συναισθημάτων (AVEC), καθώς αποτελεί τη μοναδική βάση δεδομένων που διατίθεται στο κοινό, αποτελούμενη από οπτικοακουστικό υλικό συνοδευόμενο από ετικέτες με τον αντίστοιχο δείκτη κατάθλιψης. Αλγοριθμικές μέθοδοι αναπτύχθηκαν, κάνοντας χρήση του λογισμικού MATLAB, για την ανίχνευση της κατάθλιψης χρησιμοποιώντας χαμηλού επιπέδου χαρακτηριστικά βασισμένα σε εικόνα. Στο προτεινόμενο πλαίσιο δοκιμάστηκαν δύο διαφορετικές μέθοδοι αναπαράστασης της κίνησης, συγκεκριμένα: α) Motion History Image (MHI) και β) Gabor Motion History Image (GMHI). Οι περιγραφείς με βάση την εμφάνιση που χρησιμοποιήθηκαν, είναι το τοπικό δυαδικό πρότυπο (LBP), η τοπική ποσοτικοποίηση φάσης (LPQ) και το ιστόγραμμα των προσανατολισμένων διαβαθμίσεων (HOG). Επιπρόσθετα, χρησιμοποιήθηκαν ορισμένα στατιστικά στοιχεία. Ακολούθως, επελέγησαν αλγόριθμοι μηχανικής μάθησης για να εξετασθεί η «ειδικότητα» (“specificity”) του προτεινόμενου πλαισίου. Οι επιλεγμένοι αλγόριθμοι ταξινόμησης είναι k-Εγγύτατου Γείτονα (k-Nearest Neighbors), Δένδρα Αποφάσεων (Random Forest), Μηχανή Διανυσμάτων Υποστήριξης (Support Vector Machine) και Naïve Bayes. Για την προσέγγιση MHI η καλύτερη απόδοση ήταν 81,93% που επιτεύχθηκε με τα χαρακτηριστικά HOG και με τον συνδυασμό από τα χαρακτηριστικά HIST-MEAN-STD χρησιμοποιώντας SVM ταξινομητή για 100 επιλεγμένα χαρακτηριστικά. Ο χρόνος εκτέλεσης για αυτά τα αποτελέσματα είναι 1,46 δευτερόλεπτα και 0,15 δευτερόλεπτα αντίστοιχα. Όσον αφορά την προσέγγιση GMHI, το μέγιστο F1 είναι 81,93% και επιτυγχάνεται με τον συνδυασμό των στατιστικών χαρακτηριστικών HIST-MEAN-STD για 10 επιλεγμένα χαρακτηριστικά και ο χρόνος εκτέλεσης είναι 0,12 δευτερόλεπτα.
Περιγραφή
Λέξεις-κλειδιά
Παραπομπή