Σύνθεση ομιλίας και Ελληνικά - greek-language-tools/greek-nlp-notes GitHub Wiki

Σύνθεση ομιλίας και Ελληνικά

Εδώ μας απασχολεί το γλωσσικό κομμάτι της σύνθεσης φωνής, δηλαδή δε θα ασχοληθούμε ιδιαίτερα με το κομμάτι που αφορά επεξεργασία σήματος. Για να πετύχουμε κατανοητή εκφώνηση τυχαίων κειμένων γενικά απαιτείται αρκετά εκτενής γλωσσική επεξεργασία και μερικές φορές διόρθωση λαθών ή παραλείψεων π.χ., για να καταλάβουμε αν μια πρόταση είναι ερώτηση ή όχι (αν λείπει το ερωτηματικό), για να εκτιμήσουμε τα σημεία παύσης (χωρίς παύσεις οι ακροατές αποκομίζουν μια αίσθηση αφύσικης ομιλίας) κλπ. Επίσης χρειάζεται εκτενής κανονικοποίηση του κειμένου (ακρωνύμια, συντομογραφίες, αριθμοί, ημερομηνίες, χρηματικά ποσά, URLs, email διευθύνσεις κλπ).

Σύνδεσμοι

Άρθρο περιγράφει τη δημιουργία ενός Ελληνικού TTS συστήματος (μη διαθέσιμο) με το ανοιχτού κώδικα framework «festival» και το σύστημα MBROLA για το τελικό στάδιο. Μπορούμε να δούμε τα στάδια ανάπτυξης ενός τέτοιου συστήματος.

Άρθρο για την πρόβλεψη προσωδίας μέσω μηχανικής μάθησης από έγγραφα με κατάλληλη γλωσσική σήμανση.

Άρθρο που περιλαμβάνει ένα σύστημα «concept to speech» το οποίο ξεκινώντας από μία κατάλληλη οντολογία, παράγει κείμενο με κατάλληλη γλωσσική επισήμανση και το μετατρέπει σε ομιλία (χρήση σε ξεναγήσεις μουσείων).

Σελίδα του Γεράσιμου ξυδά στο research gate με πολύ ενδιαφέρουσες και χρήσιμες δημοσιεύσεις.

Διπλωματική του Θεόδωρου Μυρωνίδη η οποία περιγράφει διάφορα ΕΛΛΑΚ πλαίσια ανάπτυξης συστημάτων σύνθεσης φωνής (festival,OpenMary) και περιέχει και την απεικόνιση των Ελληνικών φωνημάτων στο αλφάβητο SAMPA.

Διδακτορική Διατριβή του Παναγιώτη Ζέρβα με τίτλο «ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΚΑΙ ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΠΡΟΣΩΔΙΑΚΩΝ ΦΑΙΝΟΜΕΝΩΝ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΜΕ ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΣΥΝΘΕΣΗ ΟΜΙΛΙΑΣ»

Άρθρο για τη δημιουργία της βάσης ακουστικών δεδομένων για την ανάπτυξη ενός συστήματος TTS για τα Ελληνικά

Άρθρο που περιγράφει το σύστημα TTS του παραπάνω άρθρου.

Άρθρο για στατιστική παραμετρική σύνθεση φωνής σε ελληνικά με βάση HMMs.

Άρθρο για την παραγωγή συνθετικών φωνητικών τραγουδιού στα Ελληνικά (score to synthesis) με βάση MBROLA.

Άρθρο που δίνει άλλη μια περιγραφή ενός Ελληνικού συστήματος TTS (NLP και DSP κομμάτι).

Άρθρο περιγράφει τη δημιουργία μιας βάσης φωνής για τα Ελληνικά (μη διαθέσιμη).

Άρθρο για μερικές τεχνικές βελτίωσης της φυσικότητας της συνθετικής ομιλίας στα Ελληνικά.

Άρθρο για τη μοντελοποίηση της θεμελιώδους συχνότητας F0 για εμφατικές προτάσεις.

Άρθρο μοντελοποίηση διάρκειας φωνημάτων για εκφραστική ελληνική ομιλία.

Άρθρο για αυτόματη κατάτμηση ομιλίας

Άρθρο για πρόβλεψη προσωδικών ορίων.

Άρθρο που περιγράφει μια βάση εκφραστικής ομιλίας στα Ελληνικά. Και άλλο ένα σχετικό άρθρο

Άρθρο Επιρροή του τόνου στον επιτονισμό της ελληνικής

Άρθρο για προσθήκη Ελληνικών στο OpenMary.

Άρθρο Αξιολόγηση εκφραστικότητας μοντέλου προσωδίας για τα Ελληνικά.

Άρθρο για ένα σύστημα TTS του ΙΕΛ βασισμένο σε HMMs. Και άλλο ένα

Άρθρο αξιολόγηση μεθόδων εκπαίδευσης HSMMs

Άρθρο σύνθεση φωνής για τα ελληνικά ως παράδειγμα γλώσσας φτωχής σε γλωσσικούς πόρους.

Διδακτορική Διατριβή unsupervised learning for TTS.