Επίκουρη καθηγήτρια (ΦΕΚ: 1747/14.6.2024 τ. Γ’) στο γνωστικό αντικείμενο Γλωσσολογία: Θεωρία και πράξη σε συνάρτηση με την ανάλυση της ελληνικής και της γερμανικής γλώσσας, και με ειδικό πεδίο την Επεξεργασία Φυσικής Γλώσσας. Απόφοιτη του Τμήματος Φιλολογίας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών, με ειδίκευση στη γλωσσολογία, κάτοχος μεταπτυχιακού τίτλου σπουδών (M.Sc.) από το Πανεπιστήμιο του Εδιμβούργου (1996) στην υπολογιστική γλωσσολογία (Speech and Language Processing) , και διδάκτορας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών στο γνωστικό αντικείμενο της υπολογιστικής γλωσσολογίας (2020). Το 1993 έλαβε εξειδίκευση στην Ηλεκτρονική Λεξικογραφία, από το τμήμα Ηλεκτρολόγων Μηχανικών & Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Παν/μίου Πατρών (Εργαστήριο Ενσύρματης Τηλεπικοινωνίας) σε συνεργασία με τον εκδοτικό οίκο HarperCollins και το λεξικογραφικό κέντρο Cobuild.
Τα ερευνητικά της ενδιαφέροντα στρέφονται στην Επεξεργασία Φυσικής Γλώσσας με έμφαση στη μορφο-σύνταξη και στη διεπαφή σύνταξης-σημασιολογίας, την εξόρυξη πληροφορίας από κείμενο, εφαρμογές ανάλυσης συναισθήματος, κ.α. Μέρος της έρευνάς της επικεντρώνεται στη μελέτη και υπολογιστική επεξεργασία του λεξιλογίου, με έμφαση στις πολυλεκτικές εκφράσεις και στην αναπαράσταση της σημασίας.
Έχει ασχοληθεί με την ανάπτυξη υπολογιστικών εργαλείων και πόρων για την επεξεργασία φυσικής γλώσσας από υπολογιστή σε διάφορα επίπεδα γλωσσικής ανάλυσης. Είναι επιστημονική υπεύθυνη της ελληνικής ομάδας του έργου Global FrameNet, καθώς επίσης και συν-διοργανώτρια της σειράς διαγωνισμών για την αναγνώριση ρηματικών πολυλεκτικών εκφράσεων PARSEME Shared Tasks on the identification of verbal multi-word expressions. Τα αποτελέσματα της έρευνάς της έχουν δημοσιευθεί σε συλλογικούς τόμους, επιστημονικά περιοδικά και πρακτικά διεθνών συνεδρίων (με κριτές).
Είναι μέλος επιστημονικών οργανώσεων (Association for Computational Linguistics (ACL), European Association for Lexicography (EURALEX), κ.λπ.). Έχει διατελέσει μέλος του ΔΣ του Special Interest Group on the Lexicon of the Association for Computational Linguistics (SIGLEX) και πρόεδρος του SIGLEX-MWE (2022-2024).
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Διδακτορικός τίτλος σπουδών, Υπολογιστική Γλωσσολογία
Πανεπιστήμιο Εδιμβούργου
MSc in Speech and Language Processing
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Φιλολογία, ειδίκευση Γλωσσολογίας
Ινστιτούτο Επεξεργασίας του Λόγου, Ερευνητικό Κέντρο ΑΘΗΝΑ
συνεργαζόμενη ερευνήτρια
Περιγραφή Θέσης:
Από το 1998 μέχρι το 2024 εργάστηκε ως υπολογιστική γλωσσολόγος (συνεργαζόμενη ερευνήτρια) στο Ινστιτούτο Επεξεργασίας του Λόγου, στο Ερευνητικό Κέντρο ΑΘΗΝΑ. Ως μέλος της ομάδας Γλωσσικών Εφαρμογών Γραφείου (μετέπειτα τμήμα Επεξεργασίας Φυσικής Γλώσσας και Γλωσσικών Υποδομών), συνέβαλε στην ανάπτυξη και αξιολόγηση υπολογιστικών εργαλείων επεξεργασίας της Ελληνικής σε διάφορα επίπεδα γλωσσικής ανάλυσης (ILSP-tokeniser, Part-of-Speech Tagger, Lemmatiser, Named Entity Recogniser). Επίσης, ασχολήθηκε με τον σχεδιασμό και στην ανάπτυξη γλωσσικών πόρων (επισημειωμένων σωμάτων κειμένων, υπολογιστικών λεξικών, ορολογικών βάσεων δεδομένων, θησαυρών, υπολογιστικών γραμματικών). Έχει συμμετάσχει στην υποβολή προτάσεων για προσέλκυση χρηματοδότησης της έρευνας σε διάφορα πλαίσια, εθνικά και ευρωπαϊκά, και έχει εργαστεί σε πολλά εθνικά και ευρωπαϊκά ερευνητικά έργα για εφαρμογές Δεικτοδότησης και Ανάκτησης Εγγράφων, Εξαγωγής Πληροφορίας, Αναγνώρισης Συναισθήματος, Κειμενικής Συνεπαγωγής, Επεξεργασίας και Δεικτοδότησης Κειμένων Πολιτιστικής Κληρονομιάς, και Μηχανικής Μετάφρασης, μεταξύ των οποίων τα εξής: Μυθοτοπία (παράδειγμα καλής πρακτικής ΕΠΑνΕΚ), ΔΡΑΣΗ, ΠΟΛΥΤΡΟΠΟΝ, ACCURAT, Λογοτεχνικά Παράλληλα, Reveal-this, eContent-Intera, και άλλα.
Λεξικογραφία: θεωρία και πρακτική (ΑΚ0263) (Προπτυχιακό)
Υπολογιστική Λεξικογραφία (ΑΚ0264) (Προπτυχιακό)
Υπολογιστική Λεξικογραφία (ΑΚ0268) (Προπτυχιακό)
Γλωσσική Τεχνολογία και Ψηφιακές Ανθρωπιστικές Επιστήμες (ΑΚ0269) (Προπτυχιακό)
Υπολογιστική Γλωσσολογία (ΓΔ_036)
Ρόλος: Working Group 2 co-leader (The Lexicon-Corpus interface)
Ρόλος: Working Group 2 - Task 2.4 leader (Methods for the identification & monitoring of neologisms)
A collaborative effort involving partner labs & affiliated researchers in 12 languages
Στόχος του έργου υπήρξε η δημιουργία ψηφιακής υποδομής, πληροφοριακού ιστότοπου και εφαρμογής για κινητά που επιτρέπουν τη δημιουργία προσωποποιημένων διαδρομών σε περιοχές της περιφέρειας με απώτερο στόχο την υποστήριξη της ολοκληρωμένης τουριστικής εμπειρίας στην περιοχή της Ανατολικής Μακεδονίας και Θράκης με άξονα τους μύθους, τη γλώσσα και τον πολιτισμό.
Σώμα κειμένων της Ελληνικής με σημασιολογική επισημείωση (κειμενική συνεπαγωγή).
Διαθέσιμο εδώ.
Αναφορά:
Evi Marzelou, Maria Zourari, Voula Giouli, and Stelios Piperidis. 2008. Building a Greek corpus for Textual Entailment. In Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08), Marrakech, Morocco. European Language Resources Association (ELRA).
Σώμα κειμένων της Ελληνικής με επισημείωση για πολυλεκτικές εκφράσεις. Διαθέσιμο εδώ.
Αναφορά:
Agata Savary, Cherifa Ben Khelil, Carlos Ramisch, Voula Giouli, Verginica Barbu Mititelu, Najet Hadj Mohamed, Cvetana Krstev, Chaya Liebeskind, Hongzhi Xu, Sara Stymne, Tunga Güngör, Thomas Pickard, Bruno Guillaume, Eduard Bejček, Archna Bhatia, Marie Candito, Polona Gantar, Uxoa Iñurrieta, Albert Gatt, et al.. 2023. PARSEME corpus release 1.3. In Proceedings of the 19th Workshop on Multiword Expressions (MWE 2023), pages 24–35, Dubrovnik, Croatia. Association for Computational Linguistics.
Εννοιολογικό λεξικό της Νέας Ελληνικής.
Σύντομα διαθέσιμο.
Αναφορές:
Λεξικός πόρος και συνδεδεμένο σώμα κειμένων επισημειωμένο με Σημασιολογικούς ρόλους.
Σύντομα διαθέσιμο.
Αναφορές