Επίκουρη καθηγήτρια (ΦΕΚ: 1747/14.6.2024 τ. Γ’) στο γνωστικό αντικείμενο Γλωσσολογία: Θεωρία και πράξη σε συνάρτηση με την ανάλυση της ελληνικής και της γερμανικής γλώσσας, και με ειδικό πεδίο την Επεξεργασία Φυσικής Γλώσσας. Απόφοιτη του Τμήματος Φιλολογίας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών, με ειδίκευση στη Γλωσσολογία, κάτοχος μεταπτυχιακού τίτλου σπουδών (M.Sc.) στην Υπολογιστική Γλωσσολογία (Speech and Language Processing) από το Πανεπιστήμιο του Εδιμβούργου (1996), και διδάκτορας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών στο γνωστικό αντικείμενο της Υπολογιστικής Γλωσσολογίας (2020).
Επί σειρά ετών, υπήρξα συνεργαζόμενη ερευνήτρια στο Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου ΑΘΗΝΑ, όπου συμμετείχα στην ανάπτυξη και αξιολόγηση υπολογιστικών εργαλείων και γλωσσικών πόρων για την Επεξεργασία Φυσικής Γλώσσας σε διάφορα επίπεδα γλωσσικής ανάλυσης. Τα ερευνητικά μου ενδιαφέροντα εστιάζουν στην υπολογιστική μοντελοποίηση γλωσσικών φαινομένων και τη χρήση Μηχανικής Μάθησης για εφαρμογές όπως εξόρυξη πληροφορίας από κείμενο, ανάλυση συναισθήματος, παράφραση, απλοποίηση κειμένων, και κειμενική συνεπαγωγή. Μέρος της έρευνάς μου επικεντρώνεται στην υπολογιστική επεξεργασία του λεξιλογίου, την αναπαράσταση της λεξικής και προτασιακής σημασίας, και στην αναγνώριση και επεξεργασία ιδιαίτερων μορφών λόγου (ιδιωματικές εκφράσεις, τοξικός λόγος).
Έχω συμμετάσχει στην υποβολή και υλοποίηση (με διάφορους ρόλους) πλήθους ερευνητικών και αναπτυξιακών εθνικών και Ευρωπαϊκών έργων με επίκεντρο τις Γλωσσικές Τεχνολογίες σε διάφορους τομείς (Οικονομία, Διοίκηση, Εκπαίδευση, Τουρισμός, Πολιτισμός, Δημιουργικές Βιομηχανίες). Στο πλαίσιο αυτό, εργάστηκα για την ανάπτυξη, αξιολόγηση και διαχείριση γλωσσικών πόρων και εργαλείων (μεταγραφή, επισημείωση και ημι-αυτόματη επεξεργασία κειμενικού και οπτικοακουστικού υλικού, επεξεργασία κειμένων πολιτισμικής κληρονομιάς, εξαγωγή πληροφορίας από εξειδικευμένα κείμενα, κ.λπ.). Επίσης, ηγούμαι της ελληνικής ομάδας του έργου Global FrameNet, που στοχεύει στην αναπαράσταση εννοιολογικής γνώσης σε διάφορες γλώσσες με βάση τη θεωρία πλαισίων. Σήμερα, είμαι επιστημονικά υπεύθυνη ερευνητικού έργου που εστιάζει στη προσαρμογή (fine-tuning) Μεγάλων Γλωσσικών Μοντέλων (Large Language Models, LLMs) με στόχο τον σχεδιασμό και την ανάπτυξη γνωσιακά προσαρμοστικού και συναισθηματικά ευφυούς εκπαιδευτικού πράκτορα με τη χρήση Μηχανικής Μάθησης.
Παράλληλα, υπήρξα συν-διοργανώτρια της σειράς διεθνών διαγωνισμών PARSEME Shared Tasks για την αναγνώριση ιδιωματικού λόγου σε πολλές γλώσσες. Είμαι μέλος επιστημονικών οργανώσεων (Association for Computational Linguistics (ACL), European Association for Lexicography (EURALEX), κ.λπ.), ενώ έχω διατελέσει μέλος του ΔΣ του Special Interest Group on the Lexicon of the Association for Computational Linguistics (SIGLEX) και πρόεδρος του SIGLEX-MWE (2022-2024). Τα αποτελέσματα της έρευνάς μου έχουν δημοσιευθεί σε συλλογικούς τόμους, επιστημονικά περιοδικά και πρακτικά διεθνών συνεδρίων με σύστημα κριτών (ACL Anthology, LREC, COLING).
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Διδακτορικός τίτλος σπουδών, Υπολογιστική Γλωσσολογία
Πανεπιστήμιο Εδιμβούργου
MSc in Speech and Language Processing
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Φιλολογία, ειδίκευση Γλωσσολογίας
Ινστιτούτο Επεξεργασίας του Λόγου, Ερευνητικό Κέντρο ΑΘΗΝΑ
συνεργαζόμενη ερευνήτρια
Περιγραφή Θέσης:
Από το 1998 μέχρι το 2024 εργάστηκε ως υπολογιστική γλωσσολόγος (συνεργαζόμενη ερευνήτρια) στο Ινστιτούτο Επεξεργασίας του Λόγου, στο Ερευνητικό Κέντρο ΑΘΗΝΑ. Ως μέλος της ομάδας Γλωσσικών Εφαρμογών Γραφείου (μετέπειτα τμήμα Επεξεργασίας Φυσικής Γλώσσας και Γλωσσικών Υποδομών), συνέβαλε στην ανάπτυξη και αξιολόγηση υπολογιστικών εργαλείων επεξεργασίας της Ελληνικής σε διάφορα επίπεδα γλωσσικής ανάλυσης (ILSP-tokeniser, Part-of-Speech Tagger, Lemmatiser, Named Entity Recogniser). Επίσης, ασχολήθηκε με τον σχεδιασμό και στην ανάπτυξη γλωσσικών πόρων (επισημειωμένων σωμάτων κειμένων, υπολογιστικών λεξικών, ορολογικών βάσεων δεδομένων, θησαυρών, υπολογιστικών γραμματικών). Έχει συμμετάσχει στην υποβολή προτάσεων για προσέλκυση χρηματοδότησης της έρευνας σε διάφορα πλαίσια, εθνικά και ευρωπαϊκά, και έχει εργαστεί σε πολλά εθνικά και ευρωπαϊκά ερευνητικά έργα για εφαρμογές Δεικτοδότησης και Ανάκτησης Εγγράφων, Εξαγωγής Πληροφορίας, Αναγνώρισης Συναισθήματος, Κειμενικής Συνεπαγωγής, Επεξεργασίας και Δεικτοδότησης Κειμένων Πολιτιστικής Κληρονομιάς, και Μηχανικής Μετάφρασης, μεταξύ των οποίων τα εξής: Μυθοτοπία (παράδειγμα καλής πρακτικής ΕΠΑνΕΚ), ΔΡΑΣΗ, ΠΟΛΥΤΡΟΠΟΝ, ACCURAT, Λογοτεχνικά Παράλληλα, Reveal-this, eContent-Intera, και άλλα.
Λεξικογραφία: θεωρία και πρακτική (ΑΚ0263) (Προπτυχιακό)
Υπολογιστική Λεξικογραφία (ΑΚ0264) (Προπτυχιακό)
Υπολογιστική Λεξικογραφία (ΑΚ0268) (Προπτυχιακό)
Γλωσσική Τεχνολογία και Ψηφιακές Ανθρωπιστικές Επιστήμες (ΑΚ0269) (Προπτυχιακό)
Υπολογιστική Γλωσσολογία (ΓΔ_036)
Ρόλος: Working Group 2 co-leader (The Lexicon-Corpus interface)
Ρόλος: Working Group 2 - Task 2.4 leader (Methods for the identification & monitoring of neologisms)
A collaborative effort involving partner labs & affiliated researchers in 12 languages
Στόχος του έργου υπήρξε η δημιουργία ψηφιακής υποδομής, πληροφοριακού ιστότοπου και εφαρμογής για κινητά που επιτρέπουν τη δημιουργία προσωποποιημένων διαδρομών σε περιοχές της περιφέρειας με απώτερο στόχο την υποστήριξη της ολοκληρωμένης τουριστικής εμπειρίας στην περιοχή της Ανατολικής Μακεδονίας και Θράκης με άξονα τους μύθους, τη γλώσσα και τον πολιτισμό.
Σώμα κειμένων της Ελληνικής με σημασιολογική επισημείωση (κειμενική συνεπαγωγή).
Διαθέσιμο εδώ.
Αναφορά:
Evi Marzelou, Maria Zourari, Voula Giouli, and Stelios Piperidis. 2008. Building a Greek corpus for Textual Entailment. In Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08), Marrakech, Morocco. European Language Resources Association (ELRA).
Σώμα κειμένων της Ελληνικής με επισημείωση για πολυλεκτικές εκφράσεις. Διαθέσιμο εδώ.
Αναφορά:
Agata Savary, Cherifa Ben Khelil, Carlos Ramisch, Voula Giouli, Verginica Barbu Mititelu, Najet Hadj Mohamed, Cvetana Krstev, Chaya Liebeskind, Hongzhi Xu, Sara Stymne, Tunga Güngör, Thomas Pickard, Bruno Guillaume, Eduard Bejček, Archna Bhatia, Marie Candito, Polona Gantar, Uxoa Iñurrieta, Albert Gatt, et al.. 2023. PARSEME corpus release 1.3. In Proceedings of the 19th Workshop on Multiword Expressions (MWE 2023), pages 24–35, Dubrovnik, Croatia. Association for Computational Linguistics.
Εννοιολογικό λεξικό της Νέας Ελληνικής.
Σύντομα διαθέσιμο.
Αναφορές:
Λεξικός πόρος και συνδεδεμένο σώμα κειμένων επισημειωμένο με Σημασιολογικούς ρόλους.
Σύντομα διαθέσιμο.
Αναφορές