Παρασκευή Γιούλη

Παρασκευή

Γιούλη

Επίκουρη Καθηγήτρια

Υπολογιστική Γλωσσολογία (ΦΕΚ: 1747/14.6.2024 τ. Γ')

Τμήμα Γερμανικής Γλώσσας και Φιλολογίας

3α

pgiouli@del.auth.gr

2310 997583

vgiouli1

Σύντομο Βιογραφικό

Επίκουρη καθηγήτρια (ΦΕΚ: 1747/14.6.2024 τ. Γ’) στο γνωστικό αντικείμενο Γλωσσολογία: Θεωρία και πράξη σε συνάρτηση με την ανάλυση της ελληνικής και της γερμανικής γλώσσας, και με ειδικό πεδίο την Επεξεργασία Φυσικής Γλώσσας. Απόφοιτη του Τμήματος Φιλολογίας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών, με ειδίκευση στη Γλωσσολογία, κάτοχος μεταπτυχιακού τίτλου σπουδών (M.Sc.) στην Υπολογιστική Γλωσσολογία (Speech and Language Processing) από το Πανεπιστήμιο του Εδιμβούργου (1996), και διδάκτορας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών στο γνωστικό αντικείμενο της Υπολογιστικής Γλωσσολογίας (2020).

Επί σειρά ετών, εργάστηκε στο Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου ΑΘΗΝΑ, ως συνεργαζόμενη ερευνήτρια και μέλος της ομάδας Επεξεργασίας Φυσικής Γλώσσας (ΕΦΓ). Συμμετείχε στην ανάπτυξη και αξιολόγηση γλωσσικών πόρων για την υπολογιστική επεξεργασία της Ελληνικής σε διάφορα επίπεδα γλωσσικής ανάλυσης. Τα ερευνητικά της ενδιαφέροντα εστιάζουν στην υπολογιστική μοντελοποίηση γλωσσικών φαινομένων και τη χρήση Μηχανικής Μάθησης για εφαρμογές όπως εξόρυξη πληροφορίας από κείμενο, ανάλυση συναισθήματος, παράφραση και απλοποίηση κειμένων, και κειμενική συνεπαγωγή. Μέρος της έρευνάς της επικεντρώνεται στην υπολογιστική επεξεργασία του λεξιλογίου, την αναπαράσταση της λεξικής και προτασιακής σημασίας, και στην αναγνώριση και επεξεργασία ιδιαίτερων μορφών λόγου (ιδιωματικές εκφράσεις, τοξικός λόγος). Έχει συμμετάσχει στην υποβολή και υλοποίηση (με διάφορους ρόλους) πλήθους ερευνητικών και αναπτυξιακών εθνικών και Ευρωπαϊκών έργων με επίκεντρο τις Γλωσσικές Τεχνολογίες σε διάφορους τομείς (Οικονομία, Διοίκηση, Εκπαίδευση, Τουρισμός, Πολιτισμός, Δημιουργικές Βιομηχανίες). Στο πλαίσιο αυτό, εργάστηκε για την ανάπτυξη, αξιολόγηση και διαχείριση γλωσσικών πόρων και εργαλείων (μεταγραφή, επισημείωση και ημι-αυτόματη επεξεργασία κειμενικού και οπτικοακουστικού υλικού, επεξεργασία κειμένων πολιτισμικής κληρονομιάς, εξαγωγή πληροφορίας από εξειδικευμένα κείμενα, κ.λπ.). Επίσης, ηγείται της ελληνικής ομάδας του έργου Global FrameNet, που στοχεύει στην αναπαράσταση εννοιολογικής γνώσης σε διάφορες γλώσσες με βάση τη θεωρία της Σημασιολογίας Πλαισίων. Σήμερα, είναι επιστημονικά υπεύθυνη ερευνητικού έργου που εστιάζει στη προσαρμογή (fine-tuning) Μεγάλων Γλωσσικών Μοντέλων (Large Language Models, LLMs) με στόχο τον σχεδιασμό και την ανάπτυξη γνωσιακά προσαρμοστικού και συναισθηματικά ευφυούς εκπαιδευτικού πράκτορα με τη χρήση Μηχανικής Μάθησης.

Παράλληλα, υπήρξε συν-διοργανώτρια της σειράς διεθνών διαγωνισμών PARSEME Shared Tasks για την αναγνώριση ιδιωματικού λόγου σε πολλές γλώσσες. Είναι μέλος επιστημονικών οργανώσεων (Association for Computational Linguistics (ACL), European Association for Lexicography (EURALEX), κ.λπ.), ενώ έχει διατελέσει μέλος του ΔΣ του Special Interest Group on the Lexicon of the Association for Computational Linguistics (SIGLEX) και πρόεδρος του SIGLEX-MWE (2022-2024). Τα αποτελέσματα της έρευνάς της έχουν δημοσιευθεί σε συλλογικούς τόμους, επιστημονικά περιοδικά και πρακτικά διεθνών συνεδρίων με σύστημα κριτών (ACL Anthology, LREC, COLING).

Είναι εκπρόσωπος (Ambassador) του έργου HRS4R – Στρατηγική Ανθρώπινου Δυναμικού για Ερευνητές/Ερευνήτριες στο Α.Π.Θ.

Βιογραφικό Σημείωμα

Βιογραφικό

Εκπαίδευση

2013 - 2020

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Διδακτορικός τίτλος σπουδών, Υπολογιστική Γλωσσολογία

1995 - 1996

Πανεπιστήμιο Εδιμβούργου

MSc in Speech and Language Processing

1987 - 1991

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Φιλολογία, ειδίκευση Γλωσσολογίας

Επαγγελματική Εμπειρία

1998 - 2024

Ινστιτούτο Επεξεργασίας του Λόγου, Ερευνητικό Κέντρο ΑΘΗΝΑ

συνεργαζόμενη ερευνήτρια

Περιγραφή Θέσης:

Από το 1998 μέχρι το 2024 εργάστηκε ως υπολογιστική γλωσσολόγος (συνεργαζόμενη ερευνήτρια) στο Ινστιτούτο Επεξεργασίας του Λόγου, στο Ερευνητικό Κέντρο ΑΘΗΝΑ. Ως μέλος της ομάδας Γλωσσικών Εφαρμογών Γραφείου (μετέπειτα τμήμα Επεξεργασίας Φυσικής Γλώσσας και Γλωσσικών Υποδομών), συνέβαλε στην ανάπτυξη και αξιολόγηση υπολογιστικών εργαλείων επεξεργασίας της Ελληνικής σε διάφορα επίπεδα γλωσσικής ανάλυσης (ILSP-tokeniser, Part-of-Speech Tagger, Lemmatiser, Named Entity Recogniser). Επίσης, ασχολήθηκε με τον σχεδιασμό και στην ανάπτυξη γλωσσικών πόρων (επισημειωμένων σωμάτων κειμένων, υπολογιστικών λεξικών, ορολογικών βάσεων δεδομένων, θησαυρών, υπολογιστικών γραμματικών). Έχει συμμετάσχει στην υποβολή προτάσεων για προσέλκυση χρηματοδότησης της έρευνας σε διάφορα πλαίσια, εθνικά και ευρωπαϊκά, και έχει εργαστεί σε πολλά εθνικά και ευρωπαϊκά ερευνητικά έργα για εφαρμογές Δεικτοδότησης και Ανάκτησης Εγγράφων, Εξαγωγής Πληροφορίας, Αναγνώρισης Συναισθήματος, Κειμενικής Συνεπαγωγής, Επεξεργασίας και Δεικτοδότησης Κειμένων Πολιτιστικής Κληρονομιάς, και Μηχανικής Μετάφρασης, μεταξύ των οποίων τα εξής: Μυθοτοπία (παράδειγμα καλής πρακτικής ΕΠΑνΕΚ), ΔΡΑΣΗ, ΠΟΛΥΤΡΟΠΟΝ, ACCURAT, Λογοτεχνικά Παράλληλα, Reveal-this, eContent-Intera, και άλλα.

Μαθήματα

2024 - 2026

Λεξικογραφία: θεωρία και πρακτική (ΑΚ0263) (Προπτυχιακό)

2024 - 2026

Υπολογιστική Λεξικογραφία (ΑΚ0264) (Προπτυχιακό)

2024 - 2026

Υπολογιστική Λεξικογραφία (ΑΚ0268) (Προπτυχιακό)

2024 - 2026

Γλωσσική Τεχνολογία και Ψηφιακές Ανθρωπιστικές Επιστήμες (ΑΚ0269) (Προπτυχιακό)

2024 - 2025

Υπολογιστική Γλωσσολογία (ΓΔ_036)

Δημοσιεύσεις

2025

Verginica Mititelu, Voula Giouli, Gražina Korvel, Chaya Liebeskind, Irina Lobzhanidze, Rusudan Makhachashvili, Stella Markantonatou, Aleksandra Markovic, and Ivelina Stoyanova. 2025. Survey on Lexical Resources Focused on Multiword Expressions for the Purposes of NLP. In Proceedings of the 21st Workshop on Multiword Expressions (MWE 2025), pages 41–57, Albuquerque, New Mexico, U.S.A.. Association for Computational Linguistics.

Conferences

2024

Voula Giouli and Verginica Barbu Mititelu (eds.). 2024. Multiword expressions in lexical resources: Linguistic, lexicographic, and computational perspectives. (Phraseology and Multiword Expressions 6). Berlin: Language Science Press. DOI: 10.5281/zenodo.10949960

Books

2024

Verginica Barbu Mititelu, Voula Giouli, Kilian Evang, Daniel Zeman, Petya Osenova, Carole Tiberius, Simon Krek, Stella Markantonatou, Ivelina Stoyanova, Ranka Stanković, and Christian Chiarcos. 2024. Multiword Expressions between the Corpus and the Lexicon: Universality, Idiosyncrasy, and the Lexicon-Corpus Interface. In Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, pages 147–153, Torino, Italia. ELRA and ICCL.

Conferences

2023

Voula Giouli. 2023. A model for representing the semantics of MWEs: From lexical semantics to the semantic annotation of complex predicates. In: Frontiers in Artificial Intelligence, vol. 6, 2023, ISSN: 2624-8212.

Journal Papers

2022

Voula Giouli, Anna Vacalopoulou, Nikolaos Sidiropoulos, Christina Flouda, Athanasios Doupas, Giorgos Giannopoulos, Nikos Bikakis, Vassilis Kaffes, and Gregory Stainhaouer. 2022. Placing multi-modal, and multi-lingual Data in the Humanities Domain on the Map: the Mythotopia Geo-tagged Corpus. In Proceedings of the Thirteenth Language Resources and Evaluation Conference, pages 2856–2864, Marseille, France. European Language Resources Association.

Conferences

Ερευνητικά Ενδιαφέροντα

Επεξεργασία Φυσικής Γλώσσας και Μεγάλα Γλωσσικά Μοντέλα Δημιουργία γλωσσικών δεδομένων ανάπτυξης και αξιολόγησης δεδομένων (benchmarking) Διεπαφή Σύνταξης - Σημασιολογίας Λεξική σημασιολογία Κειμενική Συνεπαγωγή και λογικός συμπερασμός Γλωσσικοί πόροι Ανάλυση Συναιθήματος και τοξικού λόγου Ψηφιακές Ανθρωπιστικές και Κοινωνικές Επιστήμες

Ενδιαφέροντα

Παιδική και νεανική λογοτεχνία Μετάφραση παιδικής και νεανικής λογοτεχνίας Σινεμά Θέατρο Τρέξιμο (5χλμ)

Projects

Universality, Diversity and Idiosyncrasy in Language Technology (UniDive)

Ρόλος: Working Group 2 co-leader (The Lexicon-Corpus interface)

European Network on Lexical Innovation (ENEOLI)

Ρόλος: Working Group 2 - Task 2.4 leader (Methods for the identification & monitoring of neologisms)

Global FrameNet

A collaborative effort involving partner labs & affiliated researchers in 12 languages

Προηγούμενα έργα (επιλεγμένα)

2021 – 2023. Μυθολογικές Διαδρομές στην Ανατολική Μακεδονία-Θράκη (ΟΠΣ (MIS) 5047101).

Διαβάστε περισσότερα...

Γλωσσικοί πόροι

Greek Textual Entailment corpus

Σώμα κειμένων της Ελληνικής με σημασιολογική επισημείωση (κειμενική συνεπαγωγή). Διαθέσιμο εδώ. Αναφορά: Evi Marzelou, Maria Zourari, Voula Giouli, and Stelios Piperidis. 2008. Building a Greek corpus for Textual Entailment. In Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08), Marrakech, Morocco. European Language Resources Association (ELRA).

PARSEME-el corpus

Σώμα κειμένων της Ελληνικής με επισημείωση για πολυλεκτικές εκφράσεις. Διαθέσιμο εδώ. Αναφορά: Agata Savary, Cherifa Ben Khelil, Carlos Ramisch, Voula Giouli, Verginica Barbu Mititelu, Najet Hadj Mohamed, Cvetana Krstev, Chaya Liebeskind, Hongzhi Xu, Sara Stymne, Tunga Güngör, Thomas Pickard, Bruno Guillaume, Eduard Bejček, Archna Bhatia, Marie Candito, Polona Gantar, Uxoa Iñurrieta, Albert Gatt, et al.. 2023. PARSEME corpus release 1.3. In Proceedings of the 19th Workshop on Multiword Expressions (MWE 2023), pages 24–35, Dubrovnik, Croatia. Association for Computational Linguistics.

ConceptNet-el

Εννοιολογικό λεξικό της Νέας Ελληνικής. Σύντομα διαθέσιμο. Αναφορές:

FrameNet-el

Λεξικός πόρος και συνδεδεμένο σώμα κειμένων επισημειωμένο με Σημασιολογικούς ρόλους. Σύντομα διαθέσιμο. Αναφορές