Παρασκευή

Γιούλη

Επίκουρη Καθηγήτρια
Υπολογιστική Γλωσσολογία (ΦΕΚ: 1747/14.6.2024 τ. Γ')

Τμήμα Γερμανικής Γλώσσας και Φιλολογίας

2310 997583

vgiouli1

Σύντομο Βιογραφικό

Επίκουρη καθηγήτρια (ΦΕΚ: 1747/14.6.2024 τ. Γ’) στο γνωστικό αντικείμενο Γλωσσολογία: Θεωρία και πράξη σε συνάρτηση με την ανάλυση της ελληνικής και της γερμανικής γλώσσας, και με ειδικό πεδίο την Επεξεργασία Φυσικής Γλώσσας. Απόφοιτη του Τμήματος Φιλολογίας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών, με ειδίκευση στη γλωσσολογία, κάτοχος μεταπτυχιακού τίτλου σπουδών (M.Sc.) από το Πανεπιστήμιο του Εδιμβούργου (1996) στην υπολογιστική γλωσσολογία (Speech and Language Processing) , και διδάκτορας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών στο γνωστικό αντικείμενο της υπολογιστικής γλωσσολογίας (2020).

Υπήρξα συνεργαζόμενη ερευνήτρια στο Ινστιτούτο Επεξεργασίας Φυσικής Γλώσσας του Ερευνητικού Κέντρου ΑΘΗΝΑ, όπου ασχολήθηκα με την ανάπτυξη υπολογιστικών εργαλείων και πόρων για την επεξεργασία φυσικής γλώσσας από υπολογιστή σε διάφορα επίπεδα γλωσσικής ανάλυσης στο πλαίσιο εθνικών και ευρωπαϊκών έργων.

Τα ερευνητικά μου ενδιαφέροντα εστιάζουν στην υπολογιστική μοντελοποίηση γλωσσικών φαινομένων της Ελληνικής και τη χρήση Μηχανικής Μάθησης για εφαρμογές όπως εξόρυξη πληροφορίας από κείμενο, ανάλυση συναισθήματος, παράφραση και κειμενική συνεπαγωγή. Μέρος της έρευνάς μου επικεντρώνεται στην αναπαράσταση της λεξικής σημασίας και την υπολογιστική επεξεργασία του λεξιλογίου, με έμφαση στην  αναγνώριση ιδιωματικού λόγου, και τον εντοπισμό τοξικού λόγου σε κείμενα.

Είμαι επιστημονικά υπεύθυνη ερευνητικού έργου που εστιάζει στην αξιοποίηση μεγάλων γλωσσικών μοντέλων για τον σχεδιασμό και την ανάπτυξη γνωσιακά προσαρμοστικών και συναισθηματικά ευφυών εκπαιδευτικών εφαρμογών βασισμένων σε τεχνολογίες Μηχανικής Μάθησης. Επίσης, ηγούμαι της ελληνικής ομάδας του έργου Global FrameNet, που στοχεύει στην αναπαράσταση εννοιολογικής γνώσης και τη σημασιολογική ανάλυση με βάση τη θεωρία πλαισίων. Παράλληλα, υπήρξα συν-διοργανώτρια της σειράς διεθνών διαγωνισμών PARSEME Shared Tasks για την αναγνώριση ιδιωματικού λόγου σε πολλές γλώσσες. Τα αποτελέσματα της έρευνάς μου έχουν δημοσιευθεί σε συλλογικούς τόμους, επιστημονικά περιοδικά και πρακτικά διεθνών συνεδρίων με σύστημα κριτών (ACL Anthology, LREC, COLING).

Είμαι μέλος επιστημονικών οργανώσεων (Association for Computational Linguistics (ACL), European Association for Lexicography (EURALEX), κ.λπ.), ενώ έχω διατελέσει μέλος του ΔΣ του Special Interest Group on the Lexicon of the Association for Computational Linguistics (SIGLEX) και πρόεδρος του SIGLEX-MWE (2022-2024).

Βιογραφικό Σημείωμα

Εκπαίδευση
2013 - 2020

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Διδακτορικός τίτλος σπουδών, Υπολογιστική Γλωσσολογία

1995 - 1996

Πανεπιστήμιο Εδιμβούργου

MSc in Speech and Language Processing

1987 - 1991

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Φιλολογία, ειδίκευση Γλωσσολογίας

Επαγγελματική Εμπειρία
1998 - 2024

Ινστιτούτο Επεξεργασίας του Λόγου, Ερευνητικό Κέντρο ΑΘΗΝΑ

συνεργαζόμενη ερευνήτρια

Περιγραφή Θέσης:

Από το 1998 μέχρι το 2024 εργάστηκε ως υπολογιστική γλωσσολόγος (συνεργαζόμενη ερευνήτρια) στο Ινστιτούτο Επεξεργασίας του Λόγου, στο Ερευνητικό Κέντρο ΑΘΗΝΑ. Ως μέλος της ομάδας Γλωσσικών Εφαρμογών Γραφείου (μετέπειτα τμήμα Επεξεργασίας Φυσικής Γλώσσας και Γλωσσικών Υποδομών), συνέβαλε στην ανάπτυξη και αξιολόγηση υπολογιστικών εργαλείων επεξεργασίας της Ελληνικής σε διάφορα επίπεδα γλωσσικής ανάλυσης (ILSP-tokeniser, Part-of-Speech Tagger, Lemmatiser, Named Entity Recogniser). Επίσης, ασχολήθηκε με τον σχεδιασμό και στην ανάπτυξη γλωσσικών πόρων (επισημειωμένων σωμάτων κειμένων, υπολογιστικών λεξικών, ορολογικών βάσεων δεδομένων, θησαυρών, υπολογιστικών γραμματικών). Έχει συμμετάσχει στην υποβολή προτάσεων για προσέλκυση χρηματοδότησης της έρευνας σε διάφορα πλαίσια, εθνικά και ευρωπαϊκά, και έχει εργαστεί σε πολλά εθνικά και ευρωπαϊκά ερευνητικά έργα για εφαρμογές Δεικτοδότησης και Ανάκτησης Εγγράφων, Εξαγωγής Πληροφορίας, Αναγνώρισης Συναισθήματος, Κειμενικής Συνεπαγωγής, Επεξεργασίας και Δεικτοδότησης Κειμένων Πολιτιστικής Κληρονομιάς, και Μηχανικής Μετάφρασης, μεταξύ των οποίων τα εξής: Μυθοτοπία (παράδειγμα καλής πρακτικής ΕΠΑνΕΚ), ΔΡΑΣΗ, ΠΟΛΥΤΡΟΠΟΝ, ACCURAT, Λογοτεχνικά Παράλληλα, Reveal-this, eContent-Intera, και άλλα.

Μαθήματα
2024 - 2025

Λεξικογραφία: θεωρία και πρακτική (ΑΚ0263) (Προπτυχιακό)

2024 - 2025

Υπολογιστική Λεξικογραφία (ΑΚ0264) (Προπτυχιακό)

2024 - 2025

Υπολογιστική Λεξικογραφία (ΑΚ0268) (Προπτυχιακό)

2024 - 2025

Γλωσσική Τεχνολογία και Ψηφιακές Ανθρωπιστικές Επιστήμες (ΑΚ0269) (Προπτυχιακό)

2024 - 2025

Υπολογιστική Γλωσσολογία (ΓΔ_036)

Δημοσιεύσεις
Ερευνητικά Ενδιαφέροντα
Επεξεργασία Φυσικής Γλώσσας και Μεγάλα Γλωσσικά Μοντέλα Δημιουργία γλωσσικών δεδομένων ανάπτυξης και αξιολόγησης δεδομένων (benchmarking) Διεπαφή Σύνταξης - Σημασιολογίας Λεξική σημασιολογία Κειμενική Συνεπαγωγή και λογικός συμπερασμός Γλωσσικοί πόροι Ανάλυση Συναιθήματος και τοξικού λόγου Ψηφιακές Ανθρωπιστικές και Κοινωνικές Επιστήμες
Ενδιαφέροντα
Παιδική και νεανική λογοτεχνία Μετάφραση παιδικής και νεανικής λογοτεχνίας Σινεμά Θέατρο Τρέξιμο (5χλμ)
Projects
Universality, Diversity and Idiosyncrasy in Language Technology (UniDive)
Universality, Diversity and Idiosyncrasy in Language Technology (UniDive)

Ρόλος: Working Group 2 co-leader (The Lexicon-Corpus interface)

European Network on Lexical Innovation (ENEOLI)
European Network on Lexical Innovation (ENEOLI)

Ρόλος: Working Group 2 - Task 2.4 leader (Methods for the identification & monitoring of neologisms)

Global FrameNet
Global FrameNet

A collaborative effort involving partner labs & affiliated researchers in 12 languages

Προηγούμενα έργα (επιλεγμένα)
  • 2021 – 2023. Μυθολογικές Διαδρομές στην Ανατολική Μακεδονία-Θράκη (ΟΠΣ (MIS) 5047101).

Διαβάστε περισσότερα...

Γλωσσικοί πόροι
  • Greek Textual Entailment corpus

    Σώμα κειμένων της Ελληνικής με σημασιολογική επισημείωση (κειμενική συνεπαγωγή).
    Διαθέσιμο εδώ.

    Αναφορά:

    Evi Marzelou, Maria Zourari, Voula Giouli, and Stelios Piperidis. 2008. Building a Greek corpus for Textual Entailment. In Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08), Marrakech, Morocco. European Language Resources Association (ELRA).

  • PARSEME-el corpus

    Σώμα κειμένων της Ελληνικής με επισημείωση για πολυλεκτικές εκφράσεις. Διαθέσιμο εδώ.

    Αναφορά:
    Agata Savary, Cherifa Ben Khelil, Carlos Ramisch, Voula Giouli, Verginica Barbu Mititelu, Najet Hadj Mohamed, Cvetana Krstev, Chaya Liebeskind, Hongzhi Xu, Sara Stymne, Tunga Güngör, Thomas Pickard, Bruno Guillaume, Eduard Bejček, Archna Bhatia, Marie Candito, Polona Gantar, Uxoa Iñurrieta, Albert Gatt, et al.. 2023. PARSEME corpus release 1.3. In Proceedings of the 19th Workshop on Multiword Expressions (MWE 2023), pages 24–35, Dubrovnik, Croatia. Association for Computational Linguistics.

  • ConceptNet-el

    Εννοιολογικό λεξικό της Νέας Ελληνικής.

    Σύντομα διαθέσιμο.

    Αναφορές:

  • FrameNet-el

    Λεξικός πόρος και συνδεδεμένο σώμα κειμένων επισημειωμένο με Σημασιολογικούς ρόλους.

    Σύντομα διαθέσιμο.

    Αναφορές