Το Διοικητικό Συμβούλιο της ΕΕΤΝ, κατά τη συνεδρίασή του, την Δευτέρα 11 Ιουλίου 2022, επικύρωσε την εισήγηση της τριμελούς επιτροπής, η οποία αποτελούταν από τον Καθηγητή Γρηγόρη Αντωνίου του Πανεπιστημίου Huddersfield, τον Καθηγητή Γιώργο Στάμου του ΕΜΠ και τον Επίκουρο Καθηγητή Χρήστο Τζάμο του Πανεπιστημίου Wisconsin, για το βραβείο καλύτερης διδακτορικής διατριβής στην περιοχή της Τεχνητής Νοημοσύνης για τα έτη 2020 ως και 2021.
Στην πρόσκληση της ΕΕΤΝ ανταποκρίθηκαν 10 διδάκτορες Ελληνικών ΑΕΙ που ικανοποιούσαν τις προδιαγραφές της προκήρυξης. Η επιτροπή, αφού διαπίστωσε με ιδιαίτερη ικανοποίηση το υψηλό επίπεδο των υποβληθέντων διδακτορικών διατριβών, αποφάσισε να απονείμει το βραβείο καλύτερης διδακτορικής διατριβής από κοινού στους διδάκτορες Μαρία Τζελέπη και Ηλία Χαλκίδη, ενώ εύφημη μνεία απονεμήθηκε στον διδάκτορα Μιχάλη Μουνταντωνάκη. Η απονομή των βραβείων έγινε στο 12ο Πανελλήνιο Συνέδριο Τεχνητής Νοημοσύνης (ΣΕΤΝ-22) που έλαβε χώρα στην Κέρκυρα στις 7 – 9 Σεπτεμβρίου 2022.
Παρακάτω μπορείτε να βρείτε πληροφορίες για τους βραβευθέντες διδάκτορες και τις διδακτορικές τους διατριβές.
Η Δρ. Μαρία Τζελέπη ολοκλήρωσε το διδακτορικό της το 2021, στο Τμήμα Πληροφορικής του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης, υπό την επίβλεψη του Καθηγητή Αναστάσιου Τέφα, με τίτλο “Τεχνικές Βαθιάς Μάθησης στα Ψηφιακά Μέσα“.
Περίληψη: Οι πρόσφατες εξελίξεις στον τομέα της Βαθιάς Μάθησης έχουν οδηγήσει σε εξαιρετικά αποτελέσματα για την αντιμετώπιση προβλημάτων ανάλυσης ψηφιακών μέσων, όπως είναι η κατηγοριοποίηση και η ανάκτηση εικόνων. Ωστόσο, οι μέθοδοι Βαθιάς Μάθησης, παρόλο που είναι ικανές να αντιμετωπίσουν αποτελεσματικά τα παραπάνω προβλήματα, παρουσιάζουν υψηλή υπολογιστική πολυπλοκότητα. Αυτό καθίσταται σημαντικό εμπόδιο στην εφαρμογή τους σε συσκευές με περιορισμένη υπολογιστική ισχύ. Στην παρούσα διδακτορική διατριβή μελετήθηκαν μέθοδοι Βαθιάς Μάθησης για την αντιμετώπιση των προβλημάτων της ανάκτησης εικόνων με βάση το σημασιολογικό τους περιεχόμενο, της κατηγοριοποίησης εικόνων, όπως επίσης και της αυτόματης περιγραφής βίντεο με λέξεις. Οι κύριες στοχεύσεις της παρούσας διδακτορικής διατριβής συνοψίζονται στην ανάπτυξη μεθόδων μάθησης αναπαραστάσεων προσαρμοσμένων στα συγκεκριμένα προβλήματα ανάλυσης ψηφιακών μέσων, όπως επίσης και στην ανάπτυξη ελαφρών μεθόδων Βαθιάς Μάθησης που θα επιτρέπουν την εφαρμογή τους σε συσκευές με περιορισμένους υπολογιστικούς πόρους. Για τον σκοπό αυτό, αρχικά αναπτύχθηκε γενική μέθοδος για την εκμάθηση αποτελεσματικών αναπαραστάσεων προσαρμοσμένων στο πρόβλημα της ανάκτησης εικόνων με βάση το σημασιολογικό τους περιεχόμενο. Η μέθοδος, στη συνέχεια, προσαρμόστηκε με σκοπό την εκμάθηση αναπαραστάσεων που βελτιώνουν παράλληλα με την ακρίβεια ανάκτησης, τις απαιτήσεις μνήμης και την ταχύτητα ανάκτησης. Στη συνέχεια, αναπτύχθηκαν ελαφρά μοντέλα Βαθιάς Μάθησης ικανά να εφαρμοστούν ακόμη και σε πραγματικό χρόνο για δεδομένα υψηλής ανάλυσης σε συσκευές με περιορισμένη υπολογιστική ισχύ, για την αντιμετώπιση γενικών προβλημάτων κατηγοριοποίησης εικόνων. Παράλληλα, αναπτύχθηκαν διάφορες τεχνικές κανονικοποίησης βασισμένες στην έννοια της μάθησης πολλαπλών εργασιών (π.χ. κανονικοποίηση βασισμένη στους αλγορίθμους ένθεσης γράφων, κανονικοποίηση βασισμένη στο κριτήριο της τετραγωνικής αμοιβαίας πληροφορίας), που επέτρεψαν την βελτίωση της ικανότητας γενίκευσης των προτεινόμενων ελαφρών μοντέλων. Εν συνεχεία, προτάθηκαν δύο μέθοδοι απευθείας απόσταξης γνώσης από το ίδιο το μοντέλο στον εαυτό του. Οι προτεινόμενες μέθοδοι επέτρεψαν την εκπαίδευση αποτελεσματικών ελαφρών μοντέλων σε προβλήματα κατηγοριοποίησης. Τέλος, προτάθηκε μέθοδος αυτόματης περιγραφής βίντεο με λέξεις, ικανή να συλλέξει διαφορετικούς τύπους πληροφορίας, παρέχοντας βελτιωμένα αποτελέσματα.
Ο Δρ. Ηλίας Χαλκίδης ολοκλήρωσε τη διδακτορική του διατριβή το 2021, στο Τμήμα Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών, υπό τη επίβλεψη του Καθηγητή Ίωνα Ανδρουτσόπουλου, με τίτλο “Βαθιά νευρωνικά δίκτυα για εξόρυξη πληροφοριών από νομικά κείμενα“.
Περίληψη: Η επεξεργασία νομικού κειμένου (Ashley, 2017) είναι ένας αναπτυσσόμενος τομέας έρευνας όπου οι τεχνικές επεξεργασίας φυσικής γλώσσας (NLP) εφαρμόζονται στον νομικό τομέα. Υπάρχουν πολλές εφαρμογές όπως η τμηματοποίηση νομικού κειμένου (Mencia, 2009; Hasan et al., 2008), η κατηγοριοποίηση εγγράφων σε νομικά θέματα (Mencia and Fürnkranzand, 2007; Nallapati and Manning, 2008), η πρόβλεψη και ανάλυση δικαστικών αποφάσεων (Wang et al. 2012; Aletras et al., 2016), η εξαγωγή νομικών πληροφοριών (Kiyavitskaya et al., 2008; Dozier et al., 2010; Asooja et al., 2015) και η νομική ανάκτηση πληροφορίας (Kim et al., 2015b, 2016b). Αυτές οι εφαρμογές και οι σχετικές τεχνικές NLP προέρχονται από τρεις κύριους υποτομείς: τη νομοθεσία, τις δικαστικές υποθέσεις και τις νομικές συμβάσεις (contracts). Και στους τρεις υποτομείς, τα έγγραφα είναι πολύ μεγαλύτερα από ό, τι στις περισσότερες άλλες σύγχρονες εφαρμογές NLP. Έχουν επίσης διαφορετικά χαρακτηριστικά σχετικά με τη χρήση της γλώσσας, τον τρόπο γραφής και τη δομή τους, σε σύγκριση με μη νομικό κείμενο. Δεδομένης της ταχείας ανάπτυξης τεχνολογιών βαθιάς μάθησης (Goodfellow et al., 2016; Goldberg, 2017), ο στόχος αυτής της διατριβής είναι να διερευνήσει και να αναπτύξει μεθόδους βαθιάς μάθησης για νομικές εφαρμογές, όπως εξαγωγή πληροφοριών και υποχρεώσεων από συμβάσεις, πρόβλεψη νομικής κρίσης, νομική κατηγοριοποίηση και ανάκτηση πληροφοριών, που έχουν ήδη συζητηθεί στη βιβλιογραφία (αλλά όχι στο πλαίσιο της βαθιάς μάθησης) ή που εξετάστηκαν για πρώτη φορά κατά τη διάρκεια της εργασίας αυτής της διατριβής. Σε αυτήν την κατεύθυνση, στοχεύουμε να απαντήσουμε δύο βασικά ερευνητικά ερωτήματα: Πρώτα απ ‘όλα σχετικά με την προσαρμοστικότητα των μεθόδων, οι οποίες βασίζονται σε νευρωνικά δίκτυα και έχουν προταθεί για συναφή εφαρμογές NLP σε άλλους τομείς και τον τρόπο με τον οποίο επηρεάζονται από τη νομική γλώσσα, τη γραφή και τη δομή. Και δεύτερον σχετικά με την παροχή εξηγήσεων για τις αποφάσεις (προβλέψεις) των νευρωνικών δικτύων. Λαμβάνοντας υπόψη το πρώτο ερευνητικό ερώτημα επισημαίνουμε πολλές περιπτώσεις, όπου είτε η νομική γλώσσα επηρεάζει την απόδοση ενός μοντέλου, είτε απαιτείται κατάλληλη μοντελοποίηση επί της δομή του εγγράφου. Για τον σκοπό αυτό, προ-εκπαιδεύουμε και χρησιμοποιούμε αναπαραστάσεις λέξεων και γλωσσικά μοντέλα, τα οποία είναι εξειδικευμένα για την νομική γλώσσα, ενώ προτείνουμε επίσης νέες μεθόδους με καλύτερες επιδόσεις. Όσον αφορά την επεξήγηση των αποφάσεων, αρχικά πειραματιζόμαστε με γραφήματα προσοχής (attention heatmaps) και επισημαίνουμε τους περιορισμούς τους ως μέσο για την εξήγηση των αποφάσεων ενός μοντέλου, ιδιαίτερα στην πρόβλεψης δικαστικών αποφάσεων, όπου είναι πιο σημαντικό. Για να ξεπεράσουμε αυτούς τους περιορισμούς, μελετάμε περαιτέρω τις τεχνικές εξαγωγής ερμηνειών ως εξέχουσα μεθοδολογία για την επεξήγηση των αποφάσεων ενός μοντέλου. Ελλείψει δημόσια διαθέσιμων επισημειωμένων συνόλων δεδομένων για να πειραματιστούμε με μεθόδους βαθίας μάθησης, επιμελούμε και δημοσιεύουμε πέντε σύνολα δεδομένων για διάφορες νομικές εφαρμογές (εξαγωγή στοιχείων σύμβασης, κατηγοριοποίηση εγγράφων σε νομικά θέματα, πρόβλεψη νομικής κρίσης και εξαγωγή ερμηνειών, και ανάκτηση νομικών πληροφοριών), ενώ δημοσιεύουμε επίσης νομικές αναπαραστάσεις λέξεων και ένα νομικό προ-εκπαιδευμένο γλωσσικό μοντέλο για να βοηθήσουμε την έρευνα και ανάπτυξη της νομικής επεξεργασίας κειμένου. Θεωρούμε τη δουλειά μας, ένα πρώτο, θεμελιώδες, βήμα μεταξύ άλλων πρόσφατων προσπαθειών, προς τη βελτίωση της κατανόησης της νομικής γλώσσας χρησιμοποιώντας προηγμένες τεχνικές βαθιάς μάθησης, η οποία προωθεί περαιτέρω την προσαρμογή των νέων τεχνολογιών και ρίχνει φως στον αναδυόμενο τομέα της νομικής επεξεργασία κειμένου.
Ο Δρ. Μιχάλης Μουνταντωνάκης ολοκλήρωσε τη διδακτορική του διατριβή το 2020, στο Τμήμα Επιστήμης Υπολογιστών του Πανεπιστημίου Κρήτης, υπό την επίβλεψη του Καθηγητή Γιάννη Τζίτζικα, με τίτλο “Υπηρεσίες για τη διασύνδεση και ολοκλήρωση μεγάλου πλήθους σημασιολογικών συνολοδεδομένων“.
Περίληψη: Τα ∆ιασυνδεδεμένα ∆εδομένα (Linked Data) είναι ένας τρόπος δημοσίευσης δεδομένων που διευκολύνει το διαμοιρασμό, τη διασύνδεση, την αναζήτηση και την επαναχρησιμοποίησή τους. Ήδη υπάρχουν χιλιάδες τέτοια σύνολα δεδομένων, στο εξής πηγές, και ο αριθμός και το μέγεθος τους αυξάνεται. Αν και ο κύριος στόχος των ∆ιασυνδεδεμένων ∆εδομένων είναι η διασύνδεση και η ολοκλήρωση τους, αυτός ο στόχος δεν έχει επιτευχθεί ακόμα σε ικανοποιητικό βαθμό. Ακόμα και φαινομενικά απλές εργασίες, όπως η εύρεση όλων των πληροφοριών για μία συγκεκριμένη οντότητα αποτελούν πρόκληση διότι αυτό προϋποθέτει γνώση των περιεχομένων όλων των πηγών, καθώς και την ικανότητα συλλογισμού επί των συναθροισμένων περιεχομένων τους, συγκεκριμένα απαιτείται ο υπολογισμός του συμμετρικού και μεταβατικού κλεισίματος των σχέσεων ισοδυναμίας μεταξύ των ταυτοτήτων των οντοτήτων και των οντολογιών. Η ανακάλυψη δεδομένων (Dataset Discovery) επίσης αποτελεί μεγάλη πρόκληση, διότι οι τρέχουσες προσεγγίσεις αξιοποιούν μόνο τα μεταδεδομένα των πηγών, και δεν λαμβάνουν υπόψη τα περιεχόμενα τους. Σε αυτή τη διατριβή, αναλύουμε το ερευνητικό έργο που έχει παραχθεί στον τομέα της Ολοκλήρωσης ∆ιασυνδεμένων ∆εδομένων με έμφαση σε τεχνικές που μπορούν να εφαρμοστούν σε μεγάλη κλίμακα. Συγκεκριμένα παραγοντοποιούμε το πρόβλημα σε διαστάσεις που επιτρέπουν την καλύτερη κατανόηση του προβλήματος και τον εντοπισμό των ανοικτών προκλήσεων. Εν συνεχεία προτείνουμε ευρετήρια και αλγορίθμους για την αντιμετώπιση των παραπάνω προκλήσεων, συγκεκριμένα μεθόδους για συλλογισμό επί των ταυτοτήτων των πόρων, για εύρεση όλων των πληροφοριών για μία οντότητα, για ανακάλυψη πηγών βάσει περιεχομένου και άλλων. Λόγω του μεγάλου πλήθους και όγκου των πηγών, οι τεχνικές που προτείνονται περιλαμβάνουν αυξητικούς και παράλληλους αλγορίθμους. ∆είχνουμε ότι η ανακάλυψη πηγών βάσει περιεχομένου ανάγεται στην επίλυση προβλημάτων βελτιστοποίησης και προτείνουμε τεχνικές για την αποδοτική επίλυσή τους. Τα παραπάνω ευρετήρια και αλγόριθμοι έχουν υλοποιηθεί στη σουίτα υπηρεσιών που αναπτύξαμε που αναφέρεται με το όνομα LODsyndesis, η οποία προσφέρει όλες αυτές τις υπηρεσίες σε πραγματικό χρόνο. Επιπροσθέτως, παρουσιάζουμε μία εκτενή ανάλυση συνδεσιμότητας για ένα μεγάλο υποσύνολο πηγών του νέφους Ανοικτών ∆ιασυνδεδεμένων ∆εδομένων (LOD Cloud). Συγκεκριμένα αναφέρουμε μετρήσεις (συνδεσιμότητας και αποδοτικότητας) που αφορούν 2 δισεκατομμύρια τριπλέτες, 412 εκατομμύρια URIs και 44 εκατομμύρια σχέσεις ισοδυναμίας που προέρχονται από 400 πηγές, χρησιμοποιώντας από 1 έως 96 μηχανήματα για την ευρετηρίαση.Ενδεικτικά, χρησιμοποιώντας 96 μηχανήματα χρειάστηκαν λιγότερα από 10 λεπτά για τον υπολογισμό του συμμετρικού και μεταβατικού κλεισίματος, και 81 λεπτά για την ευρετηρίαση 2 δισεκατομμυρίων τριπλετών. Επιπρόσθετα, χρησιμοποιώντας τα ευρετήρια μαζί με τους προτεινόμενους αυξητικούς αλγορίθμους, κατέστη εφικτός ο υπολογισμός των μετρήσεων συνδεσιμότητας για 1 εκατομμύριο υποσύνολα πηγών σε 1 δευτερόλεπτο (τρεις τάξεις μεγέθους γρηγορότερα σε σχέση με συμβατικές μεθόδους), ενώ οι προσφερόμενες υπηρεσίες έχουν απόκριση δευτερολέπτων. Οι υπηρεσίες αυτές καθιστούν εφικτή και την υλοποίηση υπηρεσιών υψηλότερου επιπέδου, όπως υπηρεσίες εμπλουτισμού πηγών για χρήση από τεχνικές Μηχανικής Μάθησης καθώς και τεχνικές για ∆ιανυσματικές Αναπαστάσεις Γράφων Γνώσης (Knowledge Graph Embeddings) και δείχνουμε ότι ο εμπλουτισμός αυτός βελτιώνει τις προβλέψεις σε προβλήματα μηχανικής μάθησης.