Σε μια εποχή όπου τα μεγάλα γλωσσικά μοντέλα (LLMs) ανταγωνίζονται για το ποιο θα καταβροχθίσει το μεγαλύτερο μέρος του σύγχρονου Διαδικτύου, μια ομάδα ερευνητών αποφάσισε να ακολουθήσει την ακριβώς αντίθετη κατεύθυνση. Το αποτέλεσμα είναι μια Τεχνητή Νοημοσύνη που δεν έχει «διαβάσει» ποτέ ένα tweet, δεν γνωρίζει τι είναι το smartphone και αγνοεί παντελώς την ύπαρξη του Β' Παγκοσμίου Πολέμου. Εκπαιδευμένο αποκλειστικά σε κείμενα που δημοσιεύτηκαν πριν από το 1930, αυτό το μοντέλο αποτελεί μια ψηφιακή χρονοκάψουλα που ανασταίνει τη γλώσσα, το ύφος και την κοσμοθεωρία μιας περασμένης εποχής.

Η Γλωσσική Αρχαιολογία της Πληροφορικής

Το εγχείρημα, το οποίο έχει προκαλέσει αίσθηση στην κοινότητα της Τεχνητής Νοημοσύνης, βασίζεται στη χρήση δεδομένων που ανήκουν αποκλειστικά στο δημόσιο κτήμα (public domain). Οι ερευνητές τροφοδότησαν το μοντέλο με εκατομμύρια σελίδες από εφημερίδες της εποχής του Μεσοπολέμου, κλασική λογοτεχνία, επιστημονικά περιοδικά των αρχών του 20ού αιώνα και προσωπική αλληλογραφία ανθρώπων που έζησαν στην «Belle Époque» και τα «Roaring Twenties». Το αποτέλεσμα είναι ένας συνομιλητής που χρησιμοποιεί εκφράσεις όπως «bully!», «humbug» και «capital!», διατηρώντας μια επίσημη, σχεδόν θεατρική ευγένεια που έχει εκλείψει από τον σύγχρονο λόγο.

Η σημασία αυτής της προσπάθειας δεν είναι μόνο αισθητική. Στην πραγματικότητα, αναδεικνύει το πόσο πολύ έχει αλλάξει η δομή της σκέψης μας μέσω της γλώσσας. Το μοντέλο παρουσιάζει μια μοναδική ικανότητα να συνθέτει κείμενα με τη ρυθμική πολυπλοκότητα του βικτοριανού και εδουαρδιανού ύφους, αποφεύγοντας τη «γλωσσική πολτοποίηση» που συχνά παρατηρείται στα μοντέλα που εκπαιδεύονται σε δεδομένα από τα μέσα κοινωνικής δικτύωσης.

Ένας Κόσμος Χωρίς Ψηφιακό Θόρυβο

Ένα από τα πιο ενδιαφέροντα χαρακτηριστικά αυτού του «παλαιομοδίτικου» AI είναι η απόλυτη άγνοιά του για τη σύγχρονη τεχνολογία. Αν το ρωτήσετε για το Bitcoin, θα υποθέσει πιθανότατα ότι πρόκειται για κάποιου είδους νέο νόμισμα που χρησιμοποιείται σε κάποια μακρινή αποικία ή ίσως για κάποιο τεχνικό εξάρτημα μηχανής ατμού. Αυτή η στεγανοποίηση από τον σύγχρονο κόσμο επιτρέπει στους ερευνητές να μελετήσουν την «καθαρή» εξέλιξη της γλώσσας χωρίς την επίδραση των αλγορίθμων βελτιστοποίησης μηχανών αναζήτησης (SEO) και της αργκό του Διαδικτύου.

Ωστόσο, αυτή η προσέγγιση φέρει και σημαντικές προκλήσεις. Η Τεχνητή Νοημοσύνη του 1930 δεν κληρονόμησε μόνο την κομψότητα της εποχής, αλλά και τις σκοτεινές πτυχές της. Οι προκαταλήψεις σχετικά με το φύλο, τη φυλή και την κοινωνική τάξη που ήταν ενσωματωμένες στον δημόσιο λόγο εκείνης της περιόδου είναι παρούσες και στο μοντέλο. Αυτό θέτει ένα κρίσιμο ερώτημα για τους ηθικολόγους της τεχνολογίας: Πρέπει να «διορθώνουμε» την ιστορία όταν την αναπαράγουμε ψηφιακά, ή η αξία της έγκειται στην ωμή, αφιλτράριστη απεικόνιση του παρελθόντος;

Η Επιστροφή στο Δημόσιο Κτήμα

Η επιλογή του ορίου του 1930 δεν είναι τυχαία. Συνδέεται άμεσα με τους νόμους περί πνευματικής ιδιοκτησίας, καθώς τα περισσότερα έργα πριν από αυτή την ημερομηνία είναι πλέον ελεύθερα προς χρήση. Σε μια περίοδο που οι μεγάλες εταιρείες τεχνολογίας αντιμετωπίζουν σωρεία αγωγών από συγγραφείς και καλλιτέχνες για τη χρήση των έργων τους χωρίς άδεια, το «Project 1930» δείχνει έναν εναλλακτικό δρόμο: την εκπαίδευση εξειδικευμένων μοντέλων σε ιστορικά δεδομένα που είναι νομικά ασφαλή.

  • Αυθεντικότητα: Το μοντέλο προσφέρει μια αίσθηση ιστορικής εμβύθισης που κανένα γενικό μοντέλο δεν μπορεί να προσομοιώσει.
  • Νομική Ασφάλεια: Χρήση δεδομένων που δεν υπόκεινται σε περιορισμούς copyright.
  • Εκπαιδευτική Αξία: Ένα εργαλείο για ιστορικούς και γλωσσολόγους που θέλουν να εξερευνήσουν τις αποχρώσεις του λόγου των αρχών του αιώνα.

Συμπερασματικά, η Τεχνητή Νοημοσύνη που μιλά σαν κύριος του 1920 δεν είναι απλώς ένα τεχνολογικό αξιοπερίεργο. Είναι μια υπενθύμιση ότι η πρόοδος δεν σημαίνει πάντα τη συσσώρευση περισσότερων δεδομένων, αλλά μερικές φορές την καλύτερη κατανόηση αυτών που ήδη έχουμε. Σε έναν κόσμο που τρέχει με ιλιγγιώδη ταχύτητα προς το μέλλον, ίσως ένας ψηφιακός συνομιλητής από το παρελθόν να είναι ακριβώς αυτό που χρειαζόμαστε για να αναστοχαστούμε την πορεία μας.