Στη σύγχρονη οικονομική ανάλυση, η έλευση της Παραγωγικής Τεχνητής Νοημοσύνης (Generative AI) δεν άλλαξε μόνο τον τρόπο με τον οποίο εργαζόμαστε, αλλά και τον τρόπο με τον οποίο μετράμε αυτή την αλλαγή. Μια πρόσφατη, βαρυσήμαντη μελέτη που δημοσιεύθηκε από το Centre for Economic Policy Research (CEPR) φέρνει στο φως ένα βαθύ μεθοδολογικό και οντολογικό παράδοξο: χρησιμοποιούμε τα ίδια τα εργαλεία ΤΝ για να εκτιμήσουμε ποια επαγγέλματα κινδυνεύουν από αυτά. Η μεταφορά του «χάρακα που είναι φτιαγμένος από το υλικό που μετράει» δεν είναι απλώς ένα λογοπαίγνιο, αλλά μια προειδοποίηση για την εγκυρότητα των οικονομικών μας προβλέψεων.

Το Παράδοξο της Αυτο-Αναφοράς

Η παραδοσιακή μέθοδος εκτίμησης της «έκθεσης» (exposure) ενός επαγγέλματος στην ΤΝ βασιζόταν σε ανθρώπους εμπειρογνώμονες που ανέλυσαν χιλιάδες περιγραφές καθηκόντων από βάσεις δεδομένων όπως η O*NET. Ωστόσο, λόγω του τεράστιου όγκου δεδομένων, οι ερευνητές στράφηκαν γρήγορα στα Μεγάλα Γλωσσικά Μοντέλα (LLMs) όπως το GPT-4, το Claude και το Gemini για να αυτοματοποιήσουν αυτή τη διαδικασία. Η μελέτη του CEPR εξετάζει αν αυτή η επιλογή εισάγει συστηματικά σφάλματα.

Το πρόβλημα έγκειται στην αναστοχαστικότητα. Όταν ζητάμε από το GPT-4 να βαθμολογήσει πόσο «εκτεθειμένος» είναι ένας νομικός σύμβουλος ή ένας προγραμματιστής, το μοντέλο δεν απαντά βάσει αντικειμενικής πραγματικότητας, αλλά βάσει των δικών του δυνατοτήτων και των προκαταλήψεων που περιέχονται στα δεδομένα εκπαίδευσής του. Αυτό δημιουργεί έναν κλειστό βρόχο ανατροφοδότησης: η ΤΝ ορίζει την αξία της ανθρώπινης εργασίας με βάση τη δική της αυτο-εικόνα.

Διαφορές μεταξύ Μοντέλων και Ανθρώπινης Κρίσης

Η έρευνα χρησιμοποίησε πολλαπλά μοντέλα για να βαθμολογήσει την έκθεση σε εκατοντάδες επαγγέλματα. Τα ευρήματα είναι αποκαλυπτικά. Ενώ υπάρχει μια γενική συναίνεση για τα επαγγέλματα υψηλού κινδύνου (όπως οι μεταφραστές ή οι αναλυτές δεδομένων), οι αποκλίσεις γίνονται χαοτικές σε επαγγέλματα που απαιτούν κοινωνική νοημοσύνη ή χειρωνακτική επιδεξιότητα. Ορισμένα μοντέλα τείνουν να υπερεκτιμούν την ικανότητά τους να αντικαταστήσουν σύνθετες ανθρώπινες αλληλεπιδράσεις, ενώ άλλα εμφανίζονται πιο «συντηρητικά».

Αυτό που προκαλεί ανησυχία είναι η διαπίστωση ότι οι βαθμολογίες έκθεσης συχνά αντικατοπτρίζουν το marketing των εταιρειών τεχνολογίας παρά την πραγματική παραγωγικότητα στο πεδίο. Αν μια εταιρεία προωθεί το μοντέλο της ως «ικανό να γράφει κώδικα», το ίδιο το μοντέλο θα βαθμολογήσει τους προγραμματιστές ως εξαιρετικά εκτεθειμένους, ακόμη και αν στην πράξη η ΤΝ αδυνατεί να διαχειριστεί την αρχιτεκτονική ενός μεγάλου συστήματος.

Οι Επιπτώσεις για την Πολιτική και την Οικονομία

Γιατί έχει σημασία αν ο χάρακας είναι ελαττωματικός; Οι κυβερνήσεις και οι διεθνείς οργανισμοί χρησιμοποιούν αυτές τις μετρήσεις για να χαράξουν πολιτικές απασχόλησης, να αναθεωρήσουν εκπαιδευτικά προγράμματα και να κατευθύνουν επιδοτήσεις. Εάν οι μετρήσεις είναι λανθασμένες, κινδυνεύουμε να προετοιμάσουμε την κοινωνία για μια κρίση που μπορεί να μην έρθει με τη μορφή που περιμένουμε, αγνοώντας παράλληλα άλλους, πιο άμεσους κινδύνους.

  • Στρατηγική Επενδύσεων: Οι κεφαλαιαγορές βασίζονται σε αυτές τις προβλέψεις για να αποτιμήσουν την αξία εταιρειών έντασης εργασίας.
  • Εκπαιδευτική Μεταρρύθμιση: Οι νέοι επιλέγουν καριέρες βάσει της «ασφάλειας» από τον αυτοματισμό, η οποία όμως ορίζεται από την ίδια την ΤΝ.
  • Κοινωνική Πρόνοια: Ο σχεδιασμός για το Καθολικό Βασικό Εισόδημα (UBI) συχνά βασίζεται σε διογκωμένα νούμερα έκθεσης που παράγονται από LLMs.

Προς μια Πιο Ανθρωποκεντρική Μέτρηση

Η μελέτη του CEPR καταλήγει στο συμπέρασμα ότι δεν μπορούμε να εγκαταλείψουμε εντελώς την ΤΝ στη μέτρηση της οικονομίας, καθώς η ταχύτητά της είναι απαραίτητη. Ωστόσο, προτείνει ένα μοντέλο «επαληθευμένης έκθεσης» (validated exposure), όπου η ανθρώπινη κρίση λειτουργεί ως το τελικό φίλτρο. Πρέπει να αναγνωρίσουμε ότι η ΤΝ δεν είναι ένας ουδέτερος παρατηρητής, αλλά ένας παίκτης μέσα στο οικονομικό σύστημα.

«Η μέτρηση της τεχνολογικής προόδου από την ίδια την τεχνολογία είναι σαν να ζητάς από έναν καθρέφτη να σου πει την αλήθεια για τον κόσμο πίσω σου. Θα δεις μόνο ό,τι αντανακλάται πάνω του», σημειώνουν οι ερευνητές.

Στο μέλλον, η αξιοπιστία των οικονομικών μας προβλέψεων θα εξαρτηθεί από την ικανότητά μας να διακρίνουμε τη διαφορά ανάμεσα στην τεχνική δυνατότητα και την οικονομική σκοπιμότητα. Το γεγονός ότι ένα μοντέλο ΤΝ «πιστεύει» ότι μπορεί να κάνει μια δουλειά, δεν σημαίνει ότι η αγορά θα του το επιτρέψει ή ότι το αποτέλεσμα θα είναι κοινωνικά αποδεκτό.