Η υπόσχεση της Τεχνητής Νοημοσύνης (ΤΝ) στην ιατρική έρευνα ήταν πάντα η επιτάχυνση της ανακάλυψης: η ικανότητα να κοσκινίζονται εκατομμύρια σελίδες δεδομένων για να βρεθούν συσχετίσεις που το ανθρώπινο μυαλό θα αδυνατούσε να εντοπίσει. Ωστόσο, μια πρόσφατη ανησυχητική έκθεση, που αναδείχθηκε από το CBS News, φέρνει στο φως μια σκοτεινή πλευρά αυτής της τεχνολογίας. Ερευνητές διαπίστωσαν ότι τα Μεγάλα Γλωσσικά Μοντέλα (LLMs), όπως το ChatGPT και το Gemini, συχνά «κατασκευάζουν» βιβλιογραφικές αναφορές που φαίνονται απόλυτα πειστικές, αλλά δεν υπάρχουν στην πραγματικότητα.
Αυτή η τάση, γνωστή στον κλάδο ως «παραισθήσεις» (hallucinations), παίρνει μια επικίνδυνη τροπή όταν εφαρμόζεται στον τομέα της βιοϊατρικής. Στην επιστήμη, η βιβλιογραφική αναφορά δεν είναι απλώς μια τυπική διαδικασία· είναι το θεμέλιο πάνω στο οποίο χτίζεται η γνώση. Αν μια μελέτη βασίζεται σε δεδομένα που δεν υπήρξαν ποτέ, ολόκληρο το οικοδόμημα της ιατρικής φροντίδας κινδυνεύει να καταρρεύσει.
Ο Μηχανισμός της Ψευδαίσθησης
Για να καταλάβουμε γιατί συμβαίνει αυτό, πρέπει να κατανοήσουμε τη φύση των μοντέλων ΤΝ. Τα LLMs δεν είναι βάσεις δεδομένων ή μηχανές αναζήτησης αλήθειας· είναι στατιστικές μηχανές πρόβλεψης λέξεων. Εκπαιδεύονται να αναγνωρίζουν μοτίβα στη γλώσσα. Όταν ένας ερευνητής ζητά από την ΤΝ να τεκμηριώσει έναν ισχυρισμό, το μοντέλο «γνωρίζει» πώς μοιάζει μια ιατρική παραπομπή: έχει ένα όνομα συγγραφέα, μια ημερομηνία, έναν τίτλο περιοδικού και έναν αριθμό DOI. Αν δεν μπορεί να βρει μια πραγματική αναφορά, συχνά συνθέτει μια νέα που ταιριάζει στο πλαίσιο της συζήτησης.
Το πρόβλημα είναι ότι αυτές οι κατασκευασμένες αναφορές είναι εξαιρετικά αληθοφανείς. Χρησιμοποιούν ονόματα πραγματικών καθηγητών από κορυφαία πανεπιστήμια και τίτλους έγκριτων περιοδικών όπως το *The Lancet* ή το *New England Journal of Medicine*. Σε μια μελέτη που εξέτασε 115 παραπομπές που παρήχθησαν από μια δημοφιλή πλατφόρμα ΤΝ, σχεδόν το 47% ήταν εν μέρει ή εξ ολοκλήρου κατασκευασμένες. Αυτό το ποσοστό λάθους είναι απαράδεκτο σε έναν τομέα όπου η ακρίβεια σώζει ζωές.
Οι Κίνδυνοι για την Δημόσια Υγεία
Η ενσωμάτωση της ΤΝ στη συγγραφή επιστημονικών εργασιών έχει δημιουργήσει μια νέα κρίση στην επιστημονική δεοντολογία. Οι ερευνητές, υπό την πίεση του «δημοσίευσε ή χάσου» (publish or perish), μπορεί να χρησιμοποιήσουν αυτά τα εργαλεία για να επιταχύνουν τη δουλειά τους, παραλείποντας τον εξονυχιστικό έλεγχο των πηγών. Αν μια ψευδής αναφορά περάσει από τη διαδικασία της ομότιμης αναθεώρησης (peer review) — η οποία ήδη δέχεται πιέσεις λόγω του όγκου των εργασιών — τότε η παραπληροφόρηση εισέρχεται στο επίσημο σώμα της ιατρικής γνώσης.
Φανταστείτε έναν κλινικό γιατρό που διαβάζει μια ανασκόπηση για μια νέα θεραπεία καρκίνου, η οποία υποστηρίζεται από δήθεν «ισχυρές μελέτες». Αν αυτές οι μελέτες είναι προϊόν φαντασίας μιας ΤΝ, ο γιατρός μπορεί να λάβει αποφάσεις που θα βλάψουν τον ασθενή. Επιπλέον, υπάρχει ο κίνδυνος του «κυκλικού σφάλματος»: μελλοντικά μοντέλα ΤΝ θα εκπαιδευτούν πάνω σε κείμενα που περιέχουν ήδη ψευδείς αναφορές, δημιουργώντας έναν φαύλο κύκλο παραπληροφόρησης που θα είναι αδύνατο να καθαριστεί.
Προς μια Λύση: Τεχνολογία και Ανθρώπινη Επαγρύπνηση
Η λύση δεν είναι η απαγόρευση της ΤΝ, αλλά η ριζική αλλαγή του τρόπου χρήσης της. Ήδη αναπτύσσονται τεχνικές όπως το RAG (Retrieval-Augmented Generation), όπου η ΤΝ υποχρεούται να αντλεί πληροφορίες μόνο από μια συγκεκριμένη, επαληθευμένη βάση δεδομένων (όπως το PubMed) αντί να βασίζεται στις εσωτερικές της παραμέτρους. Ωστόσο, ακόμα και αυτές οι μέθοδοι δεν είναι αλάνθαστες.
Η επιστημονική κοινότητα πρέπει να θέσει αυστηρότερους κανόνες. Τα περιοδικά πρέπει να απαιτούν τη δήλωση χρήσης ΤΝ και να χρησιμοποιούν τα ίδια εργαλεία ΤΝ για την επαλήθευση των αναφορών. Πάνω απ' όλα, η ευθύνη παραμένει στον άνθρωπο ερευνητή. Η ΤΝ μπορεί να είναι ένας εξαιρετικός βοηθός σύνταξης, αλλά ποτέ δεν πρέπει να θεωρείται πηγή αλήθειας. Η κρίση της βιοϊατρικής βιβλιογραφίας είναι μια υπενθύμιση ότι στην εποχή της αυτοματοποίησης, η κριτική σκέψη και η σχολαστική επαλήθευση είναι πιο πολύτιμες από ποτέ.
«Η Τεχνητή Νοημοσύνη δεν ψεύδεται με την ανθρώπινη έννοια· απλώς αποτυγχάνει να διακρίνει τη διαφορά ανάμεσα σε μια πιθανή πρόταση και ένα πραγματικό γεγονός. Σε έναν χειρουργείο ή σε ένα εργαστήριο, αυτή η διάκριση είναι η διαφορά μεταξύ ζωής και θανάτου.»