Η ιστορία της τεχνολογίας είναι, στον πυρήνα της, μια ιστορία επέκτασης των ανθρώπινων δυνατοτήτων. Για τα άτομα με προβλήματα όρασης, η υπόσχεση της Τεχνητής Νοημοσύνης (ΤΝ) δεν είναι απλώς μια ευκολία, αλλά μια θεμελιώδης αλλαγή στον τρόπο με τον οποίο αλληλεπιδρούν με τον φυσικό κόσμο. Από τις πρώτες συσκευές ανάγνωσης κειμένου έως τα σημερινά εξελιγμένα πολυτροπικά μοντέλα, η διαδρομή ήταν μακρά, αλλά βρισκόμαστε πλέον σε ένα σημείο καμπής όπου η ΤΝ μπορεί πραγματικά να λειτουργήσει ως «μάτια» για όσους το έχουν ανάγκη.
Η Σύγκλιση της Όρασης Υπολογιστή και της Φυσικής Γλώσσας
Η σημαντικότερη εξέλιξη των τελευταίων ετών είναι η μετάβαση από την απλή αναγνώριση αντικειμένων στην πλήρη κατανόηση του πλαισίου (contextual awareness). Παλαιότερα, μια εφαρμογή μπορούσε να αναγνωρίσει ένα «τραπέζι» ή μια «καρέκλα». Σήμερα, χάρη σε μοντέλα όπως το GPT-4o και το Gemini 1.5, η ΤΝ μπορεί να περιγράψει μια ολόκληρη σκηνή με εκπληκτική λεπτομέρεια: «Στο τραπέζι μπροστά σου υπάρχει ένα φλιτζάνι ζεστό καφέ στα δεξιά και ένα ανοιχτό βιβλίο στα αριστερά, ενώ κάποιος πλησιάζει από την πόρτα κρατώντας ένα φάκελο».
Αυτή η ικανότητα μετατροπής των οπτικών δεδομένων σε ζωντανή, περιγραφική γλώσσα σε πραγματικό χρόνο είναι επαναστατική. Η τεχνολογία computer vision (υπολογιστική όραση) έχει πλέον ενσωματωθεί με τα Μεγάλα Γλωσσικά Μοντέλα (LLMs), επιτρέποντας στον χρήστη να κάνει ερωτήσεις για το περιβάλλον του. «Πού άφησα τα κλειδιά μου;» ή «Τι λέει το μενού στην τρίτη σειρά;» είναι ερωτήματα που η ΤΝ μπορεί πλέον να απαντήσει αναλύοντας τη ροή βίντεο από την κάμερα ενός smartphone ή ενός ζευγαριού έξυπνων γυαλιών.
Από το Smartphone στα Wearables: Η Ελευθερία των Χεριών
Ενώ οι εφαρμογές για κινητά τηλέφωνα, όπως το Be My Eyes και το Seeing AI, αποτέλεσαν το πρώτο μεγάλο βήμα, η πραγματική αυτονομία έρχεται μέσα από τις φορέσιμες συσκευές (wearables). Τα έξυπνα γυαλιά εξοπλισμένα με κάμερες και ακουστικά επιτρέπουν στον χρήστη να έχει τα χέρια του ελεύθερα — κάτι κρίσιμο για όσους χρησιμοποιούν λευκό μπαστούνι ή σκύλο οδηγό.
Συσκευές όπως το Orcam MyEye ή οι πρόσφατες συνεργασίες της Meta με τη Ray-Ban δείχνουν το μέλλον. Αυτές οι συσκευές μπορούν να αναγνωρίζουν πρόσωπα φίλων σε ένα δωμάτιο, να διαβάζουν πινακίδες δρόμων από απόσταση και να καθοδηγούν τον χρήστη σε εσωτερικούς χώρους. Η ενσωμάτωση της ΤΝ επιτρέπει επίσης τη φιλτράρισμα των πληροφοριών. Το σύστημα δεν «βομβαρδίζει» τον χρήστη με κάθε λεπτομέρεια, αλλά ιεραρχεί τις πιο σημαντικές πληροφορίες για την ασφάλεια και την κοινωνική αλληλεπίδραση.
Η Ελληνική Πραγματικότητα και οι Υποδομές
Στην Ελλάδα, η εφαρμογή αυτών των τεχνολογιών αντιμετωπίζει ιδιαίτερες προκλήσεις. Η αρχιτεκτονική των ελληνικών πόλεων, με τα στενά πεζοδρόμια και τα συχνά εμπόδια, καθιστά την ανάγκη για ακριβή πλοήγηση ακόμη πιο επιτακτική. Ωστόσο, η υποστήριξη της ελληνικής γλώσσας από τα μεγάλα μοντέλα ΤΝ έχει βελτιωθεί θεαματικά, επιτρέποντας την απρόσκοπτη χρήση αυτών των εργαλείων από τον ελληνικό πληθυσμό.
Επιπλέον, η ΤΝ μπορεί να βοηθήσει στην ψηφιακή προσβασιμότητα. Πολλές ελληνικές ιστοσελίδες και δημόσιες υπηρεσίες παραμένουν δύσκολες στην πλοήγηση για άτομα με προβλήματα όρασης. Τα εργαλεία ΤΝ μπορούν πλέον να αναλύουν τον κώδικα μιας ιστοσελίδας σε πραγματικό χρόνο και να την «αναδομούν» ηχητικά για τον χρήστη, παρακάμπτοντας τα κακώς σχεδιασμένα στοιχεία.
Ηθικά Ζητήματα και το Κόστος της Πρόσβασης
Παρά τον ενθουσιασμό, υπάρχουν σοβαρά ερωτήματα που πρέπει να απαντηθούν. Το πρώτο αφορά την προστασία της ιδιωτικότητας. Όταν μια συσκευή καταγράφει συνεχώς το περιβάλλον για να βοηθήσει τον χρήστη, τι γίνεται με τα δεδομένα των τρίτων που εμφανίζονται στο πλάνο; Οι εταιρείες πρέπει να διασφαλίσουν ότι η επεξεργασία γίνεται τοπικά στη συσκευή (edge computing) και δεν αποθηκεύεται σε σύννεφα (clouds) χωρίς συγκατάθεση.
Το δεύτερο ζήτημα είναι το οικονομικό χάσμα. Οι πιο προηγμένες συσκευές υποβοήθησης κοστίζουν χιλιάδες ευρώ, καθιστώντας τες απρόσιτες για μεγάλο μέρος του πληθυσμού. Αν η όραση μέσω ΤΝ γίνει ένα προνόμιο των λίγων, τότε η τεχνολογία αντί να γεφυρώνει ανισότητες, θα δημιουργήσει νέες. Είναι απαραίτητο τα εθνικά συστήματα υγείας και οι ασφαλιστικοί φορείς να αναγνωρίσουν αυτές τις συσκευές ως απαραίτητα ιατρικά βοηθήματα και να επιδοτήσουν την απόκτησή τους.
Συμπέρασμα
Η Τεχνητή Νοημοσύνη δεν θα αντικαταστήσει ποτέ την ανθρώπινη όραση στην ολότητά της, αλλά προσφέρει κάτι εξίσου πολύτιμο: την αξιοπρέπεια της ανεξαρτησίας. Καθώς τα μοντέλα γίνονται εξυπνότερα και οι συσκευές μικρότερες, ο κόσμος γίνεται ξανά προσβάσιμος, γεμάτος πληροφορίες και δυνατότητες που μέχρι χθες ήταν κλειδωμένες πίσω από ένα πέπλο σκότους.