Η ελευθερία της κίνησης αποτελεί μια από τις πιο θεμελιώδεις ανθρώπινες εμπειρίες, ωστόσο για τους αθλητές με προβλήματα όρασης (BLV - Blind and Low Vision), η απλή πράξη του τρεξίματος σε εξωτερικό χώρο απαιτεί συχνά τη συνεχή παρουσία ενός οδηγού, ενός σκύλου-οδηγού ή τη χρήση ενός σχοινιού (tether). Αυτή η εξάρτηση, αν και αναγκαία για την ασφάλεια, περιορίζει την αίσθηση της απόλυτης ελευθερίας. Η Google DeepMind, μέσω του νέου της ερευνητικού προγράμματος «Running Guide agent», επιχειρεί να σπάσει αυτά τα δεσμά, μετατρέποντας ένα απλό smartphone σε έναν εξελιγμένο ψηφιακό συνοδό που επιτρέπει στους δρομείς να κινούνται χωρίς περιορισμούς.
Από το Project Guideline στον Αυτόνομο Πράκτορα
Η προσπάθεια της Google στον τομέα της προσβασιμότητας για δρομείς δεν είναι καινούργια. Ξεκίνησε με το «Project Guideline», ένα σύστημα που απαιτούσε μια ζωγραφισμένη γραμμή στο έδαφος την οποία η κάμερα του κινητού ακολουθούσε για να καθοδηγήσει τον αθλητή. Ωστόσο, ο κόσμος δεν είναι μια ελεγχόμενη πίστα στίβου. Ο πραγματικός κόσμος είναι χαοτικός, γεμάτος δέντρα, πεζούς, παρκαρισμένα αυτοκίνητα και απότομες αλλαγές στο τερέν. Ο Running Guide agent αντιπροσωπεύει μια ποιοτική αναβάθμιση από ένα απλό σύστημα παρακολούθησης γραμμής σε έναν πλήρη «πράκτορα» (agent) τεχνητής νοημοσύνης.
Το σύστημα χρησιμοποιεί προηγμένα μοντέλα υπολογιστικής όρασης που εκτελούνται τοπικά στη συσκευή (on-device), διασφαλίζοντας χαμηλή καθυστέρηση (latency) – κάτι κρίσιμο όταν ένας δρομέας κινείται με ταχύτητα. Η τεχνητή νοημοσύνη δεν αναζητά πλέον μια γραμμή, αλλά κατανοεί το ευρύτερο περιβάλλον. Αναγνωρίζει τα όρια του μονοπατιού, τη διαφορά μεταξύ γρασιδιού και ασφάλτου και, το σημαντικότερο, εντοπίζει δυναμικά εμπόδια σε πραγματικό χρόνο.
Η Αρχιτεκτονική της Αντίληψης και ο Χωρικός Ήχος
Η τεχνική πρόκληση πίσω από τον Running Guide agent είναι τεράστια. Το σύστημα πρέπει να επεξεργάζεται πολλαπλά καρέ βίντεο το δευτερόλεπτο, να χαρτογραφεί το βάθος του χώρου και να προβλέπει την πορεία του δρομέα. Η Google DeepMind εφάρμοσε τεχνικές μηχανικής μάθησης που επιτρέπουν στον πράκτορα να «σκέφτεται» όπως ένας οδηγός-άνθρωπος: να δίνει προτεραιότητα στους κινδύνους και να προτείνει διορθώσεις πορείας πριν καν ο δρομέας πλησιάσει στο εμπόδιο.
Η αλληλεπίδραση με τον χρήστη γίνεται μέσω χωρικού ήχου (spatial audio). Αντί για απλές φωνητικές εντολές, ο δρομέας ακούει έναν ήχο που φαίνεται να προέρχεται από την κατεύθυνση που πρέπει να ακολουθήσει. Αν παρεκκλίνει προς τα αριστερά, ο ήχος μετακινείται προς τα δεξιά, λειτουργώντας ως ένας «ακουστικός μαγνήτης» που έλκει τον δρομέα στην ασφαλή διαδρομή. Όταν εντοπίζεται εμπόδιο, το ηχητικό σήμα αλλάζει συχνότητα και ένταση, παρέχοντας μια διαισθητική κατανόηση της απόστασης και του κινδύνου.
- Real-time Segmentation: Διαχωρισμός του ασφαλούς εδάφους από τα επικίνδυνα σημεία.
- Obstacle Detection: Αναγνώριση στατικών και κινουμένων αντικειμένων.
- On-device Processing: Λειτουργία χωρίς την ανάγκη σύνδεσης στο cloud, προστατεύοντας την ιδιωτικότητα και την ταχύτητα.
- Adaptive Guidance: Προσαρμογή των οδηγιών ανάλογα με τον ρυθμό τρεξίματος του αθλητή.
Πέρα από την Τεχνολογία: Η Κοινωνική Διάσταση
Η σημασία αυτού του εργαλείου υπερβαίνει τις τεχνικές προδιαγραφές. Για την κοινότητα των ατόμων με οπτική αναπηρία, η τεχνολογία αυτή αποτελεί ένα εργαλείο ενδυνάμωσης. Η δυνατότητα να βγει κανείς για τρέξιμο στις 6 το πρωί χωρίς να χρειάζεται να συντονιστεί με κάποιον εθελοντή οδηγό, αλλάζει ριζικά την ποιότητα ζωής. Επιπλέον, η χρήση του smartphone ως κεντρικού κόμβου καθιστά την τεχνολογία δυνητικά προσβάσιμη σε εκατομμύρια ανθρώπους, χωρίς την ανάγκη για πανάκριβο, εξειδικευμένο εξοπλισμό.
«Ο στόχος μας δεν είναι απλώς να αντικαταστήσουμε τον οδηγό, αλλά να δώσουμε στον δρομέα την αυτοπεποίθηση να εξερευνήσει το περιβάλλον του με τους δικούς του όρους», αναφέρουν οι ερευνητές της Google DeepMind.
Ωστόσο, παραμένουν προκλήσεις. Η διάρκεια ζωής της μπαταρίας κατά την έντονη επεξεργασία βίντεο, η αξιοπιστία σε συνθήκες χαμηλού φωτισμού και η ηθική ευθύνη σε περίπτωση ατυχήματος είναι ζητήματα που η βιομηχανία πρέπει να αντιμετωπίσει. Ο Running Guide agent είναι προς το παρόν ένα ερευνητικό πρωτότυπο, αλλά τα αποτελέσματα από τις δοκιμές με αθλητές όπως ο Thomas Panek δείχνουν ότι το μέλλον του «απεριόριστου» τρεξίματος είναι πιο κοντά από ποτέ.
Σε έναν κόσμο που συχνά βλέπει την τεχνητή νοημοσύνη ως απειλή για τις θέσεις εργασίας ή ως εργαλείο παρακολούθησης, τέτοιες εφαρμογές μας υπενθυμίζουν την αρχέγονη υπόσχεση της τεχνολογίας: να διευρύνει τις ανθρώπινες δυνατότητες και να γκρεμίζει τα τείχη που υψώνει η φυσική αναπηρία.