Για χρόνια, η συζήτηση γύρω από την ασφάλεια της Τεχνητής Νοημοσύνης (ΤΝ) επικεντρωνόταν σχεδόν αποκλειστικά στα ίδια τα μοντέλα. Οι ερευνητές και οι μηχανικοί ασφαλείας ανησυχούσαν για την κλοπή των βαρών (weights) των μοντέλων, την «δηλητηρίαση» των δεδομένων εκπαίδευσης (data poisoning) ή τις επιθέσεις αντιπαλότητας (adversarial attacks) που θα μπορούσαν να παραπλανήσουν έναν αλγόριθμο. Ωστόσο, καθώς η ΤΝ μετακινείται από τα ερευνητικά εργαστήρια στην καρδιά των επιχειρησιακών υποδομών, μια νέα συναίνεση αναδύεται μεταξύ των ειδικών κυβερνοασφάλειας: η προστασία του μοντέλου δεν αρκεί. Η ασφάλεια πρέπει να μετατοπιστεί στο «σύστημα».
Όπως αναφέρει πρόσφατη ανάλυση στο CSO Online, η ενσωμάτωση Μεγάλων Γλωσσικών Μοντέλων (LLMs) σε εφαρμογές μέσω πλαισίων όπως το LangChain ή το Semantic Kernel έχει δημιουργήσει μια τεράστια, νέα επιφάνεια επίθεσης. Όταν ένα μοντέλο ΤΝ αποκτά πρόσβαση σε εταιρικά email, βάσεις δεδομένων και εργαλεία αυτοματισμού, παύει να είναι ένα απομονωμένο μαθηματικό αντικείμενο και γίνεται ο κεντρικός κόμβος ενός πολύπλοκου δικτύου. Σε αυτό το περιβάλλον, οι παραδοσιακές μέθοδοι ασφάλειας αποτυγχάνουν να προβλέψουν πώς οι αλληλεπιδράσεις μεταξύ διαφορετικών στοιχείων μπορούν να οδηγήσουν σε καταστροφικές παραβιάσεις.
Η Ψευδαίσθηση της Ασφάλειας με Επίκεντρο το Μοντέλο
Η εστίαση στο μοντέλο προέρχεται από μια εποχή που η ΤΝ ήταν στατική. Σήμερα, όμως, τα συστήματα ΤΝ είναι «πρακτορικά» (agentic). Αυτό σημαίνει ότι τα μοντέλα δεν απαντούν απλώς σε ερωτήσεις, αλλά εκτελούν ενέργειες: κλείνουν ραντεβού, συντάσσουν κώδικα ή διαχειρίζονται οικονομικές συναλλαγές. Η ασφάλεια του μοντέλου μπορεί να είναι άψογη, αλλά αν η «ενορχήστρωση» (orchestration) του συστήματος είναι ελαττωματική, ένας επιτιθέμενος μπορεί να χρησιμοποιήσει το μοντέλο ως δούρειο ίππο.
Ένα κλασικό παράδειγμα είναι το «Indirect Prompt Injection» (Έμμεση Έγχυση Εντολών). Σε αυτό το σενάριο, ο επιτιθέμενος δεν χρειάζεται να αλληλεπιδράσει απευθείας με το AI. Αρκεί να τοποθετήσει κακόβουλες οδηγίες σε μια ιστοσελίδα ή ένα έγγραφο που το σύστημα AI πρόκειται να «διαβάσει» μέσω μιας λειτουργίας RAG (Retrieval-Augmented Generation). Όταν το AI επεξεργαστεί αυτό το περιβάλλον, οι κρυμμένες εντολές μπορούν να το αναγκάσουν να εξάγει ευαίσθητα δεδομένα χρήστη ή να στείλει spam, παρακάμπτοντας όλους τους εσωτερικούς ελέγχους του μοντέλου.
Από το RAG στην Πρακτορική Τεχνητή Νοημοσύνη
Η αρχιτεκτονική RAG, η οποία επιτρέπει στα μοντέλα να αντλούν πληροφορίες από εξωτερικές πηγές σε πραγματικό χρόνο, είναι πλέον ο κανόνας στις επιχειρήσεις. Ωστόσο, οι ερευνητές υποστηρίζουν ότι η ασφάλεια αυτών των συστημάτων συχνά παραμελείται. Το πρόβλημα δεν είναι το LLM, αλλά η έλλειψη εμπιστοσύνης (zero trust) στα δεδομένα που εισέρχονται στον αγωγό επεξεργασίας. Εάν το σύστημα αντιμετωπίζει κάθε πληροφορία που ανακτάται ως έμπιστη, τότε η ευπάθεια είναι δομική.
Επιπλέον, η άνοδος των AI Agents προσθέτει ένα επίπεδο κινδύνου που οι CISO (Chief Information Security Officers) μόλις τώρα αρχίζουν να κατανοούν. Ένας πράκτορας AI που έχει πρόσβαση σε APIs μπορεί να προκαλέσει Remote Code Execution (RCE) εάν οι έξοδοι του μοντέλου δεν ελέγχονται αυστηρά πριν εκτελεστούν. Η στροφή προς την «ασφάλεια συστήματος» σημαίνει την εφαρμογή παραδοσιακών αρχών πληροφορικής —όπως ο περιορισμός των προνομίων (least privilege) και η απομόνωση (sandboxing)— σε κάθε στάδιο της ροής εργασίας της ΤΝ.
Η Ανάγκη για Νέα Πλαίσια Διακυβέρνησης
Σε διεθνές επίπεδο, οργανισμοί όπως το NIST και το OWASP έχουν ήδη αρχίσει να αναπτύσσουν οδηγίες που αντικατοπτρίζουν αυτή τη συστημική προσέγγιση. Το «OWASP Top 10 for LLMs» δεν εστιάζει μόνο σε αλγοριθμικά σφάλματα, αλλά και σε ζητήματα όπως το «Insecure Output Handling» και το «Excessive Agency». Η συμμόρφωση με τον επερχόμενο νόμο της ΕΕ για την ΤΝ (EU AI Act) θα απαιτήσει επίσης από τις εταιρείες να αποδείξουν ότι έχουν αξιολογήσει τους κινδύνους σε όλο τον κύκλο ζωής του συστήματος, όχι μόνο κατά την επιλογή του μοντέλου.
Η πρόκληση για τις επιχειρήσεις είναι η ταχύτητα. Η υιοθέτηση της ΤΝ γίνεται με ρυθμούς που ξεπερνούν την ικανότητα των ομάδων ασφαλείας να θωρακίσουν τις υποδομές. Η λύση, σύμφωνα με τους ερευνητές, δεν είναι η επιβράδυνση, αλλά η ενσωμάτωση της ασφάλειας από το σχεδιασμό (security by design). Αυτό σημαίνει ότι κάθε σύνδεση μεταξύ του AI και μιας εταιρικής βάσης δεδομένων πρέπει να αντιμετωπίζεται με την ίδια καχυποψία που θα αντιμετωπιζόταν μια σύνδεση από το δημόσιο διαδίκτυο.
Συμπέρασμα: Η ΤΝ ως Μέρος της Συνολικής Αρχιτεκτονικής
Καθώς οδεύουμε προς το 2026, η διάκριση μεταξύ «ασφάλειας AI» και «γενικής κυβερνοασφάλειας» θα αρχίσει να εξασθενεί. Η ΤΝ είναι απλώς ένα ακόμα στοιχείο του λογισμικού, αν και ιδιαίτερα απρόβλεπτο. Η επιτυχία των οργανισμών θα εξαρτηθεί από την ικανότητά τους να δουν πέρα από τη «μαγεία» του μοντέλου και να επικεντρωθούν στη στιβαρότητα των συστημάτων που το περιβάλλουν. Η ασφάλεια δεν είναι πλέον μια ρύθμιση παραμέτρων στο μοντέλο, αλλά μια συνεχής διαδικασία επιτήρησης ολόκληρου του ψηφιακού οικοσυστήματος.