Η παγκόσμια κοινότητα της τεχνητής νοημοσύνης συνεχίζει να δονείται από τις επιπτώσεις της εμφάνισης της DeepSeek, της κινεζικής νεοφυούς επιχείρησης που κατάφερε να αμφισβητήσει την κυριαρχία της Silicon Valley με ένα κλάσμα του προϋπολογισμού των ανταγωνιστών της. Σε μια πρόσφατη τοποθέτηση που προκάλεσε αίσθηση, ο Sir Demis Hassabis, συνιδρυτής και διευθύνων σύμβουλος της Google DeepMind, προσέφερε μια ψύχραιμη και αναλυτική οπτική πάνω στο φαινόμενο που πολλοί αποκαλούν «τη στιγμή Sputnik της AI».
Ο Hassabis, ένας από τους αρχιτέκτονες της σύγχρονης εποχής της AI, δεν δίστασε να πλέξει το εγκώμιο των Κινέζων μηχανικών. Χαρακτήρισε το DeepSeek-V3 και το μεταγενέστερο μοντέλο R1 ως «εξαιρετικά δείγματα μηχανικής ευφυΐας», τονίζοντας ότι η ικανότητα της ομάδας από το Hangzhou να επιτύχει επιδόσεις επιπέδου GPT-4o με κόστος εκπαίδευσης μόλις 6 εκατομμυρίων δολαρίων είναι αξιοσημείωτη. Ωστόσο, η κεντρική του θέση ήταν σαφής: ο θόρυβος (hype) που υποστηρίζει ότι η DeepSeek κατέρριψε το «οχυρό» (moat) της υπολογιστικής ισχύος είναι σε μεγάλο βαθμό υπερβολικός και παραπλανητικός.
Η Παρερμηνεία της Αποτελεσματικότητας έναντι της Καινοτομίας
Σύμφωνα με τον Hassabis, υπάρχει μια θεμελιώδης διαφορά ανάμεσα στη βελτιστοποίηση υπαρχουσών αρχιτεκτονικών και στην ανακάλυψη νέων συνόρων. Η DeepSeek χρησιμοποίησε τεχνικές όπως το Multi-head Latent Attention (MLA) και το DeepSeekMoE (Mixture-of-Experts) για να μειώσει δραστικά τις απαιτήσεις σε μνήμη και υπολογιστική ισχύ κατά τη διάρκεια της εκπαίδευσης και της εξαγωγής συμπερασμάτων (inference). Αυτό, αν και εντυπωσιακό, βασίζεται σε μεγάλο βαθμό σε ιδέες που έχουν ήδη κυκλοφορήσει στην ακαδημαϊκή κοινότητα, πολλές από τις οποίες προήλθαν από την ίδια την Google και την OpenAI.
«Είναι άλλο πράγμα να χτίζεις έναν πιο αποδοτικό κινητήρα για ένα αυτοκίνητο που έχει ήδη εφευρεθεί, και εντελώς άλλο να εφευρίσκεις την πτήση», αναφέρουν αναλυτές που συμμερίζονται την άποψη του Hassabis. Ο CEO της DeepMind υποστήριξε ότι ενώ η DeepSeek απέδειξε πως η «έξυπνη μηχανική» μπορεί να κλείσει την ψαλίδα με τους πρωτοπόρους, η δημιουργία της Γενικής Τεχνητής Νοημοσύνης (AGI) θα εξακολουθεί να απαιτεί εκθετικά μεγαλύτερη κλίμακα δεδομένων και επεξεργαστικής ισχύος (Scaling Laws). Η ιδέα ότι μπορούμε να φτάσουμε στην AGI χρησιμοποιώντας μόνο λίγες χιλιάδες GPU είναι, κατά τον ίδιο, μια ψευδαίσθηση.
Το Γεωπολιτικό Σκάκι και το «Σοκ της Nvidia»
Η παρέμβαση του Hassabis έρχεται σε μια στιγμή που οι αγορές ανησυχούν για το μέλλον των επενδύσεων σε υλικό (hardware). Η αποκάλυψη ότι η DeepSeek χρησιμοποίησε παλαιότερες κάρτες Nvidia H800 —λόγω των αμερικανικών εξαγωγικών περιορισμών— για να πετύχει αυτά τα αποτελέσματα, προκάλεσε προσωρινό πανικό στη Wall Street, με τη μετοχή της Nvidia να δέχεται πιέσεις. Η αγορά φοβήθηκε ότι αν η AI μπορεί να γίνει «φθηνά», τότε η ανάγκη για τσιπ αξίας δισεκατομμυρίων θα εξατμιστεί.
Ο Hassabis αντέκρουσε αυτή τη λογική, επισημαίνοντας ότι οι περιορισμοί στους πόρους συχνά οδηγούν σε δημιουργικές λύσεις, αλλά αυτές οι λύσεις έχουν τα όριά τους. Η DeepSeek, κατά την άποψή του, δεν κατέρριψε τους νόμους της κλίμακας (Scaling Laws), αλλά απλώς βρήκε τον πιο σύντομο δρόμο για να φτάσει στο τρέχον επίπεδο τεχνολογίας. Για να ξεπεραστεί το σημερινό τέλμα και να φτάσουμε σε μοντέλα που μπορούν να κάνουν σύνθετη επιστημονική ανακάλυψη, η τεράστια υπολογιστική ισχύς παραμένει απαραίτητη.
- Η DeepSeek απέδειξε ότι η βελτιστοποίηση λογισμικού μπορεί να αντισταθμίσει την έλλειψη κορυφαίου hardware.
- Ο Hassabis τονίζει ότι η «ανοιχτή» φύση των βαρών των μοντέλων της DeepSeek είναι θετική για την έρευνα, αλλά ενέχει κινδύνους ασφαλείας.
- Η Google DeepMind παραμένει προσηλωμένη στην υπόθεση ότι η κλίμακα (scale) είναι ο μόνος δρόμος προς την πραγματική νοημοσύνη.
«Η μηχανική δεινότητα της DeepSeek είναι αξιοθαύμαστη, αλλά ας μην συγχέουμε την αποτελεσματικότητα με την υπέρβαση των ορίων της γνώσης. Η πορεία προς την AGI παραμένει μια προσπάθεια που απαιτεί τεράστιους πόρους.» — Demis Hassabis
Η Στρατηγική Απάντηση της Δύσης
Η τοποθέτηση αυτή λειτουργεί και ως μια έμμεση καθησύχαση προς τους επενδυτές της Alphabet (Google). Αν η DeepMind πίστευε ότι η DeepSeek άλλαξε το παιχνίδι ριζικά, θα έπρεπε να αναθεωρήσει τις δαπάνες δισεκατομμυρίων για τα δικά της data centers. Αντίθετα, ο Hassabis φαίνεται να προετοιμάζει το έδαφος για την επόμενη γενιά μοντέλων Gemini, τα οποία υπόσχονται να δείξουν τι μπορεί να συμβεί όταν η «έξυπνη μηχανική» της DeepSeek συνδυαστεί με την «ωμή βία» των χιλιάδων H200 και Blackwell GPU.
Στο τέλος της ημέρας, η DeepSeek πέτυχε κάτι που κανείς δεν περίμενε: ανάγκασε τους γίγαντες της Silicon Valley να γίνουν πιο ταπεινοί και πιο προσεκτικοί στις δαπάνες τους. Ακόμα κι αν ο Hassabis έχει δίκιο και ο θόρυβος είναι υπερβολικός, η βιομηχανία της AI δεν θα είναι ποτέ ξανά η ίδια. Η εποχή που η επιτυχία αγοραζόταν απλώς με περισσότερα τσιπ τελείωσε. Τώρα, η μάχη θα δοθεί στο ποιος μπορεί να συνδυάσει την καλύτερη αρχιτεκτονική με τον μεγαλύτερο υπερυπολογιστή.