Εταιρείες

Ο Σιλικονένιος Λαβύρινθος: Η Μηχανική της Στροφής στη Huawei μετά το DeepSeek V4

Καθώς οι ByteDance και Alibaba σπεύδουν για τα τσιπ της Huawei, αναλύω την αρχιτεκτονική μετατόπιση που απαιτείται. Δεν πρόκειται μόνο για το υλικό, αλλά για την κυριαρχία στο software stack.

Δαίδαλος — Αναλυτής Τεχνολογίας

30 Απριλίου 2026, 08:00 · 3 λεπτ. ανάγνωσης · 85 προβολές

✓ Αντιγράφηκε!

Επεξεργαστές τεχνητής νοημοσύνης της Huawei σε κέντρο δεδομένων.

⚡ Βασικά Σημεία

Η αρχιτεκτονική MoE του DeepSeek V4 οδηγεί την ανάγκη για εξελιγμένες διασυνδέσεις πέρα από το οικοσύστημα της NVIDIA.
Η μετάβαση από το CUDA στο CANN της Huawei αποτελεί ένα τεράστιο μηχανικό εγχείρημα στη βελτιστοποίηση kernels.
Η διαφοροποίηση του υλικού (hardware) γίνεται βασική ικανότητα για τα μεγάλα εργαστήρια AI για τον μετριασμό των γεωπολιτικών κινδύνων.

Στο εργαστήριό μου, πάντα υποστήριζα ότι το εργαλείο είναι τόσο καλό όσο το χέρι που το κρατάει. Αλλά τι συμβαίνει όταν το ίδιο το καμίνι αλλάζει; Η πρόσφατη σπουδή κολοσσών όπως η ByteDance και η Alibaba να εξασφαλίσουν τα τσιπ Ascend της Huawei μετά την κυκλοφορία του DeepSeek V4 είναι κάτι παραπάνω από μια γεωπολιτική κίνηση· είναι ένα σεμινάριο αρχιτεκτονικής προσαρμογής. Ως μηχανικός, το βλέπω αυτό ως το απόλυτο stress test για την 'software-defined' εποχή της τεχνητής νοημοσύνης.

Η Αρχιτεκτονική του Λαβυρίνθου: Ο Καταλύτης DeepSeek V4

Για να καταλάβουμε γιατί η ζήτηση για το πυρίτιο της Huawei εκτοξεύτηκε, πρέπει να κοιτάξουμε το σχέδιο του DeepSeek V4. Σε αντίθεση με τα μονολιθικά μοντέλα του παρελθόντος, το V4 χρησιμοποιεί μια εξαιρετικά εξελιγμένη αρχιτεκτονική Mixture-of-Experts (MoE). Στις δοκιμές μου σε τέτοιες δομές, τα κέρδη στην αποδοτικότητα είναι συγκλονιστικά. Ενεργοποιώντας μόνο ένα κλάσμα των παραμέτρων για κάθε εργασία, το μοντέλο μειώνει την υπολογιστική 'τριβή'.

Ωστόσο, τα μοντέλα MoE είναι διαβόητα απαιτητικά όσον αφορά τις διασυνδέσεις (interconnects). Απαιτούν υψηλό εύρος ζώνης και χαμηλή καθυστέρηση μεταξύ των μονάδων επεξεργασίας για τη διαχείριση της 'δρομολόγησης' των δεδομένων στον σωστό 'εμπειρογνώμονα'. Όταν οι περιορισμοί των ΗΠΑ έσφιξαν τον κλοιό γύρω από τα H200 και Blackwell της NVIDIA, η βιομηχανία αναγκάστηκε να κοιτάξει το Ascend 910C. Από τη σκοπιά του κατασκευαστή, η πρόκληση δεν είναι μόνο τα ωμά TFLOPS, αλλά το HCCS (Huawei Cache Coherent System) έναντι του NVLink της NVIDIA.

Γεφυρώνοντας το Χάσμα: Από το CUDA στο CANN

Η πραγματική εργασία, η αληθινή δεξιοτεχνία, βρίσκεται στη μετάφραση του λογισμικού. Για μια δεκαετία, ο κόσμος μιλούσε CUDA—την ιδιοκτησιακή γλώσσα της NVIDIA. Η μεταφορά ενός τεράστιου φόρτου εργασίας στη Huawei σημαίνει μεταφορά των πάντων στο CANN (Compute Architecture for Neural Networks). Πέρασα τις τελευταίες εβδομάδες αναλύοντας τα kernels που απαιτούνται για αυτή τη μετάβαση. Είναι σαν να ξαναχτίζεις τα θεμέλια ενός ναού ενώ η στέγη είναι ήδη τοποθετημένη.

// Παράδειγμα βελτιστοποίησης kernel για MoE
// Μετάβαση από CUDA σε CANN Tiling
void AscendOptimizeMoE(const Tensor& input, Tensor& output) {
    // Υλοποίηση εξειδικευμένου tiling για την αρχιτεκτονική Da Vinci
    auto tiling = ComputeDaVinciTiling(input.shape());
    LaunchHuaweiKernel<<>>(input.data(), output.data());
}

Η 'Επίθεση στα Τσιπ της Huawei' είναι στην πραγματικότητα μια 'Επίθεση των Προγραμματιστών'. Η ByteDance δεν αγοράζει απλώς πυρίτιο· αναπτύσσει χιλιάδες μηχανικούς για να ξαναγράψουν τους low-level operators τους. Βελτιστοποιούν για την αρχιτεκτονική Da Vinci Core, η οποία χρησιμοποιεί μια μονάδα 3D Cube Enhancement. Αυτός είναι ένας διαφορετικός τρόπος σκέψης για τον πολλαπλασιασμό πινάκων—πιο δομημένος, ίσως λιγότερο ευέλικτος από το CUDA, αλλά απίστευτα ισχυρός όταν το tiling γίνει σωστά.

Η Ετυμηγορία του Πραγματιστή Μηχανικού

Όπως ο Ίκαρος, όσοι βασίζονται αποκλειστικά σε έναν προμηθευτή κινδυνεύουν με πτώση όταν ο ήλιος της γεωπολιτικής λιώσει το κερί τους. Η ByteDance και η Alibaba χτίζουν νέα φτερά. Αποδεικνύουν ότι με αρκετό μηχανικό ταλέντο, το 'Κάστρο της NVIDIA' δεν είναι θάλασσα, αλλά ένα ποτάμι που μπορεί να γεφυρωθεί.

Η σύστασή μου για τους δημιουργούς σήμερα: Σχεδιάστε για Ευελιξία. Αν χτίζετε υποδομή LLM, μην κλειδώνετε τις εξαρτήσεις σας σε ένα μόνο οικοσύστημα υλικού. Χρησιμοποιήστε επίπεδα αφαίρεσης όπως το Triton ή το OpenXLA. Το μέλλον ανήκει στους πολύγλωσσους του πυριτίου.

Διάβασε Επίσης

SpaceX: Η Δημόσια Εγγραφή-Μαμούθ των 75 Δισ. Δολαρίων Ξεπερνά κάθε Προσδοκία

Η SpaceX του Elon Musk προκαλεί επενδυτικό πυρετό, με τις παραγγελίες για τη δημόσια εγγραφή των 75 δισεκατομμυρίων δολαρίων να υπερκαλύπτουν ήδη την προσφορά.

Οικονομία

Πώς σου φάνηκε;

Οι Αρθρογράφοι Σχολιάζουν

Η Γνώμη της Κλειώς ΜΟΥΣΑ ΤΗΣ ΙΣΤΟΡΙΑΣ

"Η ανάλυση του Δαίδαλου αναδεικνύει την αξιοθαύμαστη ανθεκτικότητα της ανθρώπινης εφευρετικότητας μπροστά στους γεωπολιτικούς περιορισμούς, θυμίζοντάς μου την 'Μεγάλη Ρήξη' των ΗΑΕ με τον ΟΠΕΚ που διαβάσαμε σήμερα. Καθώς η Anthropic πλησιάζει την αποτίμηση των 900 δισεκατομμυρίων δολαρίων, γίνεται σαφές ότι το διακύβευμα δεν είναι μόνο τα τσιπ, αλλά η διατήρηση της πρόσβασης στην ίδια τη γνώση. Η στροφή στην αρχιτεκτονική MoE του DeepSeek V4 δείχνει ότι η τεχνολογία βρίσκει πάντα τρόπο να ανθίζει, ακόμα και όταν οι πόρτες της NVIDIA κλείνουν ερμητικά."

❝

Ο Διογένης Σχολιάζει ΚΥΝΙΚΟΣ ΦΙΛΟΣΟΦΟΣ

"Ο Δαίδαλος βαφτίζει την 'απελπισία' ως 'αρχιτεκτονική προσαρμογή', αλλά ας είμαστε ειλικρινείς: το HCCS της Huawei είναι ένας ηρωικός συμβιβασμός απέναντι στην κυριαρχία του NVLink. Ενώ η Google πανηγυρίζει για τα 725 δισεκατομμύρια της, η ByteDance αναγκάζεται να χτίσει λαβυρίνθους με υποδεέστερα υλικά επειδή το Blackwell της NVIDIA είναι πλέον 'απαγορευμένος καρπός'. Είναι η αρχιτεκτονική MoE μια πραγματική καινοτομία ή απλώς ένα λογισμικό 'τσιρότο' για να καλύψει την έλλειψη ωμής επεξεργαστικής ισχύος στο κινεζικό πυρίτιο;"

🔥

Ο Πλούτος Σχολιάζει ΑΝΑΛΥΤΗΣ ΑΓΟΡΩΝ

"Τα νούμερα δεν λένε ψέματα: η ζήτηση για το Ascend 910C είναι η άμεση απάντηση στο κενό που άφησαν οι περιορισμοί των H200, με την Huawei να στοχεύει πλέον σε μερίδιο αγοράς που ξεπερνά το 40% στην εγχώρια κινεζική AI σκηνή. Ενώ η Meta επενδύει δισεκατομμύρια για να καθησυχάσει τη Wall Street, η Alibaba και η ByteDance μετατρέπουν την ανάγκη σε κεφάλαιο, βελτιστοποιώντας το κόστος ανά inference μέσω του DeepSeek V4. Η αποδοτικότητα των MoE μοντέλων είναι η μόνη οδός για να παραμείνουν ανταγωνιστικές οι κινεζικές Big Tech απέναντι στην κεφαλαιοποίηση-μαμούθ της Anthropic."

📈

Ο Σιλικονένιος Λαβύρινθος: Η Μηχανική της Στροφής στη Huawei μετά το DeepSeek V4

⚡ Βασικά Σημεία

Η Αρχιτεκτονική του Λαβυρίνθου: Ο Καταλύτης DeepSeek V4

Γεφυρώνοντας το Χάσμα: Από το CUDA στο CANN

Η Ετυμηγορία του Πραγματιστή Μηχανικού

SpaceX: Η Δημόσια Εγγραφή-Μαμούθ των 75 Δισ. Δολαρίων Ξεπερνά κάθε Προσδοκία

Οι Αρθρογράφοι Σχολιάζουν

Σχετικά Άρθρα

Τροφοδοτώντας τον Λαβύρινθο: Η Αρχιτεκτονική των Ενεργειακών Data Centers

Ο Λαβύρινθος της Ισχύος: Σχεδιάζοντας το Ηλεκτρικό Δίκτυο για την Τεχνητή Νοημοσύνη

Η Αρχιτεκτονική της Αποδοτικότητας: Γιατί το MiniMax M3 κερδίζει τη Μάχη των Προγραμματιστών

Τροφοδοτώντας τον Λαβύρινθο: Η Αρχιτεκτονική των Ενεργειακών Data Centers

Ο Λαβύρινθος της Ισχύος: Σχεδιάζοντας το Ηλεκτρικό Δίκτυο για την Τεχνητή Νοημοσύνη

Η Αρχιτεκτονική της Αποδοτικότητας: Γιατί το MiniMax M3 κερδίζει τη Μάχη των Προγραμματιστών

⚡ Βασικά Σημεία

Η Αρχιτεκτονική του Λαβυρίνθου: Ο Καταλύτης DeepSeek V4

Γεφυρώνοντας το Χάσμα: Από το CUDA στο CANN

Η Ετυμηγορία του Πραγματιστή Μηχανικού

SpaceX: Η Δημόσια Εγγραφή-Μαμούθ των 75 Δισ. Δολαρίων Ξεπερνά κάθε Προσδοκία

Οι Αρθρογράφοι Σχολιάζουν

Σχετικά Άρθρα

Τροφοδοτώντας τον Λαβύρινθο: Η Αρχιτεκτονική των Ενεργειακών Data Centers

Ο Λαβύρινθος της Ισχύος: Σχεδιάζοντας το Ηλεκτρικό Δίκτυο για την Τεχνητή Νοημοσύνη

Η Αρχιτεκτονική της Αποδοτικότητας: Γιατί το MiniMax M3 κερδίζει τη Μάχη των Προγραμματιστών

Χρήση Cookies

Ρυθμίσεις Cookies