Μια μικρή κινεζική εταιρεία τεχνητής νοημοσύνης (AI) έκανε αίσθηση αυτήν την εβδομάδα, αποκαλύπτοντας τα μυστικά πίσω από το προηγμένο μοντέλο της, R1. Η DeepSeek, ιδρύθηκε από τον πρώην διαχειριστή hedge fund Λιανγκ Γουενφένγκ και έδειξε στον κόσμο πώς μπορεί να δημιουργηθεί ένα ισχυρό γλωσσικό μοντέλο με περιορισμένο προϋπολογισμό, χωρίς να βασίζεται σε ανθρώπινη επίβλεψη για τη βελτίωσή του.
Αυτή η κίνηση δεν πέρασε απαρατήρητη. Ο Λιανγκ, που μέχρι πρότινος ήταν γνωστός ως ένας «nerd» με ασυνήθιστα ενδιαφέροντα, μετατράπηκε σε εθνικό σύμβολο υπερηφάνειας για την Κίνα. Την ίδια στιγμή, η Silicon Valley αντιμετωπίζει ανησυχίες για το αν μπορεί να διατηρήσει την τεχνολογική της υπεροχή έναντι της κινεζικής καινοτομίας.
Η ανάδυση της DeepSeek
Η ιστορία της DeepSeek ξεκίνησε το 2021, όταν ο Λιανγκ άρχισε να αγοράζει χιλιάδες κάρτες γραφικών της Nvidia για ένα πλάγιο έργο AI, ενώ παράλληλα διηύθυνε το hedge fund High-Flyer. Αρχικά, πολλοί θεώρησαν ότι πρόκειται απλώς για μια «εκκεντρική» πρωτοβουλία ενός δισεκατομμυριούχου.
- «Ήταν ένας τύπος με άθλιο κούρεμα που μιλούσε για τη δημιουργία ενός cluster 10.000 τσιπ. Δεν τον πήραμε στα σοβαρά», ανέφερε ένας επιχειρηματίας που συνεργάστηκε μαζί του.
- «Δεν μπορούσε να εκφράσει το όραμά του πέρα από το να λέει: Θέλω να το φτιάξω και θα αλλάξει το παιχνίδι», πρόσθεσε η ίδια πηγή.
Ωστόσο, η επιμονή του Λιανγκ και η ικανότητά του να συγκεντρώνει τα καλύτερα ταλέντα αποδείχθηκαν καθοριστικές. Στη High-Flyer, είχε ήδη χτίσει μια περιουσία χρησιμοποιώντας τεχνητή νοημοσύνη για να ανακαλύπτει μοτίβα στις χρηματιστηριακές συναλλαγές. Το 2023, ίδρυσε την DeepSeek με στόχο να αναπτύξει AI σε ανθρώπινο επίπεδο.
Γιατί η DeepSeek είναι επικίνδυνη για τους κολοσσούς της AI
Η DeepSeek δεν είναι απλώς μια ακόμη εταιρεία τεχνητής νοημοσύνης. Εδώ είναι μερικοί λόγοι που την καθιστούν ιδιαίτερα απειλητική για τους γίγαντες της τεχνολογίας:
- Εστίαση στην έρευνα και όχι στα κέρδη:
Η DeepSeek δεν έχει συγκεντρώσει κεφάλαια από εξωτερικούς επενδυτές ούτε έχει κάνει σημαντικές κινήσεις για τη δημιουργία εσόδων. Αντίθετα, εστιάζει αποκλειστικά στην έρευνα και τη μηχανική. - Εξαιρετική ομάδα υποδομής:
Ο Λιανγκ συγκέντρωσε μια ομάδα από τους καλύτερους μηχανικούς, οι οποίοι καταλαβαίνουν σε βάθος πώς λειτουργούν τα τσιπ της Nvidia. Αυτό τους επιτρέπει να μεγιστοποιούν την υπολογιστική ισχύ ακόμα και με περιορισμένους πόρους. - Τοπική ταυτότητα:
Η DeepSeek στηρίζεται αποκλειστικά σε κινεζικά ταλέντα, χωρίς να προσλαμβάνει ειδικούς από το εξωτερικό. Αυτή η ταυτότητα την έχει κάνει σύμβολο εθνικής υπερηφάνειας.
Η απάντηση της Silicon Valley
Η κυκλοφορία του R1 προκάλεσε έντονη συζήτηση στις ΗΠΑ. Εταιρείες όπως η OpenAI και η Google DeepMind, που πρωτοστάτησαν στην ανάπτυξη πολυγλωσσικών μοντέλων, αντιμετωπίζουν πλέον έναν ισχυρό ανταγωνιστή.
- «Η DeepSeek λειτουργεί όπως τις πρώτες μέρες του DeepMind», σημείωσε ένας επενδυτής AI στο Πεκίνο.
- «Οι μηχανικοί της ξέρουν πώς να ξεκλειδώσουν τις δυνατότητες των GPU, ακόμα κι αν δεν είναι τελευταίας τεχνολογίας», πρόσθεσε ένας ερευνητής.
Παράλληλα, οι ΗΠΑ επιχειρούν να διατηρήσουν την τεχνολογική τους υπεροχή. Η OpenAI συνεργάζεται με την ιαπωνική SoftBank για τη δημιουργία της κοινοπραξίας Stargate, με σχέδια να δαπανήσει τουλάχιστον 100 δισεκατομμύρια δολάρια σε υποδομές AI.
Το μέλλον της DeepSeek
Η DeepSeek έχει ήδη επιδείξει εντυπωσιακά αποτελέσματα με περιορισμένους πόρους. Χρησιμοποίησε μόλις 2.048 Nvidia H800 και 5,6 εκατομμύρια δολάρια για να εκπαιδεύσει ένα μοντέλο με 671 δισεκατομμύρια παραμέτρους – ένα κλάσμα του κόστους που απαιτείται από άλλες εταιρείες.
Ωστόσο, το ερώτημα παραμένει: Μπορεί η DeepSeek να συνεχίσει να είναι ανταγωνιστική καθώς εξελίσσεται ο κλάδος;
- «Η Κίνα έχει μια τεράστια δεξαμενή ταλέντων μηχανικών συστημάτων», ανέφερε ο Ρίτουικ Γκούπτα, ερευνητής AI στο Πανεπιστήμιο της Καλιφόρνια.
- «Το πρώτο άτομο που εκπαιδεύει ένα μοντέλο ξοδεύει πολλούς πόρους. Ο δεύτερος μπορεί να το κάνει φθηνότερα και πιο γρήγορα», πρόσθεσε.
Με τον Λιανγκ να εμπλέκεται προσωπικά στην έρευνα και να χρησιμοποιεί τα έσοδα από το hedge fund του για να πληρώνει κορυφαίους μισθούς, η DeepSeek φαίνεται να έχει τα εφόδια να συνεχίσει να προκαλεί τους κολοσσούς της τεχνολογίας.
Συμπέρασμα
Η DeepSeek δεν είναι απλώς μια εταιρεία τεχνητής νοημοσύνης. Είναι ένα σύμβολο της κινεζικής καινοτομίας και της αποφασιστικότητας να ανταγωνιστεί τις ΗΠΑ στον τομέα της τεχνολογίας. Με τον Λιανγκ Γουενφένγκ να ηγείται, η εταιρεία έχει ήδη αποδείξει ότι μπορεί να αλλάξει το παιχνίδι – και αυτό είναι μόνο η αρχή.