Μία μικρή μπλε φάλαινα βγήκε στη στεριά της Wall Street και άρχισε να «τρώει» τη χρηματιστηριακή αξία κολοσσών της Σίλικον Βάλεϊ. Η DeepSeek είναι ένα φαινόμενο που όλα δείχνουν ότι κατέλαβε εξαπίνης ειδικούς της τεχνητής νοημοσύνης, επενδυτές και κυβερνήσεις. Ποιος όμως κρύβεται πίσω από αυτή;
Ο ιδρυτής της δεν είναι παιδί της τεχνολογίας, δεν είναι ένα nerd, που έγινε ξαφνικά επιτυχημένος επιχειρηματίας. Αντιθέτως, είναι ένας επιτυχημένος επιχειρηματίας/ χρηματιστής, που μπήκε στον μαγικό κόσμο των tech nerds και ανέτρεψε τα πάντα. Ο Λιανγκ Γουενφένγκ είναι ένα όνομα που θα μας απασχολήσει για πολύ ακόμη.
Το εγχείρημά του – και η επιλογή να μην κρατήσει τη συνταγή του μυστική – πυροδότησαν έναν μίνι πανικό, ο οποίος μεταφράστηκε σε απώλειες 1 τρισ. δολαρίων από την αξία των αμερικανικών μετοχών. Πάνω από το ήμισυ ήταν το πλήγμα στην Nvidia, της οποίας τα chip είναι το «καύσιμο» πάνω στο οποίο τρέχουν τα μοντέλα generative AI, όπως το ChatGPT και τα αντίστοιχα chatbots της Google, της xAI και άλλων εταιρειών.
Αξίζει λοιπόν να δούμε την ιστορία του ανθρώπου που τα προκάλεσε όλα αυτά.
What features would you love to see on DeepSeek?
We’re building for you, and your feedback is key! Let us know what new tools or improvements you’d like—we’re all ears! #DeepSeek #DeepSeekR1— Wenfeng Liang(梁文锋) (@wenfengliang365) January 27, 2025
Η πορεία του 40χρονου Λιανγκ
Μετά την αποφοίτησή του από το Πανεπιστήμιο Zhejiang απασχολήθηκε στον χρηματοοικονομικό κλάδο. Το 2015 αποφάσισε να μπει στον κόσμο του επιχειρείν ιδρύοντας το δικό του ποσοτικό hedge fund High-Flyer το 2015, το οποίο και αποδείχθηκε άκρως επιτυχημένο.
Χάρη στο μοναδικό μοντέλο χρηματοδότησής του και το ενδιαφέρον του να προβλέψει τις τάσεις της αγοράς χρησιμοποιώντας την τεχνητή νοημοσύνη, μπόρεσε να συνεχίσει projects τεχνητής νοημοσύνης χωρίς πίεση από εξωτερικούς επενδυτές, δίνοντας προτεραιότητα στη μακροπρόθεσμη έρευνα και ανάπτυξη.
Ένας νευρικός τύπος με ένα όραμα που δεν μπορούσε να εξηγήσει
Ωστόσο, το 2021, o Λιανγκ θέλησε να κάνει ένα βήμα παραπέρα. Άρχισε να αγοράζει χιλιάδες τσιπ της Nvidia ως μέρος ενός project τεχνητής νοημοσύνης, πολύ πριν η κυβέρνηση Μπάιντεν αρχίσει να περιορίζει την προμήθεια ημιαγωγών αιχμής στην Κίνα. Κανείς δεν θα πίστευε ότι το σκεπτικό του για τη συσσώρευση επεξεργαστών γραφικών θα είχε τελικά νόημα. Ελάχιστοι κατανοούσαν τα σχέδιά του και πολλοί πίστευαν ότι έχει αρχίσει απλά να… παραξενεύει, να γίνεται ένας εκκεντρικός πλούσιος επιχειρηματίας με ένα περίεργο χόμπι.
«Όταν τον πρωτογνωρίσαμε, ήταν αυτός ο πολύ νευρικός τύπος με ένα τρομερό χτένισμα που μιλούσε για τη δημιουργία ενός συμπλέγματος 10.000 τσιπ για να εκπαιδεύσει τα δικά του μοντέλα. Δεν τον πήραμε στα σοβαρά», δήλωσε χαρακτηριστικά ένας από τους επιχειρηματικούς εταίρους του Λιανγκ στους Financial Times σε συνέντευξή του. «Δεν μπορούσε να διατυπώσει με σαφήνεια το όραμά του πέρα από το να πει: «Θέλω να το φτιάξω και θα είναι game changer. Πιστεύαμε ότι αυτό ήταν δυνατό μόνο από γίγαντες όπως η ByteDance και η Alibaba».
Excited! #DeepSeek https://t.co/rYgBYDJqcx
— Wenfeng Liang(梁文锋) (@wenfengliang365) January 28, 2025
Στρατολογώντας τα ταλέντα της Κίνας
Αν και η DeepSeek ήταν αρχικά και για τον ίδιο τον Λιανγκ ένα δευτερεύον project, ήταν παθιασμένος με την τεχνητή νοημοσύνη και συμμετείχε προσωπικά στην εκκίνηση, με μεγάλη εστίαση στην έρευνα και την ανάπτυξη. Στην πραγματικότητα, οραματίστηκε την DeepSeek ως έναν εγχώριο ηγέτη στην τεχνητή νοημοσύνη που θα μπορούσε να ανταγωνιστεί τις μεγαλύτερες εταιρείες τεχνολογίας της Κίνας καθώς και τις μεγάλες εταιρείες τεχνολογίας των ΗΠΑ.
Είναι ενδιαφέρον ότι για να δημιουργήσει μια ομάδα ερευνητών τεχνητής νοημοσύνης, ο Λιανγκ στρατολόγησε κορυφαία νεαρά ταλέντα από τοπικά κινεζικά πανεπιστήμια και δεν κοίταξε πέρα από την Κίνα, προσφέροντας μισθούς ισοδύναμους με αυτούς που πληρώνουν κορυφαίες κινεζικές εταιρείες τεχνολογίας όπως η ByteDance. Αυτή η στρατηγική τον βοήθησε να προσελκύσει τα καλύτερα ταλέντα από την Κίνα—άτομα που μπορεί να μην έχουν χρόνια εμπειρίας στην κατασκευή τεχνητής νοημοσύνης αλλά διέθεταν τις τεχνικές δεξιότητες που απαιτούνται για την ανάπτυξη της τεχνητής νοημοσύνης από την αρχή.
Το πρώτο μοντέλο AI του DeepSeek, το DeepSeek Coder, κυκλοφόρησε τον Νοέμβριο του 2023 ως μοντέλο ανοιχτού κώδικα σχεδιασμένο για εργασίες κωδικοποίησης. Ακολούθησε το DeepSeek LLM, ένα μοντέλο παραμέτρων 67Β με στόχο να ανταγωνιστεί άλλα μεγάλα γλωσσικά μοντέλα. Τον Μάιο του 2024 κυκλοφόρησε το DeepSeek-V2, το οποίο έτυχε καλής αποδοχής λόγω της ισχυρής απόδοσης και του χαμηλού κόστους του.
Σε αντίδραση στην κυκλοφορία του μοντέλου DeepSeek-V2, προκλήθηκε σάλος στην κινεζική αγορά τεχνητής νοημοσύνης, πυροδοτώντας έναν πόλεμο τιμών που ανάγκασε μεγάλους κινεζικούς γίγαντες τεχνολογίας, όπως οι ByteDance, Tencent, Baidu και Alibaba, να μειώσουν τις τιμές των μοντέλων τεχνητής νοημοσύνης. να παραμείνουν ανταγωνιστικοί.
Το DeepSeek-V2 διαδέχθηκε το DeepSeek-Coder-V2, ένα πολύ πιο προηγμένο μοντέλο με 236 δισεκατομμύρια παραμέτρους. Σχεδιασμένο για σύνθετες προκλήσεις κωδικοποίησης, διαθέτει μεγάλο μήκος περιβάλλοντος έως και 128K tokens. Αυτό το μοντέλο είναι διαθέσιμο μέσω ενός οικονομικά αποδοτικού API, με τιμή 0,14 $ ανά εκατομμύριο διακριτικά εισόδου και 0,28 $ ανά εκατομμύριο διακριτικά εξόδου.
Τα τελευταία μοντέλα της εταιρείας, DeepSeek-V3 και DeepSeek-R1, καθιέρωσαν περαιτέρω το DeepSeek ως κορυφαίο ερευνητικό εργαστήριο AI στην Κίνα. Το DeepSeek-V3, ένα μοντέλο παραμέτρων 671B, προσφέρει εντυπωσιακές επιδόσεις σε διάφορα σημεία αναφοράς, ενώ απαιτεί σημαντικά λιγότερους πόρους από τα μοντέλα τεχνητής νοημοσύνης από τεχνολογικούς γίγαντες με έδρα τις ΗΠΑ.
Το DeepSeek – R1
Ωστόσο, ήταν το DeepSeek-R1, το οποίο κυκλοφόρησε τον Ιανουάριο του 2025, που επικεντρώθηκε σε συλλογιστικές εργασίες και αμφισβήτησε το μοντέλο GPT-4 του OpenAI με τις προηγμένες δυνατότητές του, κάνοντας τους πάντες να προσέχουν το DeepSeek. Η παλιά εταιρεία του Wenfeng δήλωσε ότι το τελευταίο της μοντέλο AI, R1, ξόδεψε μόλις 5,6 εκατομμύρια δολάρια σε υπολογιστική ισχύ για το βασικό της μοντέλο, σε σύγκριση με τα εκατοντάδες εκατομμύρια ή ακόμα και τα δισεκατομμύρια δολάρια που ξοδεύουν οι αμερικανικές εταιρείες για τις τεχνολογίες AI τους.
Ο Λιανγκ και η ομάδα του εκπαίδευσαν το τελευταίο μοντέλο σε τσιπ Nvidia H800, τα οποία είναι αισθητά λιγότερο ισχυρά από τα Blackwell της Nvidia.
Οι ειδικοί βλέπουν ήδη τη στρατηγική του ως αποτελεσματική. Ένας νευρικός χρηματιστής έβαλε λοιπόν την Κίνα στον παγκόσμιο χάρτη τεχνητής νοημοσύνης.
Πηγή: naftemporiki.gr
Διαβάστε επίσης: Tρικυμία στη Silicon Valley φέρνει η DeepSeek – Πώς η «κινεζική φάλαινα» απειλεί τις αμερικανικές Big Tech