29 Ιανουαρίου 2025

Μαρκ Ζούκερμπεργκ: Η Meta δημιούργησε 4 «δωμάτια πολέμου» για να αναλύσει το chatbot της DeepSeek – «Γιατί δεν το σκεφτήκαμε πρώτοι εμείς;»


Ο CEO της Meta, Μαρκ Ζούκερμπεργκ, βρίσκεται σε κατάσταση πανικού μετά την εμφάνιση της DeepSeek, μιας κινεζικής startup, η οποία έχει προκαλέσει τεράστια αναστάτωση στη Silicon Valley με την κυκλοφορία του νέου chatbot της.

Η εταιρεία του Ζούκερμπεργκ έχει συγκροτήσει 4 «δωμάτια πολέμου» (war rooms) με μηχανικούς τεχνητής νοημοσύνης, προκειμένου να κατανοήσει πώς μια κινεζική εταιρεία κατάφερε να κυκλοφορήσει μια AI τεχνολογία που ανταγωνίζεται την τεχνολογία της Meta, όπως ανέφερε το The Information.

«Η κύρια απογοήτευση είναι, “Γιατί δεν το σκεφτήκαμε πρώτοι εμείς;” όταν έχουμε χιλιάδες από τα πιο φωτεινά μυαλά που εργάζονται πάνω σε αυτό», δήλωσε ένας υπάλληλος της Meta στους Financial Times, υπό το καθεστώς της ανωνυμίας.

Η καινοτόμα, ανοιχτού κώδικα τεχνολογία της DeepSeek έχει θέσει σε αμφισβήτηση τις τεράστιες επενδύσεις που έχουν κάνει οι αμερικανικές εταιρείες στον τομέα της τεχνητής νοημοσύνης και έχει φέρει σε κατάσταση συναγερμού την ομάδα της Meta που ασχολείται με την AI.

Ο διευθυντής των AI υποδομών της Meta, Mathew Oldham, φέρεται να έχει αναφέρει στους συνεργάτες του ότι το νέο μοντέλο της DeepSeek θα μπορούσε να ξεπεράσει ακόμα και την επόμενη έκδοση της τεχνολογίας Llama της Meta, η οποία, σύμφωνα με δηλώσεις του Ζούκερμπεργκ, θα κυκλοφορήσει «στα τέλη του 2025».

Το ρεπορτάζ του The Information επικαλείται δύο υπαλλήλους που έχουν άμεση γνώση των προσπαθειών της Meta να παρακολουθήσει την εξέλιξη στον τομέα της τεχνητής νοημοσύνης, και ειδικότερα την εκτίναξη της DeepSeek στην κορυφή.

Πώς θα δράσουν τα 4 «war rooms» της Meta

Από τα τέσσερα «war rooms» που έχει δημιουργήσει η Meta για για να αναλύσει το πρωτοποριακό μοντέλο R1 της DeepSeek, δύο ομάδες θα προσπαθήσουν να κατανοήσουν πώς η εταιρεία High-Flyer κατάφερε να μειώσει το κόστος εκπαίδευσης και λειτουργίας του κινεζικού chatbot, με στόχο να εφαρμόσουν αυτές τις πρακτικές στο Llama, σύμφωνα με έναν υπάλληλο της Meta.

Οι υπόλοιπες δύο ομάδες θα επικεντρωθούν στην αποκάλυψη των δεδομένων που χρησιμοποίησε η DeepSeek για την εκπαίδευση του μοντέλου της και στην εξέταση του τρόπου που η Llama μπορεί να αναδιαρθρώσει τα μοντέλα της βασισμένα στα χαρακτηριστικά των μοντέλων της DeepSeek, όπως ανέφερε το The Information.

«Αξιολογούμε τακτικά όλα τα ανταγωνιστικά μοντέλα στη διαδικασία ανάπτυξής μας και το κάνουμε αυτό από τότε που δημιουργήθηκε η ομάδα Gen Al», δήλωσε εκπρόσωπος της Meta σε ανακοίνωσή προς το The Information. «Η Llama έχει αποτελέσει θεμέλιο για την οικοδόμηση του οικοσυστήματος ανοιχτού κώδικα μοντέλων τεχνητής νοημοσύνης και δεν θα μπορούσαμε να είμαστε πιο ενθουσιασμένοι που θα επεκτείνουμε αυτή την προσπάθεια με την επικείμενη κυκλοφορία του Llama 4».

Την Παρασκευή, ο διευθύνων σύμβουλος της Meta, Μαρκ Ζούκερμπεργκ, ανακοίνωσε ότι η εταιρεία θα επενδύσει έως και 65 δισεκατομμύρια δολάρια σε έργα που σχετίζονται με την τεχνητή νοημοσύνη την επόμενη χρονιά, περιλαμβανομένης της κατασκευής ενός μεγάλου κέντρου δεδομένων και περισσότερων προσλήψεων στον τομέα της AI.

Η ανακοίνωση αυτή έγινε λίγες ημέρες μετά την ανακοίνωση της OpenAI, σε συνεργασία με τη SoftBank, την Oracle και άλλες εταιρείες, για ένα σχέδιο υποδομών τεχνητής νοημοσύνης αξίας 500 δισεκατομμυρίων δολαρίων, που υποστηρίζεται από τον Λευκό Οίκο και θα δημιουργήσει δεκάδες νέα κέντρα δεδομένων σε όλη την Αμερική.