Faisal Bashir | Lighttroket | Getty εικόνες
Η Κίνα Deepseek έχει γίνει το μεγαλύτερο θέμα στην τεχνολογία αυτή την εβδομάδα και πολλοί στη βιομηχανία και το Wall Strith επικεντρώθηκαν σε ένα ζήτημα: 6 εκατομμύρια δολάρια.
Στο άρθρο της Deepseek για το τελευταίο μοντέλο τεχνητής νοημοσύνης, η εταιρεία δήλωσε ότι το συνολικό κόστος κατάρτισης ανήλθε σε 5.576 εκατομμύρια δολάρια. ΗΠΑ με βάση την τιμή ενοικίασης Nvidia Γραφικές μονάδες επεξεργασίας. Το Deepseek περιελάμβανε μια σαφή κράτηση, λέγοντας ότι ο αριθμός περιελάμβανε μόνο “επίσημη κατάρτιση” του μοντέλου και απέκλεισε το κόστος που σχετίζεται με την “προκαταρκτική έρευνα και αφαίρεση πειραμάτων σε αρχιτεκτονικές, αλγόριθμους ή δεδομένα”.
Στις αρχές της εβδομάδας, η Βοηθός Τεχνητή Νοημοσύνη Deepseek πήρε το επιθυμητό μέρος για τους περισσότερους ελεύθερους αμερικανούς προστασίες στις ΗΠΑ στο Apple App Store, ανατρέποντας το Chatgpt OpenAi. Οι παγκόσμιες τεχνολογικές μετοχές πωλήθηκαν με μάρκες Nvidia και Ευρύς Με βάση τη Δευτέρα στην κεφαλαιοποίηση της αγοράς ύψους 800 δισεκατομμυρίων δολαρίων.
Μια νέα αναφορά της ημι -ανάλυσης, της έρευνας ημιαγωγών και μιας συμβουλευτικής εταιρείας, πρόσθεσε περισσότερο πλαίσιο σε δαπάνες Deepseek. Η εταιρεία υπολόγισε ότι το κόστος του εξοπλισμού Depseek “σημαντικά υψηλότερο από 500 εκατομμύρια δολάρια στην ιστορία της εταιρείας”, προσθέτοντας ότι το κόστος της Ε & Α και το συνολικό κόστος σημαντικής ιδιοκτησίας. Η δημιουργία “συνθετικών δεδομένων” για το μοντέλο μάθησης θα απαιτήσει “σημαντικό αριθμό υπολογιστών”, γράφει η ημι -ανάλυση.
Η έκθεση αναφέρει ότι το claude 3,5 sonnet από την ανθρωπογενή αξία “10 εκατομμύρια δολάρια για την κατάρτιση”, αλλά σημείωσε ότι ο ανθρωπός έφερε δισεκατομμύρια δολάρια από Αμαζόνα Και GoogleΜια ένδειξη για το πόσα περισσότερα χρήματα απαιτούνται για την εκτόξευση μοντέλων και της εταιρείας.
“Αυτό οφείλεται στο γεγονός ότι πρέπει να πειραματιστούν, να εφεύρουν νέες αρχιτεκτονικές, να συλλέγουν και να καθαρίζουν δεδομένα, να πληρώνουν τους υπαλλήλους και πολλά άλλα”, δήλωσε η ημι -ανάλυση.
Το άρθρο του Depseek δεν περιλαμβάνει αξιολόγηση των υπολογισμένων δαπανών του. Η εταιρεία δεν απάντησε αμέσως σε ένα αίτημα σχετικά με το σχόλιο.
“Για να είμαστε σαφείς, το Deepseek είναι μοναδικό στο ότι πρώτα έχουν φτάσει σε αυτό το επίπεδο κόστους και ευκαιριών”, γράφει η Semianalys. Η εταιρεία πρόσθεσε ότι το R1 Deepseek “πολύ καλό μοντέλο” και ότι “καταγράφει το τέλος της συλλογιστικής, είναι γρήγορα εντυπωσιακό”.
Οι ειδικοί και οι αναλυτές αυτή την εβδομάδα διαφημίζουν την ποιότητα του μοντέλου Deepseek και σημείωσαν πόσο εντυπωσιακή είναι η εξαγωγή του Curbed Chip στην Κίνα τρεις φορές σε τρία χρόνια. Αυτό οδήγησε στους φόβους ότι οι Ηνωμένες Πολιτείες καθόρισαν τον κύριο εχθρό της στην αγορά, η οποία, όπως προβλέπει, θα υπερβεί ένα εισόδημα 1 τρισεκατομμυρίων δολαρίων για μια δεκαετία.
Οι αναλυτές του Bernstein έγραψαν σε σημείωμα τη Δευτέρα ότι “σύμφωνα με πολλές (μερικές φορές υστερικές) καυτές περιπλάνηση που είδαμε [over the weekend,] Οι συνέπειες ποικίλλουν οπουδήποτε από το “αυτό είναι πραγματικά ενδιαφέρον” σε “αυτό είναι ένα θανατηφόρο θηρίο, όπως το γνωρίζουμε”.
Η Deepseek ιδρύθηκε το 2023 από τον Lian Veniffe, συνιδρυτή του High-Flyer, ενός ποσοτικού σκαντζόχοιρου που επικεντρώνεται στο AI. Σύμφωνα με αναφορές, η εκκίνηση του AI εξελίχθηκε από την ερευνητική μονάδα του hedge -fund τον Απρίλιο του 2023 για να επικεντρωθεί σε μεγάλα γλωσσικά μοντέλα και να επιτύχει τεχνητή γενική νοημοσύνη ή AGI – υποκαταστήματα του AI, που είναι ίση ή υπερβαίνει την ανθρώπινη νοημοσύνη σε ένα ευρύ φάσμα καθηκόντων και ότι είναι OpenAI και άλλοι επιδιώκουν.
Σύμφωνα με τους αναλυτές Jefferies, η Deepseek εξακολουθεί να ανήκει και να χρηματοδοτείται από το High-Flyer.
Το Buzz γύρω από το Deepseek άρχισε να συλλέγει ατμό στις αρχές αυτού του μήνα, όταν η εκκίνηση κυκλοφόρησε το R1, ένα μοντέλο συλλογισμού που ανταγωνίζεται το O1 OpenAI. Πρόκειται για μια ανοιχτή πηγή, πράγμα που σημαίνει ότι οποιοσδήποτε προγραμματιστής AI μπορεί να το χρησιμοποιήσει.
Όπως και άλλα κινεζικά bots chat, το Deepseek’s έχει περιορισμούς σε ορισμένα θέματα: για παράδειγμα, όταν του ρωτήθηκε για ορισμένους πολιτικούς του κινεζικού ηγέτη του Xi Jinping, για παράδειγμα, Deepseek, αναφέρει, οδηγεί τον χρήστη από παρόμοιες γραμμές ανάκρισης.
Ο Γενικός Διευθυντής της OpenAI, Sam Altman, επαίνεσε δημοσίως αυτό το μοντέλο, αλλά η εταιρεία δήλωσε επίσης ότι πιστεύει ότι υπάρχουν ενδείξεις ότι η Deepseek έχει συλλέξει λανθασμένα δεδομένα OpenAI για να δημιουργήσει το δικό του προϊόν.
Στην εκδήλωση στην Ουάσινγκτον, η περιφέρεια της Κολομβίας, την Πέμπτη που διοργάνωσε ο OpenAI, ο Altman δήλωσε ότι το Deepseek είναι ένα “σαφώς εξαιρετικό μοντέλο”.
“Αυτή είναι μια υπενθύμιση του επιπέδου ανταγωνισμού και της ανάγκης να κερδίσουμε το Δημοκρατικό AL”, είπε. Είπε ότι αυτό δείχνει επίσης “το επίπεδο ενδιαφέροντος για τη συλλογιστική, το επίπεδο ενδιαφέροντος για τον κώδικα ανοιχτού κώδικα”.
ΜΑΤΙΑ: Ο γενικός διευθυντής της NVIDIA Jensen Juan και ο Πρόεδρος Trump βρίσκονται στην πολιτική τεχνητής νοημοσύνης