Jacques Silva | Εικόνες SOPA | Lighttroket | Getty εικόνες
Google Την Τετάρτη, κυκλοφόρησα το Gemini 2.0 – το “πιο ικανό” μοντέλο της τεχνητής νοημοσύνης είναι για όλους.
Τον Δεκέμβριο, η εταιρεία παρείχε πρόσβαση σε προγραμματιστές και αξιόπιστους Tesers και επίσης τυλίγει ορισμένες λειτουργίες στο Google Products, αλλά αυτή είναι μια “γενική απελευθέρωση”, σύμφωνα με την Google.
Το σύνολο των μοντέλων περιλαμβάνει 2.0 flash, το οποίο δηλώνεται “ένα μοντέλο ενός αλόγου εργασίας, βέλτιστη για μεγάλους όγκους, καθήκοντα υψηλής συχνότητας σε κλίμακα”. 2.0 Pro Πειραματικό, το οποίο επικεντρώνεται σε μεγάλο βαθμό στην παραγωγικότητα της κωδικοποίησης. Και 2.0 Flash-Lite, την οποία η Google εκδίδει ένα τιμολόγιο ως “πιο οικονομικό μοντέλο”.
Οι Δίδυμοι κοστίζουν το κόστος των προγραμματιστών των 10 σεντ ανά εκατομμύριο μάρκες για τις εισόδους κειμένων, εικόνων και βίντεο, ενώ η Flash-Lite, η πιο οικονομική του έκδοση, το κόστος των 0,75 κέντρων για τα ίδια.
Οι συνεχιζόμενες κυκλοφορίες αποτελούν μέρος της ευρύτερης στρατηγικής Google για να επενδύσουν σε σημαντικά κεφάλαια σε “πράκτορες του AI”, αφού ο αγώνας AI Arms θερμαίνεται μεταξύ των τεχνολογικών γίγαντες και των νεοσύστατων επιχειρήσεων.
ΜετάταΑμαζόνα, MicrosoftΤο OpenAI και το Anpropic μετακινούνται επίσης στον πράκτορα AI ή μοντέλα που μπορούν να εκτελούν σύνθετες εργασίες πολλαπλών σταδίων για λογαριασμό του χρήστη και όχι ο χρήστης που πρέπει να περάσει από κάθε ξεχωριστό βήμα.
“Κατά το παρελθόν έτος, επενδύσαμε στην ανάπτυξη περισσότερων μοντέλων πράκτορα, πράγμα που σημαίνει ότι μπορούν να καταλάβουν περισσότερα για τον κόσμο που σας περιβάλλει, σκεφτείτε μερικά βήματα και έλαβε μέτρα για λογαριασμό σας με την εποπτεία σας”, γράφει ο Gogle τον Δεκέμβριο Το blog, προσθέτοντας, προσθέτοντας ότι το Gemini 2.0 έχει “νέα επιτεύγματα σε πολυτροπικότητα – όπως μια εγγενή εικόνα και ηχητική έξοδος – και η εγγενή χρήση εργαλείων”, και τι θα μας επιτρέψει μια οικογένεια μοντέλων ” Πιο κοντά στο όραμά μας ένας καθολικός βοηθός. “
Ο ανθρωπός, υποστηριζόμενος από την εκκίνηση του Amazon AI, που ιδρύθηκε από πρώην ηγέτες της έρευνας, αποτελεί βασικό ανταγωνιστή στον αναπτυξιακό αγώνα για τεχνητές πράκτορες νοημοσύνης. Τον Οκτώβριο, η εκκίνηση ανέφερε ότι οι πράκτορες της AI ήταν σε θέση να χρησιμοποιήσουν υπολογιστές όπως οι άνθρωποι για να εκτελούν δύσκολες εργασίες. Σύμφωνα με την εκκίνηση, η δυνατότητα χρήσης του Antropic επιτρέπει στην τεχνολογία του να ερμηνεύει τι υπάρχει στην οθόνη του υπολογιστή, να επιλέξει κουμπιά, να εισαγάγει ένα κείμενο, να περιηγηθεί σε ιστότοπους και να εκτελέσει εργασίες χρησιμοποιώντας οποιοδήποτε λογισμικό και προβολή στο διαδίκτυο σε πραγματικό χρόνο.
Αυτό το εργαλείο μπορεί να “χρησιμοποιήσει υπολογιστές στα δεξιά όπως κάνουμε”, δήλωσε ο CNBC σε συνέντευξή του με τον Jared Kaplan, επικεφαλής της επιστήμης. Είπε ότι θα μπορούσε να εκτελέσει καθήκοντα με “δεκάδες ή ακόμα και εκατοντάδες βήματα”.
Πρόσφατα, η OpenAI κυκλοφόρησε ένα παρόμοιο εργαλείο, εισάγοντας μια συνάρτηση που ονομάζεται “χειριστής”, η οποία θα αυτοματοποιήσει τις εργασίες όπως οι διακοπές σχεδιασμού, η συμπλήρωση των εντύπων, η κράτηση εστιατορίων και των παραγγελιών προϊόντων. Η εκκίνηση που υποστηρίζεται από τη Microsoft περιέγραψε τον χειριστή ως “έναν πράκτορα που μπορεί να μεταβεί στο Διαδίκτυο για να ολοκληρώσει τις εργασίες σας για εσάς”.
Νωρίτερα αυτή την εβδομάδα, η OpenAI ανακοίνωσε ένα άλλο εργαλείο που ονομάζεται Deep Research, η οποία επιτρέπει στον πράκτορα της τεχνητής νοημοσύνης να συντάξει σύνθετες αναφορές έρευνας και να αναλύσει τα ζητήματα της επιλογής των χρηστών. Τον Δεκέμβριο, η Google ξεκίνησε ένα παρόμοιο εργαλείο με το ίδιο όνομα – βαθιές μελέτες που λειτουργούν ως “ερευνητής, μελετώντας σύνθετα θέματα και καταρχήν αναφορές για λογαριασμό σας”.
Το CNBC ανέφερε για πρώτη φορά τον Δεκέμβριο ότι η Google θα παρουσιάσει διάφορες λειτουργίες της τεχνητής νοημοσύνης στις αρχές του 2025.
“Στην ιστορία, δεν χρειάζεται πάντα να είσαι ο πρώτος, αλλά θα πρέπει να εκπληρώνεις καλά και να είσαι πραγματικά ο καλύτερος στην τάξη ως προϊόν”, δήλωσε εκείνη την εποχή ο Sundar Pichai, γενικός διευθυντής του Sundar Pichai. “Νομίζω ότι αυτό είναι το 2025.”