Η IBM κυκλοφορεί νέες εκδόσεις ανοιχτού κώδικα Granite Large Language Models (LLM) κάθε λίγους μήνες. Το Granite 3.1 είναι το μοντέλο τελευταίας γενιάς, που βασίζεται στην επιτυχία του Granite 3.0. Το μοντέλο προσφέρει προηγμένες λειτουργίες και βελτιστοποιημένες επιδόσεις για επαγγελματικές εφαρμογές.
Επίσης: Οι προχωρημένοι χρήστες Gemini μπορούν πλέον να έχουν πρόσβαση στο πιο πειραματικό μοντέλο της Google.
Η οικογένεια μοντέλων Granite 3.1 διαθέτει ένα εντυπωσιακό παράθυρο περιβάλλοντος 128K διακριτικών, το οποίο είναι πολύ περισσότερο από τους προκατόχους τους. Αυτή η επέκταση επιτρέπει στα μοντέλα να επεξεργάζονται και να κατανοούν πολύ μεγαλύτερους όγκους κειμένου, που ισοδυναμούν με περίπου 85.000 αγγλικές λέξεις, επιτρέποντας πιο περίπλοκη ανάλυση και δημιουργία εργασιών. Συγκριτικά, το ChatGPT 3 του OpenAI, το οποίο ξεκίνησε την επανάσταση του AI, μπορούσε να χειριστεί μόνο 2.000 μάρκες.
Ανωτερότητα έναντι των ανταγωνιστών
Η Big Blue ισχυρίζεται ότι το νέο της Granite 8B Instruct ξεπερνά τους ανταγωνιστές της, όπως το Gemma 2 της Google, το Meta Llama 3.1 και το Qwen 2.5, στις δοκιμές OpenLLM Leaderboard του HuggingFace.
Επίσης: Θέλετε το LLM Generative AI να ενσωματωθεί με τα δεδομένα της επιχείρησής σας; Χρειάζεστε ένα RAG
Η οικογένεια Granite 3.1 περιλαμβάνει πυκνά μοντέλα και επιλογές Mixture of Experts (MoE). Η IBM λέει ότι τα μοντέλα Granite 2B και 8B είναι LLM υψηλής πυκνότητας κειμένου που έχουν εκπαιδευτεί σε περισσότερα από 12 τρισεκατομμύρια διακριτικά δεδομένων. Τα πυκνά μοντέλα έχουν σχεδιαστεί για να υποστηρίζουν περιπτώσεις χρήσης που βασίζονται σε εργαλεία, καθώς και δημιουργία προηγμένης αναζήτησης (RAG), βελτιστοποίηση δημιουργίας κώδικα, μετάφραση και διόρθωση σφαλμάτων.
Τα μοντέλα του Υπουργείου Παιδείας εκπαιδεύονται σε περισσότερα από 10 τρισεκατομμύρια διακριτικά δεδομένων. Η IBM λέει ότι αυτά τα μοντέλα είναι ιδανικά για ανάπτυξη σε εφαρμογές συσκευών χαμηλής καθυστέρησης.
Βελτιωμένες δυνατότητες γραφικών και γλώσσας.
Η νέα έκδοση εισάγει επίσης δυνατότητες εισαγωγής/εξόδου εικόνας, επεκτείνοντας τις δυνατότητες εφαρμογής του μοντέλου για επιχειρήσεις γραφικών.
Το Granite 3.1 προσφέρει επίσης βελτιωμένες δεξιότητες ξένων γλωσσών. Εκτός από τα αγγλικά, μπορεί πλέον να χειριστεί δώδεκα γλώσσες, όπως γερμανικά, ισπανικά, γαλλικά, ιαπωνικά, πορτογαλικά, αραβικά, τσέχικα, ιταλικά, κορεάτικα, ολλανδικά και απλοποιημένα κινέζικα. Εν ολίγοις, εάν έχετε μια διεθνή επιχείρηση, η IBM έχει ένα πρόγραμμα LLM που μπορείτε να χρησιμοποιήσετε.
Όπως και πριν, τα νέα Granite LLM αδειοδοτούνται με την άδεια ανοιχτού κώδικα Apache 2. Η IBM διατηρεί επίσης τη δέσμευσή της για διαφάνεια ανοίγοντας σύνολα δεδομένων εκπαίδευσης και παρέχοντας πλήρη τεκμηρίωση για την ανάπτυξη και την απόδοση του μοντέλου.
Επίσης: Το Generative AI φέρνει νέους κινδύνους για όλους. Δείτε πώς μπορείτε να παραμείνετε ασφαλείς
Εάν έχετε ανησυχίες σχετικά με την πνευματική ιδιοκτησία και την τεχνητή νοημοσύνη, η IBM προσφέρει απεριόριστη αποζημίωση για αξιώσεις πνευματικής ιδιοκτησίας τρίτων που προκύπτουν από τη χρήση των μοντέλων της. Μπορεί να μην ανησυχείτε ακόμα για αυτά τα πιθανά νομικά ζητήματα, αλλά σας διαβεβαιώνω ότι θα ανησυχήσουν.
Ισχυρή και αξιόπιστη τεχνητή νοημοσύνη για επιχειρήσεις
Τα μοντέλα Granite 3.1 είναι διαθέσιμα στην πλατφόρμα IBM Watsonx. πάροχοι υπηρεσιών cloud, όπως το Google Vertex AI. και πλατφόρμες τεχνητής νοημοσύνης, συμπεριλαμβανομένων των Hugging Face, NVIDIA (ως μικροϋπηρεσίες NIM), Ollama και Replication.
Η κυκλοφορία του Granite 3.1 στοχεύει να επιταχύνει την υιοθέτηση της τεχνητής νοημοσύνης σε εταιρικές ρυθμίσεις. Συνδυάζοντας αυτά τα μοντέλα με ιδιόκτητα δεδομένα χρησιμοποιώντας τεχνολογίες όπως το IBM InstructLab, οι επιχειρήσεις μπορούν δυνητικά να επιτύχουν απόδοση συγκεκριμένης εργασίας που συναγωνίζεται μεγαλύτερα μοντέλα με ένα κλάσμα του κόστους.
Καθώς ο τομέας της τεχνητής νοημοσύνης εξελίσσεται ταχέως, το IBM Granite 3.1 αντιπροσωπεύει ένα σημαντικό βήμα προόδου στην παροχή στις επιχειρήσεις ισχυρών, αποτελεσματικών και αξιόπιστων εργαλείων τεχνητής νοημοσύνης για την προώθηση της καινοτομίας και την επίλυση σύνθετων επιχειρηματικών προβλημάτων.