
Η εκκίνηση της Παρισίας της τεχνητής νοημοσύνης επικεντρώνεται στην παροχή μεγάλων γλωσσικών μοντέλων (LLMS), τα οποία κατανοούν τις περιφερειακές γλώσσες και είναι προσαρμοσμένες για να κατανοήσουν τις πολιτισμικές αποχρώσεις, οι οποίες μερικές φορές χάνονται σε μεγαλύτερα, πιο γενικά μοντέλα που εκπαιδεύονται για να διευκρινίσουν σε διάφορες γλώσσες .
Το Mistral κυκλοφόρησε το πρώτο “εξειδικευμένο” περιφερειακό μοντέλο, επικεντρώθηκε στη γλώσσα, ένα υπο -υπο -υποκείμενο. Σύμφωνα με το Mistral, το μοντέλο των 24 δισεκατομμυρίων παραμέτρων εκπαιδεύτηκε σε “προσεκτικά εποπτευόμενα σύνολα δεδομένων” από ολόκληρη τη Μέση Ανατολή και τη Νότια Ασία για να συναντηθεί με μια αυξανόμενη πελατειακή βάση στα αραβικά.
Επίσης: Τι να μάθετε για το Mistral AI: η εταιρεία που στέκεται πίσω από τον τελευταίο αντίπαλο GPT-4
Μια εκκίνηση που βασίζεται σε πρώην υπαλλήλους του Meta προσπαθεί να ανταγωνιστεί όπως η ChatGPT και η Microsoft Copilot με τη δική του συνομιλία AI chatbot. Το Mistral ανέπτυξε και κυκλοφόρησε αρκετές LLM, τόσο εμπορικές όσο και ανοιχτές πηγές, οι οποίες είναι διαθέσιμες μέσω ιστότοπων, κινητών εφαρμογών και API για εφαρμογές τρίτων.
Το SABA είναι σχετικά παρόμοιο με το μέγεθος του Mistral Small 3, ένα μοντέλο γενικής χρήσης με ανοιχτό κώδικα συγκρίσιμο με μεγαλύτερα μοντέλα, όπως το LLAMA 3.3 70B, το QWEN 32B και ακόμη και το GPT4O-MINI. Ωστόσο, σύμφωνα με τους δείκτες του Mistral, η SABA ασχολείται καλύτερα με την επεξεργασία του αραβικού περιεχομένου από ό, τι το Mistral Small 3 και άλλα LLMS.
Σύμφωνα με το Mistral, το μοντέλο ξεπερνά επίσης τις νότιες ινδικές γλώσσες, όπως το Ταμίλ και το Μαλαγιαλάμ λόγω της «πολιτιστικής διασταύρωσης» μεταξύ της Μέσης Ανατολής και της Νότιας Ασίας.
Άλλες εταιρείες τεχνητής νοημοσύνης προσπαθούν για παρόμοιους στόχους με περιφερειακά LLMS: OpenAI έχει αναπτύξει το ιαπωνικό μοντέλο GPT-4. Το έργο GPT Eurolingua επικεντρώνεται στις ευρωπαϊκές γλώσσες. Baai Pecijing με έναν κώδικα ανοιχτού κώδικα του μοντέλου της αραβικής γλώσσας (ALM) το 2022. Και η Νιγηριανή Awarri χτίζει το δικό του LLM για τις νιγηριανές γλώσσες με χαμηλό πόρο.
Σύμφωνα με τις δοκιμές ελέγχου του Mistral, η SABA υπερβαίνει τα αραβικά μοντέλα, όπως το JAIS 70B και το πολύγλωσσο LLM, όπως το Mistral Small 3, το LLAMA 3.1 70B, το GPT 4O-MINI.
Επιπλέον, σημειώσεις Mistral: “Η SABA παρέχει ακριβέστερες και κατάλληλες απαντήσεις από τα μοντέλα, 5 φορές, ενώ πολύ ταχύτερα και λιγότερα έξοδα. Το μοντέλο μπορεί επίσης να είναι μια ισχυρή βάση για τη διδασκαλία ιδιαίτερα ειδικής περιφερειακής προσαρμογής. Δεδομένου ότι το μοντέλο κατανοεί τις πολιτιστικές λεπτές αποχρώσεις των τοπικών ριζωμένων και τις αποχρώσεις της Μέσης Ανατολής, τις διεκδικήσεις Mistral, είναι πιο αποτελεσματικό για τη δημιουργία περιεχομένου ειδικά για την περιοχή και είναι ιδανικό για εξειδικευμένες περιπτώσεις χρήσης.
Επίσης: Το Google Translate λαμβάνει 110 νέες γλώσσες χρησιμοποιώντας το AI, φέρνοντας το συνολικό αριθμό σε 243
Η SABA είναι τώρα διαθέσιμη για την υποστήριξη συνομιλίας ή τη δημιουργία περιεχομένου στην αραβική γλώσσα, αλλά, σύμφωνα με την εταιρεία, θα μπορούσε επίσης να “συντονιστεί” για τις αρχές των εικονικών βοηθών στην αραβική γλώσσα για επιχειρήσεις ή “εξειδικευμένα εργαλεία [within] Ενέργεια, χρηματοπιστωτικές αγορές και υγειονομική περίθαλψη.
Το blog αναφέρει επίσης ότι το Mistral SABA είναι διαθέσιμο μέσω του API MISTRAL και μπορεί επίσης να “αναπτυχθεί στις εγκαταστάσεις ασφάλειας των πελατών”.