Χρήστες Hype Whisper JAX ως το πιο γρήγορο API ομιλίας σε κείμενο

Χρήστες Hype Whisper JAX ως το πιο γρήγορο API ομιλίας σε κείμενο

Κόμβος πηγής: 2607028

Ο Mark Zuckerberg μπορεί να έχει διαδώσει τον όρο "metaverse", αλλά ο ιδρυτής και Διευθύνων Σύμβουλος της Meta μπορεί να μην προτείνει πλέον το metaverse στους χρήστες και τους διαφημιστές με τον ίδιο ενθουσιασμό που έκανε πριν. Ή έτσι φαίνεται. Τον τελευταίο καιρό, η Meta έχει δείξει μεγαλύτερη εστίαση στη γενετική τεχνητή νοημοσύνη.

Το Generative AI είναι ένα σύνολο τεχνικών μηχανικής εκμάθησης που επιτρέπουν στους υπολογιστές να δημιουργούν κείμενο, να σχεδιάζουν εικόνες και να δημιουργούν άλλα μέσα που μοιάζουν με ανθρώπινη παραγωγή. Τώρα, η Meta προσπαθεί να κολλήσει τους χρήστες και τους διαφημιστές στα βίντεο σύντομης μορφής που μοιάζουν με TikTok και στα εργαλεία AI.

Η εταιρεία τεχνολογίας με έδρα την Καλιφόρνια πρόσφατα ανακοίνωσε η δημιουργία μιας νέας μονάδας προϊόντων με επίκεντρο την τεχνητή νοημοσύνη – Meta AI. Επικεφαλής του τμήματος είναι ο σημερινός επικεφαλής προϊόντων Chris Cox και συνδυάζει πολλές ομάδες σε όλη τη Meta.

Διαβάστε επίσης: Big Tech Κλείστε το Metaverse στο Chase of AI Chatbot Hype

Η Meta αποκαλύπτει το DinoV2

Η ομάδα Meta αναπτύσσει πρόσωπα AI που μπορούν να βοηθήσουν τους χρήστες με πολλούς τρόπους, ισχυρίζεται ο Zuckerberg. Αυτό περιλαμβάνει δοκιμές με εμπειρίες συνομιλίας AI στο WhatsApp και το Messenger, φίλτρα εικόνας και μορφές διαφημίσεων AI στο Instagram, καθώς και εμπειρίες βίντεο και πολλαπλών μέσων AI.

Πέρυσι, η Meta AI παρουσίασε το Make-A-Video, ένα τεχνητά ευφυές σύστημα που επιτρέπει στους χρήστες να δημιουργούν βίντεο από μια προτροπή κειμένου. Πιο πρόσφατα, κυκλοφόρησε πολλά προϊόντα AI, συμπεριλαμβανομένων των DinoV2 και SAM.

Το DinoV17 που κυκλοφόρησε στις 2 Απριλίου είναι ένα μοντέλο παραγωγής τεχνητής νοημοσύνης που μπορεί να δημιουργήσει γρήγορα τρισδιάστατα στοιχεία για εικονικούς κόσμους. Σύμφωνα με α ανάρτηση, το μοντέλο είναι σε θέση να δημιουργεί τρισδιάστατα (3D) σχήματα με τοπολογία, πλούσιες γεωμετρικές λεπτομέρειες και υφές από δεδομένα όπως εικόνες και βίντεο.

Το DinoV2 χρησιμοποιεί αυτοεποπτευόμενη μάθηση, μια τεχνική που επιτρέπει στο μοντέλο να μαθαίνει από τεράστιες ποσότητες δεδομένων χωρίς ετικέτα χωρίς καμία εξωτερική βοήθεια επισήμανσης, λέει ο Meta. Το εργαλείο μπορεί να είναι πολύ χρήσιμο για δημιουργούς περιεχομένου βίντεο και σε άλλες εφαρμογές.

Η Meta είπε ότι χρησιμοποίησε το μοντέλο σε συνεργασία με Επαναφορά προς τα εμπρός «να χαρτογραφήσει τα δάση, δέντρο-δέντρο, σε περιοχές του μεγέθους των ηπείρων». Το DinoV2 μπορεί να αναγνωρίσει και να αναγνωρίσει διάφορα αντικείμενα μέσα σε ένα βίντεο, όπως ανθρώπους, κατοικίδια και άλλα αντικείμενα. Είναι επίσης σε θέση να προσδιορίσει τις σχέσεις μεταξύ αυτών των αντικειμένων και της σκηνής στο σύνολό της.

Ο ψηφιακός επιχειρηματίας Abah περιγράφεται το μοντέλο στο Twitter ως «ένα πρωτοποριακό βήμα προς την επίτευξη μοντέλων υπολογιστικής όρασης σε επίπεδο βιομηχανίας. Η χρήση της αυτοεποπτευόμενης μάθησης αλλάζει το παιχνίδι και είναι βέβαιο ότι θα προκαλέσει κύματα στη βιομηχανία της τεχνολογίας».

Άλλοι εκδήλωσαν ενδιαφέρον να χρησιμοποιήσουν το DinoV2 στη γεωργία, την ιατρική και άλλες βιομηχανίες. SAM, από την πλευρά, είναι ένα νέο μοντέλο AI που μπορεί να αναγνωρίσει μεμονωμένα αντικείμενα μέσα από μια εικόνα. Έρχεται με ένα σύνολο δεδομένων σχολιασμών εικόνων που είναι διαθέσιμο για χρήση από τους ερευνητές.

Τα προβλήματα μετασύνδεσης του Meta

Ένας ολοένα και μεγαλύτερος αριθμός μεγάλων εταιρειών τεχνολογίας τους τελευταίους μήνες έχουν βάλει τα καλά στο μετασύμπαν καθώς η εστίαση μετατοπίζεται στη νέα τρέλα chatbot με τεχνητή νοημοσύνη.

Τον Φεβρουάριο, ο κινεζικός τεχνολογικός γίγαντας Tencent Holdings μείωσε το προσωπικό της μονάδας εκτεταμένης πραγματικότητας (XR) και αναδιπλώθηκε τα σχέδια για το υλικό εικονικής πραγματικότητας (VR). Τόσο η Meta όσο και η Microsoft έχουν μειώσει σημαντικά τα σχέδιά τους για τη μεταστροφή.

Το τμήμα Reality Labs της Meta, το τμήμα της επιχείρησης που επικεντρώνεται στο VR και το metaverse, έχει χάσει χρήματα από την έναρξή του και ανέφερε ζημίες άνω των 13.7 δισεκατομμυρίων δολαρίων πέρυσι. Η εταιρεία βρίσκεται σε καλό δρόμο να περικόψει περισσότερες από 21,000 θέσεις εργασίας φέτος.

Microsoft έκλεισε τον βραχίονα VR metaverse AltspaceVR στις 10 Μαρτίου και επίσης απέλυσε όλο το προσωπικό στα δημοφιλή έργα εκτεταμένης πραγματικότητας HoloLens και Mixed Reality Tool Kit (MRTK).

Οι περικοπές συμπίπτουν με την τρέχουσα διαφημιστική εκστρατεία γύρω από τα chatbot AI, η οποία ξεκίνησε με την επιτυχία του OpenAI ChatGPT. Η Microsoft οδηγεί ένα ξεφάντωμα δαπανών στην τεχνολογία AI, με δισεκατομμύρια δολάρια να διατίθενται για την απόκτηση εξουσιών ChatGPT για την αναζήτησή της στο Bing.

Καθώς η φυγή των παγκόσμιων τεχνολογικών γίγαντων εγείρει ερωτήματα σχετικά με το αν το μετασύμπαν χάνει την ισχύ του, το Meta έχει γίνει πιο επιθετικό στην ανάπτυξη της τεχνητής νοημοσύνης, σε μια κίνηση που θα μπορούσε να ενισχύσει παραδόξως τις φιλοδοξίες του για το μετασύμπαν.

Η είσοδος της εταιρείας σε εργαλεία παραγωγής όπως το DinoV2 μπορεί να θεωρηθεί ως μια κίνηση προς το μετασύμπαν, τον εικονικό κόσμο όπου οι άνθρωποι μπορούν να αλληλεπιδρούν μεταξύ τους όπως κάνουν στον πραγματικό κόσμο. Με το DinoV2, η Meta ελπίζει να δημιουργήσει μια πιο καθηλωτική εμπειρία για τους χρήστες και να ξεπεράσει τα όρια του τι είναι δυνατό με την τεχνολογία AI.

Ο αγώνας AI θερμαίνεται

Η εστίαση της τεχνητής νοημοσύνης της Meta αποτελεί μέρος μιας ευρύτερης τάσης στον κλάδο της τεχνολογίας, καθώς οι εταιρείες αγωνίζονται να ενσωματώσουν την τεχνητή νοημοσύνη στα προϊόντα και τις υπηρεσίες τους. Η Adobe, για παράδειγμα, πρόσφατα αποκάλυψε πολλά εργαλεία τεχνητής νοημοσύνης, συμπεριλαμβανομένης της Adobe Sensei.

Όπως προηγουμένως το MetaNews αναφερθεί, το Sensei χρησιμοποιεί μηχανική εκμάθηση για να αυτοματοποιήσει τις εργασίες και να βελτιώσει την εμπειρία του χρήστη. Τα εργαλεία τεχνητής νοημοσύνης της Adobe περιλαμβάνουν επίσης το Adobe Stock, ένα εργαλείο με τεχνητή νοημοσύνη που βοηθά τους χρήστες να βρουν τις σωστές εικόνες για τα έργα τους.

Υπάρχει επίσης το Adobe Experience Cloud, το οποίο χρησιμοποιεί AI για να εξατομικεύσει τις εμπειρίες των πελατών. Ωστόσο, η Adobe δεν διαθέτει προϊόντα που να είναι άμεσα συγκρίσιμα με το DinoV2 ή το SAM.

Ωστόσο, το γεγονός ότι το DinoV2 χρειάζεται ποσότητες δεδομένων σημαίνει επίσης ότι η ακρίβεια των δεδομένων μπορεί να είναι μια σημαντική πρόκληση για το μοντέλο AI, καθώς λανθασμένα ή ασυνεπή δεδομένα μπορεί να επηρεάσουν αρνητικά την απόδοση και την ακρίβεια του μοντέλου.

Σφραγίδα ώρας:

Περισσότερα από MetaNews