Μπορεί το Generative AI να επαναφορτίσει τις αγορές τηλεφώνων; - Semiwiki

Μπορεί το Generative AI να επαναφορτίσει τις αγορές τηλεφώνων; – Semiwiki

Κόμβος πηγής: 2926005

Η συναίνεση στις αγορές smartphone κυμαίνεται κάπου μεταξύ ελαφριάς πτώσης και ελαφριάς ανάπτυξης, υποδηλώνοντας την έλλειψη προφανών παραγόντων για πιο ισχυρή ανάπτυξη. Ως επιχειρηματική ευκαιρία, αυτή η δυσάρεστη κατάσταση αντισταθμίζεται κάπως από τον τεράστιο όγκο (500 δισεκατομμύρια δολάρια το 2023 σύμφωνα με μια πηγή), αλλά είμαστε ήδη κοντά στην κορύφωση της υιοθέτησης εκτός Κίνας, επομένως το πραγματικό ερώτημα για τους κατασκευαστές τηλεφώνων πρέπει να είναι «ποιος είναι ο επόμενος δολοφόνος εφαρμογή που θα μπορούσε να μετακινήσει τη βελόνα;»

Μπορεί το Generative AI να επαναφορτίσει τις αγορές τηλεφώνων

Εμείς οι καταναλωτές είμαστε ευμετάβλητοι και η ψυχαγωγία φαίνεται να βρίσκεται ψηλά στη λίστα με τα απαραίτητα. Ο βραχίονας είναι στοιχηματισμός σε παιχνίδια για κινητά. Μια άλλη δυνατότητα μπορεί να είναι η γενετική τεχνητή νοημοσύνη για τη δημιουργία/χειρισμό εικόνας. Qualcomm έχει ήδη επιδείξει μια δυνατότητα που βασίζεται σε τηλέφωνο ενώ άλλοι, συμπεριλαμβανομένης της Apple, εξακολουθούν να επικεντρώνονται σε εφαρμογές μεγάλων γλωσσικών μοντέλων. Για μένα αξίζει να κοιτάξω πιο προσεκτικά την πτυχή της εικόνας της γενετικής τεχνητής νοημοσύνης απλώς για να είμαι λίγο πιο ενημερωμένος εάν και όταν αυτό απογειωθεί. Για διασκέδαση δημιούργησα την εικόνα εδώ χρησιμοποιώντας το Image Creator από το Microsoft Bing.

Παραγωγή με βάση τη διάχυση

Θα προσπαθήσω να εξηγήσω την έννοια συγκρίνοντας με ένα LLM. Τα LLM εκπαιδεύονται σε ακολουθίες κειμένου, απαραίτητα γραμμικές. Πολλά από αυτά. Και εργάζονται σε κείμενο με διακριτικό, μαθαίνοντας όταν βλέπουν μια συγκεκριμένη ακολουθία διακριτικών τι μπορεί να ακολουθεί συνήθως αυτή τη σειρά. Ιδανικό για κείμενο, αλλά όχι για εικόνες που είναι 2D και γενικά δεν μπορούν να γίνουν διακριτικά, επομένως η προσέγγιση εκπαίδευσης πρέπει να είναι διαφορετική. Στην προπόνηση με βάση τη διάχυση, ο πρώτος θόρυβος προστίθεται σταδιακά στις προπονητικές εικόνες (εμπρός διάχυση), ενώ το δίκτυο εκπαιδεύεται με την απενεργοποίηση των τροποποιημένων εικόνων εικόνων για ανάκτηση κάθε αρχικής εικόνας (αντίστροφη διάχυση). Ακούγεται ακατάστατο, αλλά προφανώς η μέθοδος αποθορυβοποίησης (επίλυση στοχαστικών διαφορικών εξισώσεων) είναι καλά καθορισμένη και ισχυρή. Το μοντέλο Stable Diffusion, για παράδειγμα, είναι διαθέσιμο στο κοινό.

Στη συνέχεια, είναι δυνατή η δημιουργία νέων εικόνων από αυτό το εκπαιδευμένο δίκτυο, ξεκινώντας από μια εικόνα τυχαίου θορύβου. Τώρα χρειάζεστε μια μέθοδο για να καθοδηγήσετε την εικόνα που θέλετε να δημιουργήσετε. Το Dall.E-2, το Midjourney και το Stable Diffusion μπορούν όλα να λάβουν μηνύματα κειμένου. Αυτά εξαρτώνται από την εκπαίδευση που λαμβάνεται από ετικέτες κειμένου που παρέχονται μαζί με τις εικόνες εκπαίδευσης. Στη συνέχεια, το συμπέρασμα περιλαμβάνει άμεσες πληροφορίες στη διαδικασία προσοχής στη διαδρομή προς την εξαγωγή μιας τελικής εικόνας. Όπως τα LLM, αυτά τα συστήματα χρησιμοποιούν επίσης μετασχηματιστές, πράγμα που σημαίνει ότι η υποστήριξη αυτής της δυνατότητας απαιτεί νέο υλικό.

Η γενιά δεν περιορίζεται στη δημιουργία εικόνων από την αρχή. Μια τεχνική που ονομάζεται βαφή μπορεί να χρησιμοποιηθεί για τη βελτίωση ή την αντικατάσταση τμημάτων μιας εικόνας. Σκεφτείτε αυτό ως μια έκδοση που βασίζεται σε AI της επεξεργασίας εικόνας που είναι ήδη δημοφιλής στα smartphone. Όχι μόνο το βασικό χρώμα, η ισορροπία φωτός, η περικοπή φωτοβομβών κ.λπ., αλλά η επίλυση πολύ πιο δύσκολων προβλημάτων ή η αναδιαμόρφωση του εαυτού σας σε ρούχα cosplay – οτιδήποτε. Τώρα που βλέπω ότι είμαι πολύ δημοφιλής.

Θα κινήσει τη βελόνα η γενετική τεχνητή νοημοσύνη;

Δεν έχω ιδέα – βλέπε παραπάνω σχόλιο για άστατους καταναλωτές. Και πάλι, το οπτικό ερέθισμα, ειδικά γύρω από τον εαυτό μας, και το παιχνίδι απευθύνεται σε όλους σχεδόν. Εάν μπορείτε να το κάνετε αυτό στο τηλέφωνό σας, γιατί όχι; Το AI είναι ένας τομέας που κινείται γρήγορα και φαίνεται να ενθαρρύνει μεγάλα στοιχήματα. Σίγουρα δεν θα ήθελα να στοιχηματίσω ενάντια σε αυτό το ενδεχόμενο.

Θα πρέπει επίσης να αναφέρω ότι η γενετική απεικόνιση έχει ήδη πιο σοβαρές εφαρμογές, ειδικά στον ιατρικό τομέα όπου μπορεί να χρησιμοποιηθεί για την επιδιόρθωση μιας θορυβώδους σάρωσης CAT ή για την ανάκτηση λεπτομερειών που ενδέχεται να μπλοκαριστούν από τη δομή των οστών. Μπορώ ακόμη και να φανταστώ αυτή την τεχνολογία να μπαίνει στην εργαλειοθήκη της εγκληματολογίας. Όλοι έχουμε δει τις τηλεοπτικές εκπομπές - η Άμπι ή η Άντζελα συμπληρώνουν λεπτομέρειες που λείπουν σε μια φωτογραφία κάνοντας παρέκταση με εκπαιδευμένα δεδομένα από αυτό που είναι ορατό. Η γενετική απεικόνιση θα μπορούσε να το κάνει αυτό δυνατό!

Μοιραστείτε αυτήν την ανάρτηση μέσω:

Σφραγίδα ώρας:

Περισσότερα από Semiwiki