Σε ποιον ανήκει η Generative AI Platform;

Σε ποιον ανήκει η Generative AI Platform;

Κόμβος πηγής: 1909271

Αρχίζουμε να βλέπουμε τα πολύ πρώιμα στάδια μιας στοίβας τεχνολογίας να αναδύονται στη γενετική τεχνητή νοημοσύνη (AI). Εκατοντάδες νέες νεοφυείς επιχειρήσεις σπεύδουν στην αγορά για να αναπτύξουν βασικά μοντέλα, να δημιουργήσουν εφαρμογές τεχνητής νοημοσύνης και να δημιουργήσουν υποδομές/εργαλεία.

Πολλές καυτές τάσεις της τεχνολογίας διαφημίζονται πολύ πριν φτάσει η αγορά. Αλλά η παραγωγική έκρηξη της τεχνητής νοημοσύνης συνοδεύτηκε από πραγματικά κέρδη σε πραγματικές αγορές και πραγματική έλξη από πραγματικές εταιρείες. Μοντέλα όπως το Stable Diffusion και το ChatGPT σημειώνουν ιστορικά ρεκόρ για την ανάπτυξη των χρηστών και αρκετές εφαρμογές έχουν φτάσει τα 100 εκατομμύρια δολάρια σε ετήσια έσοδα λιγότερο από ένα χρόνο μετά την κυκλοφορία. Οι συγκρίσεις δίπλα-δίπλα δείχνουν μοντέλα τεχνητής νοημοσύνης ξεπερνώντας τους ανθρώπους σε ορισμένες εργασίες κατά πολλαπλές τάξεις μεγέθους. 

Έτσι, υπάρχουν αρκετά πρώιμα δεδομένα που υποδηλώνουν ότι λαμβάνει χώρα τεράστιος μετασχηματισμός. Αυτό που δεν γνωρίζουμε, και αυτό που έχει γίνει πλέον το κρίσιμο ερώτημα, είναι: Πού σε αυτή την αγορά θα συσσωρευτεί η αξία;

Τον τελευταίο χρόνο, συναντηθήκαμε με δεκάδες ιδρυτές και χειριστές startup σε μεγάλες εταιρείες που ασχολούνται απευθείας με την γενετική τεχνητή νοημοσύνη. Το έχουμε παρατηρήσει πωλητές υποδομής είναι πιθανώς οι μεγαλύτεροι νικητές σε αυτήν την αγορά μέχρι στιγμής, κερδίζοντας την πλειονότητα των δολαρίων που ρέουν μέσω της στοίβας. Εταιρείες εφαρμογών αυξάνονται πολύ γρήγορα τα έσοδά τους, αλλά συχνά παλεύουν με τη διατήρηση, τη διαφοροποίηση των προϊόντων και τα μεικτά περιθώρια κέρδους. Και οι περισσότεροι παρόχους μοντέλων, αν και ευθύνεται για την ίδια την ύπαρξη αυτής της αγοράς, δεν έχουν ακόμη αποκτήσει μεγάλη εμπορική κλίμακα.

Με άλλα λόγια, οι εταιρείες που δημιουργούν τη μεγαλύτερη αξία — π.χ. εκπαιδεύουν παραγωγικά μοντέλα τεχνητής νοημοσύνης και τα εφαρμόζουν σε νέες εφαρμογές — δεν έχουν αποτυπώσει το μεγαλύτερο μέρος της. Το να προβλέψεις τι θα συμβεί στη συνέχεια είναι πολύ πιο δύσκολο. Αλλά πιστεύουμε ότι το βασικό πράγμα που πρέπει να καταλάβουμε είναι ποια μέρη της στοίβας είναι πραγματικά διαφοροποιημένα και υπερασπιστικά. Αυτό θα έχει σημαντικό αντίκτυπο στη δομή της αγοράς (δηλαδή οριζόντια έναντι κάθετης ανάπτυξης της εταιρείας) και τους παράγοντες μακροπρόθεσμης αξίας (π.χ. περιθώρια κέρδους και διατήρηση). Μέχρι στιγμής, δυσκολευτήκαμε να βρούμε δομική υπεράσπιση οπουδήποτε στη στοίβα, εκτός των παραδοσιακών τάφρων για κατεστημένους.

Είμαστε απίστευτα αισιόδοξοι για τη γενετική τεχνητή νοημοσύνη και πιστεύουμε ότι θα έχει τεράστιο αντίκτυπο στη βιομηχανία λογισμικού και πέρα ​​από αυτήν. Ο στόχος αυτής της ανάρτησης είναι να χαρτογραφήσει τη δυναμική της αγοράς και να αρχίσει να απαντά στις ευρύτερες ερωτήσεις σχετικά με τα παραγωγικά επιχειρηματικά μοντέλα AI.

Στοίβα τεχνολογίας υψηλού επιπέδου: Υποδομή, μοντέλα και εφαρμογές

Για να κατανοήσουμε πώς διαμορφώνεται η αγορά παραγωγής τεχνητής νοημοσύνης, πρέπει πρώτα να καθορίσουμε πώς φαίνεται η στοίβα σήμερα. Εδώ είναι η προκαταρκτική μας άποψη.

Η στοίβα μπορεί να χωριστεί σε τρία επίπεδα:

  • Εφαρμογές που ενσωματώνουν παραγωγικά μοντέλα τεχνητής νοημοσύνης σε ένα προϊόν που αντιμετωπίζει ο χρήστης, είτε εκτελώντας τις δικές τους αγωγές μοντέλων ("εφαρμογές από άκρο σε άκρο") είτε βασιζόμενοι σε ένα API τρίτου μέρους
  • Μοντέλα που τροφοδοτούν τα προϊόντα τεχνητής νοημοσύνης, τα οποία διατίθενται είτε ως ιδιόκτητα API είτε ως σημεία ελέγχου ανοιχτού κώδικα (τα οποία, με τη σειρά τους, απαιτούν μια λύση φιλοξενίας)
  • Υποδομή προμηθευτές (π.χ. πλατφόρμες cloud και κατασκευαστές υλικού) που εκτελούν φόρτους εργασίας εκπαίδευσης και συμπερασμάτων για μοντέλα τεχνητής νοημοσύνης που δημιουργούνται

Είναι σημαντικό να σημειωθεί: Αυτό δεν είναι ένας χάρτης αγοράς, αλλά ένα πλαίσιο ανάλυσης της αγοράς. Σε κάθε κατηγορία, έχουμε παραθέσει μερικά παραδείγματα γνωστών προμηθευτών. Δεν έχουμε κάνει καμία προσπάθεια να είμαστε ολοκληρωμένοι ή να απαριθμήσουμε όλες τις καταπληκτικές εφαρμογές τεχνητής νοημοσύνης που έχουν κυκλοφορήσει. Επίσης, δεν εξετάζουμε τα εργαλεία Mlops ή LLMops, τα οποία δεν είναι ακόμη πολύ τυποποιημένα και θα εξεταστούν σε μελλοντική ανάρτηση.

Το πρώτο κύμα παραγωγικών εφαρμογών τεχνητής νοημοσύνης αρχίζει να φτάνει σε κλίμακα, αλλά παλεύει με τη διατήρηση και τη διαφοροποίηση

Σε προηγούμενους τεχνολογικούς κύκλους, η συμβατική σοφία ήταν ότι για να δημιουργήσετε μια μεγάλη, ανεξάρτητη εταιρεία, πρέπει να είστε κύριος του τελικού πελάτη — είτε αυτό σήμαινε μεμονωμένους καταναλωτές είτε αγοραστές B2B. Είναι δελεαστικό να πιστεύουμε ότι οι μεγαλύτερες εταιρείες παραγωγής τεχνητής νοημοσύνης θα είναι επίσης εφαρμογές τελικού χρήστη. Μέχρι στιγμής, δεν είναι ξεκάθαρο ότι συμβαίνει αυτό.

Βεβαίως, η ανάπτυξη των γενετικών εφαρμογών τεχνητής νοημοσύνης ήταν εκπληκτική, ωθούμενη από την απόλυτη καινοτομία και μια πληθώρα περιπτώσεων χρήσης. Στην πραγματικότητα, γνωρίζουμε τουλάχιστον τρεις κατηγορίες προϊόντων που έχουν ήδη ξεπεράσει τα 100 εκατομμύρια δολάρια ετήσιων εσόδων: δημιουργία εικόνων, copywriting και συγγραφή κώδικα.

Ωστόσο, η ανάπτυξη από μόνη της δεν αρκεί για τη δημιουργία εταιρειών ανθεκτικού λογισμικού. Ουσιαστικά, η ανάπτυξη πρέπει να είναι κερδοφόρα — με την έννοια ότι οι χρήστες και οι πελάτες, μόλις εγγραφούν, παράγουν κέρδη (υψηλά μικτά περιθώρια κέρδους) και παραμένουν για μεγάλο χρονικό διάστημα (υψηλή διατήρηση). Ελλείψει ισχυρής τεχνικής διαφοροποίησης, οι εφαρμογές B2B και B2C αυξάνουν τη μακροπρόθεσμη αξία των πελατών μέσω των αποτελεσμάτων δικτύου, της διατήρησης δεδομένων ή της δημιουργίας ολοένα και πιο περίπλοκων ροών εργασίας.

Στη γενετική τεχνητή νοημοσύνη, αυτές οι υποθέσεις δεν ισχύουν απαραίτητα. Σε όλες τις εταιρείες εφαρμογών με τις οποίες μιλήσαμε, υπάρχει ένα ευρύ φάσμα μικτών περιθωρίων κέρδους — έως και 90% σε λίγες περιπτώσεις, αλλά συχνότερα έως και 50-60%, που οφείλεται σε μεγάλο βαθμό στο κόστος συμπερασμάτων μοντέλων. Η ανάπτυξη της κορυφαίας διοχέτευσης ήταν εκπληκτική, αλλά δεν είναι σαφές εάν οι τρέχουσες στρατηγικές απόκτησης πελατών θα είναι επεκτάσιμες — ήδη βλέπουμε ότι η αποτελεσματικότητα της απόκτησης επί πληρωμή και η διατήρηση αρχίζουν να μειώνονται. Πολλές εφαρμογές είναι επίσης σχετικά αδιαφοροποίητες, καθώς βασίζονται σε παρόμοια υποκείμενα μοντέλα τεχνητής νοημοσύνης και δεν έχουν ανακαλύψει εμφανή εφέ δικτύου ή δεδομένα/ροές εργασίας, που είναι δύσκολο να αντιγράψουν οι ανταγωνιστές.

Επομένως, δεν είναι ακόμη προφανές ότι η πώληση εφαρμογών τελικού χρήστη είναι ο μόνος, ή ακόμα και ο καλύτερος, δρόμος για την οικοδόμηση μιας βιώσιμης παραγωγικής επιχείρησης τεχνητής νοημοσύνης. Τα περιθώρια θα πρέπει να βελτιώνονται καθώς αυξάνεται ο ανταγωνισμός και η αποτελεσματικότητα στα γλωσσικά μοντέλα (περισσότερα για αυτό παρακάτω). Η διατήρηση θα πρέπει να αυξηθεί καθώς οι τουρίστες τεχνητής νοημοσύνης εγκαταλείπουν την αγορά. Και υπάρχει ένα ισχυρό επιχείρημα ότι οι κάθετα ενσωματωμένες εφαρμογές έχουν ένα πλεονέκτημα στη διαφοροποίηση. Αλλά υπάρχουν πολλά ακόμα να αποδειχθούν.

Κοιτάζοντας το μέλλον, μερικά από τα μεγάλα ερωτήματα που αντιμετωπίζουν οι εταιρείες παραγωγής εφαρμογών τεχνητής νοημοσύνης περιλαμβάνουν:

  • Κάθετη ενοποίηση ("μοντέλο + εφαρμογή"). Η κατανάλωση μοντέλων AI ως υπηρεσία επιτρέπει στους προγραμματιστές εφαρμογών να επαναλαμβάνονται γρήγορα με μια μικρή ομάδα και να ανταλλάσσουν παρόχους μοντέλων καθώς προχωρά η τεχνολογία. Από την άλλη πλευρά, ορισμένοι προγραμματιστές υποστηρίζουν ότι το προϊόν is το μοντέλο, και ότι η εκπαίδευση από το μηδέν είναι ο μόνος τρόπος για να δημιουργηθεί υπεράσπιση — δηλαδή με συνεχή επανεκπαίδευση σε δεδομένα ιδιόκτητου προϊόντος. Αλλά έχει το κόστος πολύ υψηλότερων κεφαλαιακών απαιτήσεων και μιας λιγότερο ευκίνητης ομάδας προϊόντων.
  • Δόμηση λειτουργιών έναντι εφαρμογών. Τα προϊόντα γενετικής τεχνητής νοημοσύνης έχουν διάφορες μορφές: εφαρμογές για επιτραπέζιους υπολογιστές, εφαρμογές για κινητά, προσθήκες Figma/Photoshop, επεκτάσεις Chrome, ακόμη και bots Discord. Είναι εύκολο να ενσωματώσετε προϊόντα τεχνητής νοημοσύνης όπου οι χρήστες εργάζονται ήδη, καθώς η διεπαφή χρήστη είναι γενικά απλώς ένα πλαίσιο κειμένου. Ποιες από αυτές θα γίνουν αυτόνομες εταιρείες — και ποιες θα απορροφηθούν από κατεστημένους φορείς, όπως η Microsoft ή η Google, που ήδη ενσωματώνουν την τεχνητή νοημοσύνη στις σειρές προϊόντων τους;
  • Διαχείριση μέσω του κύκλου της διαφημιστικής εκστρατείας. Δεν είναι ακόμη σαφές εάν η ανατροπή είναι εγγενής στην τρέχουσα παρτίδα παραγωγικών προϊόντων τεχνητής νοημοσύνης ή αν είναι τεχνούργημα μιας πρώιμης αγοράς. Ή εάν το κύμα ενδιαφέροντος για τη γενετική τεχνητή νοημοσύνη θα πέσει καθώς η διαφημιστική εκστρατεία υποχωρεί. Αυτές οι ερωτήσεις έχουν σημαντικές επιπτώσεις για τις εταιρείες εφαρμογών, συμπεριλαμβανομένου του πότε πρέπει να πατήσετε το πεντάλ του γκαζιού για τη συγκέντρωση χρημάτων. πόσο επιθετικά να επενδύσεις στην απόκτηση πελατών ποια τμήματα χρηστών να δώσουν προτεραιότητα· και πότε πρέπει να δηλώσετε ότι το προϊόν ταιριάζει στην αγορά.

Οι πάροχοι μοντέλων εφηύραν τη γενετική τεχνητή νοημοσύνη, αλλά δεν έχουν φτάσει σε μεγάλη εμπορική κλίμακα

Αυτό που τώρα αποκαλούμε γενετική τεχνητή νοημοσύνη δεν θα υπήρχε χωρίς το λαμπρό ερευνητικό και μηχανολογικό έργο που έγινε σε μέρη όπως το Google, το OpenAI και το Stability. Μέσω καινοτόμων αρχιτεκτονικών μοντέλων και ηρωικών προσπαθειών για την κλιμάκωση των αγωγών εκπαίδευσης, όλοι επωφελούμαστε από τις εντυπωσιακές δυνατότητες των τρεχόντων μοντέλων μεγάλων γλωσσών (LLM) και μοντέλων δημιουργίας εικόνων.

Ωστόσο, τα έσοδα που σχετίζονται με αυτές τις εταιρείες εξακολουθούν να είναι σχετικά μικρά σε σύγκριση με τη χρήση και το buzz. Στη δημιουργία εικόνων, το Stable Diffusion γνώρισε εκρηκτική ανάπτυξη της κοινότητας, που υποστηρίζεται από ένα οικοσύστημα διεπαφών χρήστη, φιλοξενούμενων προσφορών και μεθόδων βελτιστοποίησης. Ωστόσο, η Stability παρέχει δωρεάν τα κύρια σημεία ελέγχου ως βασικό δόγμα της επιχείρησής τους. Στα μοντέλα φυσικής γλώσσας, το OpenAI κυριαρχεί με GPT-3/3.5 και ChatGPT. Αλλά σχετικά Λίγες εφαρμογές δολοφονίας που έχουν δημιουργηθεί στο OpenAI υπάρχουν μέχρι στιγμής και οι τιμές έχουν ήδη έπεσε μια φορά.

Αυτό μπορεί να είναι απλώς ένα προσωρινό φαινόμενο. Η Stability είναι μια νέα εταιρεία που δεν έχει επικεντρωθεί ακόμη στη δημιουργία εσόδων. Το OpenAI έχει τη δυνατότητα να γίνει μια τεράστια επιχείρηση, κερδίζοντας ένα σημαντικό μέρος των εσόδων της κατηγορίας NLP καθώς δημιουργούνται περισσότερες εφαρμογές δολοφονίας — ειδικά εάν ενσωμάτωση στο χαρτοφυλάκιο προϊόντων της Microsoft πηγαίνει ομαλά. Δεδομένης της τεράστιας χρήσης αυτών των μοντέλων, τα έσοδα μεγάλης κλίμακας μπορεί να μην είναι πολύ πίσω.

Υπάρχουν όμως και αντισταθμιστικές δυνάμεις. Τα μοντέλα που κυκλοφορούν ως ανοιχτού κώδικα μπορούν να φιλοξενηθούν από οποιονδήποτε, συμπεριλαμβανομένων εξωτερικών εταιρειών που δεν επιβαρύνονται με το κόστος που σχετίζεται με την εκπαίδευση μοντέλων μεγάλης κλίμακας (έως δεκάδες ή εκατοντάδες εκατομμύρια δολάρια). Και δεν είναι σαφές εάν κάποια μοντέλα κλειστού κώδικα μπορούν να διατηρήσουν το πλεονέκτημά τους επ' αόριστον. Για παράδειγμα, αρχίζουμε να βλέπουμε τα LLM που κατασκευάζονται από εταιρείες όπως η Anthropic, η Cohere και η Character.ai να έρχονται πιο κοντά στα επίπεδα απόδοσης OpenAI, εκπαιδευμένα σε παρόμοια σύνολα δεδομένων (π.χ. το διαδίκτυο) και με παρόμοιες αρχιτεκτονικές μοντέλων. Το παράδειγμα της Σταθερής Διάχυσης υποδηλώνει ότι if Τα μοντέλα ανοιχτού κώδικα φτάνουν σε επαρκές επίπεδο απόδοσης και υποστήριξης από την κοινότητα, τότε οι ιδιόκτητες εναλλακτικές μπορεί να δυσκολεύονται να ανταγωνιστούν.

Ίσως η πιο ξεκάθαρη λύση για τους παρόχους μοντέλων, μέχρι στιγμής, είναι ότι η εμπορευματοποίηση είναι πιθανό να συνδέεται με τη φιλοξενία. Η ζήτηση για ιδιόκτητα API (π.χ. από το OpenAI) αυξάνεται ραγδαία. Οι υπηρεσίες φιλοξενίας για μοντέλα ανοιχτού κώδικα (π.χ. Hugging Face και Replicate) αναδεικνύονται ως χρήσιμοι κόμβοι για εύκολη κοινή χρήση και ενσωμάτωση μοντέλων — και μάλιστα έχουν κάποια έμμεσα αποτελέσματα δικτύου μεταξύ των παραγωγών μοντέλων και των καταναλωτών. Υπάρχει επίσης μια ισχυρή υπόθεση ότι είναι δυνατή η δημιουργία εσόδων μέσω συμφωνιών τελειοποίησης και φιλοξενίας με εταιρικούς πελάτες.

Πέρα από αυτό, ωστόσο, υπάρχουν πολλά μεγάλα ερωτήματα που αντιμετωπίζουν οι πάροχοι μοντέλων:

  • Εμπορευματοποίηση. Υπάρχει μια κοινή πεποίθηση ότι τα μοντέλα AI θα συγκλίνουν ως προς την απόδοση με την πάροδο του χρόνου. Μιλώντας με προγραμματιστές εφαρμογών, είναι σαφές ότι αυτό δεν έχει συμβεί ακόμα, με ισχυρούς ηγέτες τόσο σε μοντέλα κειμένου όσο και σε μοντέλα εικόνας. Τα πλεονεκτήματά τους δεν βασίζονται σε μοναδικές αρχιτεκτονικές μοντέλων, αλλά σε υψηλές κεφαλαιακές απαιτήσεις, ιδιόκτητα δεδομένα αλληλεπίδρασης προϊόντων και σπάνιο ταλέντο τεχνητής νοημοσύνης. Θα χρησιμεύσει ως διαρκές πλεονέκτημα;
  • Κίνδυνος αποφοίτησης. Η εμπιστοσύνη σε παρόχους μοντέλων είναι ένας πολύ καλός τρόπος για τις εταιρείες εφαρμογών να ξεκινήσουν, ακόμη και να αναπτύξουν τις επιχειρήσεις τους. Αλλά υπάρχει κίνητρο για να δημιουργήσουν και/ή να φιλοξενήσουν τα δικά τους μοντέλα μόλις φτάσουν σε κλίμακα. Και πολλοί πάροχοι μοντέλων έχουν πολύ λοξές διανομές πελατών, με μερικές εφαρμογές να αντιπροσωπεύουν το μεγαλύτερο μέρος των εσόδων. Τι συμβαίνει εάν/όταν αυτοί οι πελάτες στραφούν στην εσωτερική ανάπτυξη τεχνητής νοημοσύνης;
  • Είναι σημαντικά τα χρήματα; Η υπόσχεση για τη δημιουργία τεχνητής νοημοσύνης είναι τόσο μεγάλη - και επίσης δυνητικά τόσο επιβλαβής - που πολλοί πάροχοι μοντέλων έχουν οργανωθεί ως κοινωφελείς εταιρείες (B corps), έχουν εκδώσει μετοχές κερδοφορίας με ανώτατο όριο ή έχουν ενσωματώσει ρητά το δημόσιο καλό στην αποστολή τους. Αυτό δεν εμπόδισε καθόλου τις προσπάθειές τους για συγκέντρωση κεφαλαίων. Αλλά υπάρχει μια λογική συζήτηση που πρέπει να γίνει σχετικά με το εάν πράγματι οι περισσότεροι πάροχοι μοντέλων θέλω να συλλάβουν αξία, και αν θα έπρεπε.

Οι πωλητές υποδομής αγγίζουν τα πάντα και καρπώνονται τα οφέλη

Σχεδόν τα πάντα στη γενετική τεχνητή νοημοσύνη περνούν από μια GPU (ή TPU) που φιλοξενείται σε σύννεφο κάποια στιγμή. Είτε πρόκειται για παρόχους μοντέλων / ερευνητικά εργαστήρια που εκτελούν φόρτο εργασίας εκπαίδευσης, για εταιρείες φιλοξενίας που εκτελούν συμπερασματικά/λεπτομέρεια, είτε για εταιρείες εφαρμογών που κάνουν κάποιο συνδυασμό και των δύο — ΠΑΓΚΟΣ είναι η ψυχή της γενετικής τεχνητής νοημοσύνης. Για πρώτη φορά μετά από πολύ μεγάλο χρονικό διάστημα, η πρόοδος στην πιο ενοχλητική τεχνολογία υπολογιστών είναι μαζικά υπολογιστική.

Ως αποτέλεσμα, πολλά από τα χρήματα στην αγορά παραγωγής τεχνητής νοημοσύνης ρέουν τελικά σε εταιρείες υποδομής. Για να βάλω μερικά πολύ χονδροειδείς αριθμοί γύρω από αυτό: Υπολογίζουμε ότι, κατά μέσο όρο, οι εταιρείες εφαρμογών ξοδεύουν περίπου το 20-40% των εσόδων σε συμπεράσματα και τελειοποίηση ανά πελάτη. Αυτό συνήθως καταβάλλεται είτε απευθείας σε παρόχους cloud για περιπτώσεις υπολογιστών είτε σε τρίτους παρόχους μοντέλων — οι οποίοι, με τη σειρά τους, ξοδεύουν περίπου το ήμισυ των εσόδων τους σε υποδομές cloud. Έτσι, είναι λογικό να υποθέσουμε ότι το 10-20% του τα συνολικά έσοδα στο Generative AI σήμερα πηγαίνει στους παρόχους cloud.

Επιπλέον, οι νεοφυείς επιχειρήσεις που εκπαιδεύουν τα δικά τους μοντέλα έχουν συγκεντρώσει δισεκατομμύρια δολάρια σε επιχειρηματικά κεφάλαια - η πλειοψηφία των οποίων (έως και 80-90% στους πρώτους γύρους) συνήθως δαπανάται επίσης στους παρόχους cloud. Πολλές δημόσιες εταιρείες τεχνολογίας ξοδεύουν εκατοντάδες εκατομμύρια ετησίως για εκπαίδευση μοντέλων, είτε με εξωτερικούς παρόχους cloud είτε απευθείας με κατασκευαστές υλικού.

Αυτό θα ονομάζαμε, με τεχνικούς όρους, «πολλά χρήματα» — ειδικά για μια νέα αγορά. Το μεγαλύτερο μέρος του ξοδεύεται στο Big 3 clouds: Amazon Web Services (AWS), Google Cloud Platform (GCP) και Microsoft Azure. Αυτοί οι πάροχοι cloud συλλογικά ξοδεύουν περισσότερα από $ 100 δισεκατομμύρια ετησίως σε capex για να διασφαλίσουν ότι διαθέτουν τις πιο ολοκληρωμένες, αξιόπιστες και ανταγωνιστικές πλατφόρμες από πλευράς κόστους. Ειδικότερα, στη γενετική τεχνητή νοημοσύνη, επωφελούνται επίσης από περιορισμούς εφοδιασμού επειδή έχουν προτιμησιακή πρόσβαση σε σπάνιο υλικό (π.χ. GPU Nvidia A100 και H100).

Είναι ενδιαφέρον, ωστόσο, ότι αρχίζουμε να βλέπουμε να αναδύεται αξιόπιστος ανταγωνισμός. Οι αμφισβητίες όπως η Oracle έχουν κάνει εισβολές με μεγάλες δαπάνες κεφαλαίου και κίνητρα πωλήσεων. Και μερικές νεοφυείς επιχειρήσεις, όπως η Coreweave και η Lambda Labs, έχουν αναπτυχθεί γρήγορα με λύσεις που απευθύνονται ειδικά σε μεγάλους προγραμματιστές μοντέλων. Ανταγωνίζονται στο κόστος, τη διαθεσιμότητα και την εξατομικευμένη υποστήριξη. Εκθέτουν επίσης πιο λεπτομερείς αφαιρέσεις πόρων (δηλ. κοντέινερ), ενώ τα μεγάλα σύννεφα προσφέρουν μόνο παρουσίες VM λόγω των ορίων εικονικοποίησης GPU.

Στα παρασκήνια, η εκτέλεση της συντριπτικής πλειονότητας των φόρτων εργασίας τεχνητής νοημοσύνης, είναι ίσως ο μεγαλύτερος νικητής στη γενετική τεχνητή νοημοσύνη μέχρι στιγμής: η Nvidia. Η εταιρία ανέφερε 3.8 δολάρια δισεκατομμύριο των εσόδων GPU του κέντρου δεδομένων κατά το τρίτο τρίμηνο του οικονομικού έτους 2023, συμπεριλαμβανομένου ενός σημαντικού τμήματος για περιπτώσεις χρήσης γενετικής τεχνητής νοημοσύνης. Και έχουν δημιουργήσει ισχυρές τάφρους γύρω από αυτήν την επιχείρηση μέσω δεκαετιών επενδύσεων στην αρχιτεκτονική GPU, ένα ισχυρό οικοσύστημα λογισμικού και βαθιά χρήση στην ακαδημαϊκή κοινότητα. Μια πρόσφατη ανάλυση διαπίστωσε ότι οι GPU της Nvidia αναφέρονται σε ερευνητικές εργασίες 90 φορές περισσότερες από τις κορυφαίες εκκινήσεις τσιπ AI μαζί.

Υπάρχουν και άλλες επιλογές υλικού, συμπεριλαμβανομένων των μονάδων επεξεργασίας τανυστή Google (TPU). GPU AMD Instinct. Τσιπ AWS Inferentia και Trainium. και επιταχυντές τεχνητής νοημοσύνης από νεοφυείς επιχειρήσεις όπως η Cerebras, η Sambanova και η Graphcore. Η Intel, αργά στο παιχνίδι, εισέρχεται επίσης στην αγορά με τα high-end τσιπ Habana και τις GPU Ponte Vecchio. Ωστόσο, μέχρι στιγμής, λίγες από αυτές τις νέες μάρκες έχουν λάβει σημαντικό μερίδιο αγοράς. Οι δύο εξαιρέσεις που πρέπει να παρακολουθήσετε είναι η Google, της οποίας οι TPU έχουν κερδίσει έλξη στην κοινότητα Stable Diffusion και σε ορισμένες μεγάλες συμφωνίες GCP, και η TSMC, η οποία πιστεύεται ότι κατασκευάζει όλοι από τα τσιπ που αναφέρονται εδώ, συμπεριλαμβανομένων των GPU της Nvidia (η Intel χρησιμοποιεί ένα μείγμα των δικών της fabs και TSMC για να φτιάξει τα τσιπ της).

Η υποδομή είναι, με άλλα λόγια, ένα προσοδοφόρο, ανθεκτικό και φαινομενικά υπερασπίσιμο στρώμα στη στοίβα. Τα μεγάλα ερωτήματα που πρέπει να απαντηθούν για τις εταιρείες υποδομής περιλαμβάνουν:

  • Διατήρηση φόρτου εργασίας ανιθαγενών. Οι GPU της Nvidia είναι ίδιες όπου κι αν τις νοικιάσετε. Οι περισσότεροι φόρτοι εργασίας τεχνητής νοημοσύνης είναι ανύπαρκτοι, με την έννοια ότι το συμπέρασμα μοντέλου δεν απαιτεί συνημμένες βάσεις δεδομένων ή αποθήκευση (εκτός από τα ίδια τα βάρη του μοντέλου). Αυτό σημαίνει ότι οι φόρτοι εργασίας τεχνητής νοημοσύνης μπορεί να είναι πιο φορητοί στα σύννεφα από τους παραδοσιακούς φόρτους εργασίας εφαρμογών. Πώς, σε αυτό το πλαίσιο, μπορούν οι πάροχοι cloud να δημιουργήσουν σταθερότητα και να αποτρέψουν τους πελάτες από το να μεταβούν στη φθηνότερη επιλογή;
  • Επιβίωση από το τέλος της έλλειψης τσιπ. Η τιμολόγηση για τους παρόχους cloud, και για την ίδια τη Nvidia, υποστηρίζεται από σπάνιες προμήθειες των πιο επιθυμητών GPU. Ένας πάροχος μας είπε ότι η τιμή καταλόγου για τα A100 έχει στην πραγματικότητα αυξημένη από την κυκλοφορία, κάτι που είναι εξαιρετικά ασυνήθιστο για το υπολογιστικό υλικό. Όταν τελικά αυτός ο περιορισμός εφοδιασμού αφαιρεθεί, μέσω της αυξημένης παραγωγής ή/και της υιοθέτησης νέων πλατφορμών υλικού, πώς θα επηρεάσει αυτό τους παρόχους cloud;
  • Μπορεί ένα σύννεφο αμφισβητίας να διαρρεύσει; Το πιστεύουμε σθεναρά κάθετα σύννεφα θα πάρει μερίδιο αγοράς από το Big 3 με πιο εξειδικευμένες προσφορές. Στην τεχνητή νοημοσύνη μέχρι στιγμής, οι αμφισβητίες έχουν δημιουργήσει ουσιαστική έλξη μέσω της μέτριας τεχνικής διαφοροποίησης και της υποστήριξης της Nvidia — για την οποία οι κατεστημένοι πάροχοι cloud είναι τόσο οι μεγαλύτεροι πελάτες όσο και αναδυόμενοι ανταγωνιστές. Το μακροπρόθεσμο ερώτημα είναι, θα είναι αυτό αρκετό για να ξεπεραστούν τα πλεονεκτήματα κλίμακας του Big 3;

Λοιπόν… πού θα συσσωρευτεί η αξία;

Φυσικά, δεν ξέρουμε ακόμα. Αλλά με βάση τα πρώιμα δεδομένα που έχουμε για τη γενετική τεχνητή νοημοσύνη, σε συνδυασμό με η εμπειρία μας με παλαιότερες εταιρείες AI/ML, η διαίσθησή μας είναι η εξής. 

Δεν φαίνεται, σήμερα, να υπάρχουν συστημικές τάφροι στη γενετική τεχνητή νοημοσύνη. Ως προσέγγιση πρώτης τάξης, οι εφαρμογές στερούνται ισχυρής διαφοροποίησης προϊόντων επειδή χρησιμοποιούν παρόμοια μοντέλα. Τα μοντέλα αντιμετωπίζουν ασαφή μακροπρόθεσμη διαφοροποίηση επειδή εκπαιδεύονται σε παρόμοια σύνολα δεδομένων με παρόμοιες αρχιτεκτονικές. Οι πάροχοι cloud δεν διαθέτουν βαθιά τεχνική διαφοροποίηση επειδή τρέχουν τις ίδιες GPU. και ακόμη και οι εταιρείες υλικού κατασκευάζουν τα τσιπ τους στα ίδια εργοστάσια.

Υπάρχουν, φυσικά, οι τυπικές τάφροι: τάφροι κλίμακας («Έχω ή μπορώ να συγκεντρώσω περισσότερα χρήματα από εσάς!»), τάφροι εφοδιαστικής αλυσίδας («Εγώ έχω τις GPU, εσείς όχι!»), Τάφροι οικοσυστήματος (« Όλοι χρησιμοποιούν ήδη το λογισμικό μου!»), αλγοριθμικές τάφροι («Είμαστε πιο έξυπνοι από εσάς!»), τάφροι διανομής («Έχω ήδη ομάδα πωλήσεων και περισσότερους πελάτες από εσάς!») και τάφροι διοχέτευσης δεδομένων («Εγώ» έχω ανιχνεύσει περισσότερο στο Διαδίκτυο από εσάς!»). Αλλά καμία από αυτές τις τάφρους δεν τείνει να είναι ανθεκτική μακροπρόθεσμα. Και είναι πολύ νωρίς για να πούμε εάν ισχυρά, άμεσα εφέ δικτύου επικρατούν σε οποιοδήποτε επίπεδο της στοίβας.

Με βάση τα διαθέσιμα δεδομένα, δεν είναι απλώς σαφές εάν θα υπάρξει μια μακροπρόθεσμη, δυναμική που θα κερδίζει τα πάντα στη γενετική τεχνητή νοημοσύνη.

Αυτό είναι περίεργο. Αλλά για εμάς, είναι καλά νέα. Το δυνητικό μέγεθος αυτής της αγοράς είναι δύσκολο να κατανοηθεί — κάπου μεταξύ όλο το λογισμικό και όλες οι ανθρώπινες προσπάθειες — έτσι περιμένουμε πολλούς, πολλούς παίκτες και υγιή ανταγωνισμό σε όλα τα επίπεδα της στοίβας. Αναμένουμε επίσης να πετύχουν τόσο οι οριζόντιες όσο και οι κάθετες εταιρείες, με την καλύτερη προσέγγιση που υπαγορεύεται από τις τελικές αγορές και τους τελικούς χρήστες. Για παράδειγμα, εάν η κύρια διαφοροποίηση στο τελικό προϊόν είναι η ίδια η τεχνητή νοημοσύνη, είναι πιθανό η καθετοποίηση (δηλαδή η στενή σύζευξη της εφαρμογής που βλέπει ο χρήστης με το εγχώριο μοντέλο) να κερδίσει. Ενώ αν η τεχνητή νοημοσύνη είναι μέρος ενός μεγαλύτερου συνόλου χαρακτηριστικών με μακριά ουρά, τότε είναι πιο πιθανό να συμβεί οριζόντια. Φυσικά, θα πρέπει επίσης να δούμε την κατασκευή πιο παραδοσιακών τάφρων με την πάροδο του χρόνου — και μπορεί να δούμε ακόμη και νέους τύπους τάφρων να επικρατούν.

Όποια και αν είναι η περίπτωση, ένα πράγμα για το οποίο είμαστε σίγουροι είναι ότι η γενετική τεχνητή νοημοσύνη αλλάζει το παιχνίδι. Όλοι μαθαίνουμε τους κανόνες σε πραγματικό χρόνο, υπάρχει μια τεράστια αξία που θα ξεκλειδωθεί και το τεχνολογικό τοπίο θα φαίνεται πολύ, πολύ διαφορετικό ως αποτέλεσμα. Και είμαστε εδώ για αυτό!

Όλες οι εικόνες σε αυτήν την ανάρτηση δημιουργήθηκαν χρησιμοποιώντας το Midjourney.

Σφραγίδα ώρας:

Περισσότερα από Andreessen Horowitz