Кому принадлежит платформа генеративного ИИ?

Кому принадлежит платформа генеративного ИИ?

Исходный узел: 1909271

Мы начинаем видеть самые ранние этапы появления технологического стека в генеративном искусственном интеллекте (ИИ). Сотни новых стартапов устремляются на рынок, чтобы разрабатывать базовые модели, создавать приложения на основе ИИ и создавать инфраструктуру/инструменты.

Многие популярные технологические тренды раздуваются задолго до того, как рынок успевает их догнать. Но бум генеративного ИИ сопровождался реальными успехами на реальных рынках и реальной поддержкой реальных компаний. Такие модели, как Stable Diffusion и ChatGPT, устанавливают исторические рекорды роста числа пользователей, а несколько приложений достигли годового дохода в 100 миллионов долларов менее чем через год после запуска. Параллельное сравнение показывает модели ИИ превосходящие людей в некоторых задачах на несколько порядков. 

Таким образом, есть достаточно ранних данных, чтобы предположить, что происходят массовые преобразования. Чего мы не знаем и что сейчас стало критическим вопросом, так это: Где на этом рынке будет накапливаться стоимость?

За последний год мы встретились с десятками основателей и операторов стартапов в крупных компаниях, которые занимаются непосредственно генеративным ИИ. Мы заметили, что поставщики инфраструктуры вероятно, являются крупнейшими победителями на этом рынке до сих пор, захватив большую часть долларов, протекающих через стек. Заявочные компании очень быстро увеличивают выручку, но часто испытывают трудности с удержанием клиентов, дифференциацией продуктов и валовой прибылью. И большинство поставщики моделей, хотя и ответственны за само существование этого рынка, еще не достигли больших коммерческих масштабов.

Другими словами, компании, создающие наибольшую ценность, т. е. обучающие модели генеративного ИИ и применяющие их в новых приложениях, не завладели большей частью этого. Предсказать, что будет дальше, намного сложнее. Но мы думаем, что главное понять, какие части стека действительно дифференцированы и защищены. Это окажет серьезное влияние на структуру рынка (т. е. горизонтальное или вертикальное развитие компании) и факторы долгосрочной стоимости (например, прибыль и удержание). До сих пор нам было трудно найти структурную защиту. откуда угодно в стеке, за пределами традиционных рвов для должностных лиц.

Мы невероятно оптимистичны в отношении генеративного ИИ и верим, что он окажет огромное влияние на индустрию программного обеспечения и не только. Цель этого поста — наметить динамику рынка и начать отвечать на более широкие вопросы о бизнес-моделях генеративного ИИ.

Стек технологий высокого уровня: инфраструктура, модели и приложения

Чтобы понять, как формируется рынок генеративного ИИ, нам сначала нужно определить, как сегодня выглядит стек. Вот наш предварительный вид.

Стек можно разделить на три слоя:

  • Приложения которые интегрируют генеративные модели искусственного интеллекта в ориентированный на пользователя продукт, либо запуская собственные конвейеры моделей («сквозные приложения»), либо полагаясь на сторонний API.
  • Модели которые поддерживают продукты AI, доступные либо в виде проприетарных API, либо в виде контрольных точек с открытым исходным кодом (для которых, в свою очередь, требуется решение для хостинга).
  • Инфраструктура поставщики (т. е. облачные платформы и производители оборудования), которые запускают рабочие нагрузки обучения и логических выводов для генеративных моделей ИИ.

Важно отметить: это не карта рынка, а основа для анализа рынка. В каждой категории мы перечислили несколько примеров известных поставщиков. Мы не пытались быть исчерпывающими или перечислять все потрясающие приложения для генеративного ИИ, которые были выпущены. Мы также не будем углубляться в инструменты MLops или LLMops, которые еще недостаточно стандартизированы и будут рассмотрены в следующем посте.

Первая волна генеративных приложений ИИ начинает масштабироваться, но испытывает трудности с удержанием и дифференциацией.

В предыдущих технологических циклах общепринятым мнением было то, что для создания крупной независимой компании вы должны владеть конечным потребителем — будь то отдельные потребители или покупатели B2B. Заманчиво полагать, что крупнейшие компании в области генеративного ИИ также будут приложениями для конечных пользователей. Пока не ясно, так ли это.

Несомненно, рост генеративных приложений ИИ был ошеломляющим, вызванным чистой новизной и множеством вариантов использования. На самом деле, нам известны как минимум три категории продуктов, годовой доход которых уже превысил 100 миллионов долларов: создание изображений, копирайтинг и написание кода.

Однако одного роста недостаточно для создания надежных компаний-разработчиков программного обеспечения. Крайне важно, чтобы рост был прибыльным — в том смысле, что пользователи и клиенты после регистрации получают прибыль (высокая валовая прибыль) и остаются на сайте в течение длительного времени (высокое удержание). В отсутствие сильной технической дифференциации приложения B2B и B2C обеспечивают долгосрочную ценность для клиентов за счет сетевых эффектов, хранения данных или построения все более сложных рабочих процессов.

В генеративном ИИ эти предположения не обязательно верны. У компаний-разработчиков приложений, с которыми мы общались, существует широкий диапазон валовой прибыли — в некоторых случаях до 90%, но чаще всего до 50-60%, что в основном обусловлено стоимостью вывода модели. Рост на вершине воронки был потрясающим, но неясно, будут ли масштабироваться текущие стратегии привлечения клиентов — мы уже видим, что эффективность платного привлечения и удержания начинают снижаться. Многие приложения также относительно однообразны, поскольку они основаны на аналогичных базовых моделях искусственного интеллекта и не обнаруживают очевидных сетевых эффектов или данных/рабочих процессов, которые конкурентам трудно воспроизвести.

Таким образом, пока не очевидно, что продажа приложений для конечных пользователей — единственный или даже лучший путь к созданию устойчивого генеративного ИИ-бизнеса. Маржа должна увеличиваться по мере роста конкуренции и эффективности языковых моделей (подробнее об этом ниже). Удержание должно увеличиваться по мере того, как ИИ-туристы покидают рынок. И есть веский аргумент в пользу того, что вертикально интегрированные приложения имеют преимущество в обеспечении дифференциации. Но многое еще предстоит доказать.

Забегая вперед, некоторые из важных вопросов, стоящих перед компаниями, занимающимися генеративным ИИ, включают:

  • Вертикальная интеграция («модель + приложение»). Использование моделей ИИ в качестве услуги позволяет разработчикам приложений быстро выполнять итерации с небольшой командой и менять поставщиков моделей по мере развития технологий. С другой стороны, некоторые разработчики утверждают, что продукт is модели, и что обучение с нуля — единственный способ создать защищенность, т. е. путем постоянного повторного обучения на данных о патентованном продукте. Но это происходит за счет гораздо более высоких требований к капиталу и менее гибкой команды разработчиков.
  • Создание функций против приложений. Продукты для генеративного ИИ бывают разных форм: настольные приложения, мобильные приложения, плагины Figma/Photoshop, расширения Chrome и даже боты Discord. Продукты ИИ легко интегрировать там, где пользователи уже работают, поскольку пользовательский интерфейс обычно представляет собой просто текстовое поле. Какие из них станут самостоятельными компаниями, а какие будут поглощены действующими лицами, такими как Microsoft или Google, которые уже внедряют ИИ в свои продуктовые линейки?
  • Управление циклом рекламы. Пока не ясно, является ли отток присущей текущей партии продуктов генеративного ИИ, или это артефакт раннего рынка. Или если всплеск интереса к генеративному ИИ спадет по мере того, как спадет ажиотаж. Эти вопросы имеют важное значение для компаний, производящих приложения, в том числе, когда нажимать на педаль газа при сборе средств; насколько агрессивно инвестировать в привлечение клиентов; каким сегментам пользователей отдать предпочтение; и когда объявить о соответствии продукта рынку.

Поставщики моделей изобрели генеративный ИИ, но не достигли больших коммерческих масштабов

То, что мы сейчас называем генеративным ИИ, не существовало бы без блестящих исследований и инженерной работы, проделанной в таких местах, как Google, OpenAI и Stability. Благодаря новым архитектурам моделей и героическим усилиям по масштабированию конвейеров обучения мы все извлекаем выгоду из умопомрачительных возможностей современных моделей больших языков (LLM) и моделей генерации изображений.

Тем не менее, доход, связанный с этими компаниями, по-прежнему относительно мал по сравнению с использованием и шумихой. При создании изображений Stable Diffusion продемонстрировал взрывной рост сообщества, поддерживаемый экосистемой пользовательских интерфейсов, размещенных предложений и методов тонкой настройки. Но Stability раздает свои основные контрольно-пропускные пункты бесплатно, что является основным принципом их бизнеса. В моделях естественного языка доминирует OpenAI с GPT-3/3.5 и ChatGPT. Но относительно На данный момент существует несколько «киллер-приложений», построенных на OpenAI, а цены уже снизились. упал один раз.

Это может быть просто временным явлением. Stability — это новая компания, которая еще не сосредоточилась на монетизации. OpenAI может стать массовым бизнесом, принося значительную часть всех доходов категории НЛП по мере того, как будет создаваться все больше «убойных» приложений, особенно если их интеграция в портфель продуктов Microsoft идет гладко. Учитывая широкое использование этих моделей, крупные доходы могут быть не за горами.

Но есть и противоборствующие силы. Модели, выпущенные с открытым исходным кодом, могут размещаться кем угодно, в том числе сторонними компаниями, которые не несут расходов, связанных с крупномасштабным обучением моделей (до десятков или сотен миллионов долларов). И неясно, могут ли какие-либо модели с закрытым исходным кодом сохранять свое преимущество неопределенно долгое время. Например, мы начинаем видеть, что LLM, созданные такими компаниями, как Anthropic, Cohere и Character.ai, приближаются к уровням производительности OpenAI, обучены на аналогичных наборах данных (например, в Интернете) и с аналогичными архитектурами моделей. Пример стабильной диффузии предполагает, что if Модели с открытым исходным кодом достигают достаточного уровня производительности и поддержки сообщества, тогда проприетарным альтернативам может быть трудно конкурировать.

Возможно, самый очевидный вывод для поставщиков моделей на сегодняшний день заключается в том, что коммерциализация, скорее всего, связана с хостингом. Спрос на проприетарные API (например, от OpenAI) быстро растет. Услуги хостинга для моделей с открытым исходным кодом (например, Hugging Face и Replicate) становятся полезными узлами для простого обмена и интеграции моделей — и даже имеют некоторые косвенные сетевые эффекты между производителями и потребителями моделей. Существует также сильная гипотеза о том, что монетизацию можно получить за счет тонкой настройки и заключения соглашений о хостинге с корпоративными клиентами.

Помимо этого, однако, есть ряд больших вопросов, стоящих перед поставщиками моделей:

  • Коммодитизация. Существует распространенное мнение, что модели ИИ со временем сравняются в производительности. Разговаривая с разработчиками приложений, становится ясно, что этого еще не произошло, с сильными лидерами как в текстовой, так и в графической модели. Их преимущества основаны не на уникальной архитектуре моделей, а на высоких требованиях к капиталу, проприетарных данных о взаимодействии продуктов и дефиците талантов ИИ. Послужит ли это долгосрочным преимуществом?
  • Выпускной риск. Использование поставщиков моделей — отличный способ для разработчиков приложений начать работу и даже расширить свой бизнес. Но у них есть стимул создавать и/или размещать свои собственные модели, как только они достигнут масштаба. И многие поставщики моделей имеют сильно перекошенные распределения клиентов, при этом несколько приложений приносят большую часть дохода. Что произойдет, если/когда эти клиенты перейдут на собственную разработку ИИ?
  • Деньги важны? Перспективы генеративного ИИ настолько велики — и потенциально настолько опасны — что многие поставщики моделей организовались как корпорации общественного блага (корпус B), выпустили доли прибыли с установленным пределом или иным образом явно включили общественное благо в свою миссию. Это нисколько не помешало их усилиям по сбору средств. Но есть разумная дискуссия о том, действительно ли большинство поставщиков моделей хотеть для захвата стоимости, и если они должны.

Поставщики инфраструктуры касаются всего и пожинают плоды

Почти все в генеративном ИИ в какой-то момент проходит через облачный графический процессор (или TPU). Будь то для поставщиков моделей / исследовательских лабораторий, выполняющих учебные нагрузки, хостинговых компаний, выполняющих вывод/тонкую настройку, или компаний-разработчиков приложений, выполняющих комбинацию того и другого — СНИЖЕНИЯ являются жизненной силой генеративного ИИ. Впервые за очень долгое время прогресс в самых прорывных вычислительных технологиях в значительной степени связан с вычислениями.

В результате большая часть денег на рынке генеративного ИИ в конечном итоге уходит в инфраструктурные компании. положить некоторые очень приблизительные цифры вокруг этого: по нашим оценкам, в среднем компании, производящие приложения, тратят около 20–40% дохода на выводы и тонкую настройку для каждого клиента. Обычно эта сумма выплачивается либо непосредственно облачным провайдерам за вычислительные экземпляры, либо сторонним поставщикам моделей, которые, в свою очередь, тратят около половины своего дохода на облачную инфраструктуру. Таким образом, разумно предположить, что 10-20% общий доход в генеративном ИИ сегодня переходит к облачным провайдерам.

Вдобавок к этому стартапы, обучающие свои собственные модели, привлекли миллиарды долларов венчурного капитала, большая часть которого (до 80-90% на ранних этапах) обычно также тратится на облачных провайдеров. Многие публичные технологические компании тратят сотни миллионов долларов в год на обучение моделям либо у внешних поставщиков облачных услуг, либо непосредственно у производителей оборудования.

Это то, что мы бы назвали техническими терминами «много денег» — особенно для зарождающегося рынка. Большая часть его тратится на Большой 3 облака: Amazon Web Services (AWS), Google Cloud Platform (GCP) и Microsoft Azure. Эти облачные провайдеры вместе тратить больше, чем $ 100 млрд. В год капиталовложений, чтобы обеспечить их наиболее полными, надежными и конкурентоспособными по стоимости платформами. В частности, в генеративном ИИ они также выигрывают от ограничений поставок, поскольку имеют преимущественный доступ к дефицитному оборудованию (например, к графическим процессорам Nvidia A100 и H100).

Интересно, однако, что мы начинаем видеть появление надежной конкуренции. Претенденты, такие как Oracle, добились успеха благодаря крупным капиталовложениям и стимулированию продаж. И несколько стартапов, таких как Coreweave и Lambda Labs, быстро выросли благодаря решениям, специально предназначенным для разработчиков крупных моделей. Они конкурируют по стоимости, доступности и персонализированной поддержке. Они также предоставляют более детализированные абстракции ресурсов (например, контейнеры), в то время как большие облака предлагают только экземпляры виртуальных машин из-за ограничений виртуализации GPU.

За кулисами, выполняя подавляющее большинство рабочих нагрузок ИИ, возможно, самый большой победитель в области генеративного ИИ: Nvidia. Компания сообщил $ 3.8 миллиард выручки от графических процессоров для центров обработки данных в третьем квартале 2023 финансового года, включая значимую часть для генеративных вариантов использования ИИ. И они построили прочные рвы вокруг этого бизнеса благодаря десятилетиям инвестиций в архитектуру графических процессоров, надежной программной экосистеме и широкому использованию в академическом сообществе. Один недавний анализ обнаружили, что графические процессоры Nvidia цитируются в исследовательских работах в 90 раз чаще, чем лучшие стартапы в области ИИ-чипов вместе взятые..

Существуют и другие аппаратные варианты, в том числе Google Tensor Processing Units (TPU); графические процессоры AMD Instinct; чипы AWS Inferentia и Trainium; и ускорители искусственного интеллекта от таких стартапов, как Cerebras, Sambanova и Graphcore. Intel, поздно вступившая в игру, также выходит на рынок со своими высокопроизводительными чипами Habana и графическими процессорами Ponte Vecchio. Но пока лишь немногие из этих новых чипов заняли значительную долю рынка. Двумя исключениями, на которые стоит обратить внимание, являются Google, чьи TPU завоевали популярность в сообществе Stable Diffusion и в некоторых крупных сделках GCP, и TSMC, которая, как считается, производит Найти чипов, перечисленных здесь, включая графические процессоры Nvidia (Intel использует сочетание своих собственных заводов и TSMC для производства своих чипов).

Другими словами, инфраструктура — это прибыльный, надежный и, казалось бы, защитный слой в стеке. Основные вопросы, на которые должны ответить инфраструктурные компании, включают:

  • Удержание рабочих нагрузок без сохранения состояния. Графические процессоры Nvidia одинаковы, где бы вы их ни арендовали. Большинство рабочих нагрузок ИИ не имеют состояния в том смысле, что вывод модели не требует подключенных баз данных или хранилища (кроме самих весов модели). Это означает, что рабочие нагрузки ИИ могут быть более переносимыми между облаками, чем рабочие нагрузки традиционных приложений. Как в этом контексте облачные провайдеры могут создать прилипчивость и помешать клиентам перейти к самому дешевому варианту?
  • Пережить конец дефицита чипов. Ценообразование для облачных провайдеров и для самой Nvidia поддерживалось дефицитными поставками наиболее востребованных графических процессоров. Один поставщик сказал нам, что прейскурантная цена на A100 на самом деле расширились с момента запуска, что очень необычно для вычислительного оборудования. Когда это ограничение поставок в конечном итоге будет снято за счет увеличения производства и/или внедрения новых аппаратных платформ, как это повлияет на поставщиков облачных услуг?
  • Может ли облако-претендент прорваться? Мы твердо верим, что вертикальные облака отнимет долю рынка у «большой тройки» благодаря более специализированным предложениям. До сих пор в области ИИ претенденты добивались значительного успеха за счет умеренной технической дифференциации и поддержки Nvidia, для которой действующие поставщики облачных услуг являются одновременно крупнейшими клиентами и новыми конкурентами. Долгосрочный вопрос заключается в том, будет ли этого достаточно, чтобы преодолеть преимущества масштаба Большой тройки?

Итак… где будет накапливаться ценность?

Конечно, мы еще не знаем. Но на основе имеющихся у нас ранних данных о генеративном ИИ в сочетании с наш опыт работы с более ранними компаниями AI/ML, наша интуиция такова. 

Сегодня в генеративном ИИ не наблюдается никаких системных рвов. В первом приближении приложениям не хватает сильной дифференциации продуктов, поскольку они используют схожие модели; модели сталкиваются с нечеткой долгосрочной дифференциацией, поскольку они обучаются на аналогичных наборах данных с аналогичной архитектурой; поставщикам облачных услуг не хватает глубокой технической дифференциации, поскольку они используют одни и те же графические процессоры; и даже производители аппаратного обеспечения производят свои чипы на одних и тех же фабриках.

Есть, конечно, и стандартные рвы: масштабные рвы («У меня есть или я могу собрать больше денег, чем у вас!»), рвы цепочки поставок («У меня есть GPU, а у вас нет!»), экосистемные рвы (« Все уже используют мое программное обеспечение!»), алгоритмические рвы («Мы умнее вас!»), рвы дистрибуции («У меня уже есть отдел продаж и больше клиентов, чем у вас!») и рвы конвейеров данных («Я' я изучил больше интернета, чем ты!»). Но ни один из этих рвов не может быть прочным в долгосрочной перспективе. И еще слишком рано говорить о том, проявляются ли сильные прямые сетевые эффекты на каком-либо уровне стека.

Основываясь на доступных данных, просто неясно, будет ли в генеративном ИИ долгосрочная динамика «победитель получает все».

Это странно. Но для нас это хорошая новость. Потенциальный размер этого рынка трудно понять — где-то между все программное обеспечение и все усилия человека — так что мы ожидаем много-много игроков и здоровую конкуренцию на всех уровнях стека. Мы также ожидаем успеха как горизонтальных, так и вертикальных компаний, при этом наилучший подход будет определяться конечными рынками и конечными пользователями. Например, если основным отличием конечного продукта является сам ИИ, вполне вероятно, что вертикализация (т.е. тесная связь пользовательского приложения с собственной моделью) победит. Принимая во внимание, что если ИИ является частью более крупного набора функций с длинным хвостом, то, скорее всего, произойдет горизонтализация. Конечно, мы также должны увидеть строительство более традиционных рвов с течением времени — и мы можем даже увидеть новые типы рвов.

Как бы то ни было, мы уверены в одном: генеративный ИИ меняет правила игры. Мы все изучаем правила в режиме реального времени, открывается огромное количество ценности, и в результате технический ландшафт будет выглядеть совсем по-другому. И мы здесь для этого!

Все изображения в этом посте были созданы с помощью Midjourney.

Отметка времени:

Больше от Andreessen Horowitz