Что предлагают новые модели внедрения OpenAI?

Что предлагают новые модели внедрения OpenAI?

Исходный узел: 3084949

Сфера искусственного интеллекта продолжает развиваться благодаря новым моделям встраивания OpenAI. Они призваны пересмотреть подход разработчиков к обработке естественного языка. Прежде чем изучить две революционные модели, каждая из которых предназначена для расширения возможностей приложений искусственного интеллекта, вот что вложения имею в виду:

Текстовые встраивания OpenAI служат метрикой для измерения корреляции между текстовыми строками и поиска приложений в различных областях, в том числе:

  • Поиск: используется для ранжирования результатов на основе их релевантности заданной строке запроса, что повышает точность результатов поиска.
  • Кластеризация: используется для группировки текстовых строк на основе их сходства, что упрощает организацию связанной информации.
  • Рекомендации: применяется в системах рекомендаций для предложения элементов, имеющих общие черты в текстовых строках, что повышает персонализацию предложений.
  • Обнаружение аномалий: используется для выявления выбросов с минимальной связью, помогая обнаружить нерегулярные закономерности или точки данных.
  • Измерение разнообразия: используется для анализа распределения сходства, что позволяет оценить разнообразие в наборах данных или текстовых корпусах.
  • классификация: используется в задачах классификации, где текстовые строки классифицируются в соответствии с наиболее похожими метками, что упрощает процесс маркировки в приложениях машинного обучения.

Теперь вы готовы изучить новые модели встраивания OpenAI!

Поступили новые модели встраивания OpenAI

Внедрение новых моделей внедрения OpenAI знаменует собой значительный скачок в обработке естественного языка, позволяя разработчикам лучше представлять и понимать текстовый контент. Давайте углубимся в детали этих инновационных моделей: встраивание текста-3-маленький и встраивание текста-3-большой.

Откройте для себя новые модели встраивания OpenAI — text-embedding-3-small и text-embedding-3-large — улучшенную доступность, производительность и многое другое!
Новые модели внедрения OpenAI, text-embedding-3-small и text-embedding-3-large, демонстрируют значительные достижения в обработке естественного языка, удовлетворяя разнообразные потребности разработчиков (Кредит изображения)

встраивание текста-3-маленький

Эта компактная, но мощная модель демонстрирует заметный прирост производительности по сравнению со своей предшественницей, text-embedding-ada-002. По тесту многоязычного поиска (MIRACL) средний балл вырос с 31.4% до впечатляющих 44.0%. Аналогичным образом, в тесте заданий по английскому языку (MTEB) средний балл увеличился с 61.0% до 62.3%. Однако отличием text-embedding-3-small является не только повышенная производительность, но и доступность.

Оценочный тест Ада v2 встраивание текста-3-маленький встраивание текста-3-большой
ЧУДО среднее 31.4 44.0 54.9
среднее значение МТБ 61.0 62.3 64.6

OpenAI значительно снизила цену, сделав ее в 5 раз более рентабельной по сравнению с text-embedding-ada-002, при этом цена за 1 тыс. токенов снизилась с 0.0001 до 0.00002 доллара США. Это делает text-embedding-3-small не только более эффективным выбором, но и более доступным для разработчиков.

встраивание текста-3-большой

Представляя следующее поколение моделей внедрения, text-embedding-3-large обеспечивает существенное увеличение размеров, поддерживая встраивания до 3072 измерений. Эта более крупная модель обеспечивает более детальное и детальное представление текстового контента. С точки зрения производительности text-embedding-3-large превосходит своего предшественника по всем тестам. Средний балл MIRACL вырос с 31.4% до впечатляющих 54.9%, что подчеркивает его мастерство в многоязычном поиске.

Ада v2 встраивание текста-3-маленький встраивание текста-3-большой
Размер встраивания 1536 512 1536 256 1024 3072
Средний балл MTEB 61.0 61.6 62.3 62.0 64.1 64.6

Аналогичным образом, по MTEB средний балл вырос с 61.0% до 64.6%, что свидетельствует о превосходстве ребенка в задачах по английскому языку. Text-embedding-0.00013-large при цене 1 доллара США за 3 тыс. токенов обеспечивает баланс между превосходной производительностью и экономической эффективностью, предлагая разработчикам надежное решение для приложений, требующих многомерного внедрения.


Встречайте Google Люмьер ИИ, двоюродный брат Барда, видеомейкер.


Встроенная поддержка сокращения вложений

Признавая разнообразные потребности разработчиков, OpenAI представляет встроенную поддержку сокращения вложений. Этот инновационный метод позволяет разработчикам настраивать размер встраивания, регулируя параметр API «Размеры». Поступая таким образом, разработчики могут пожертвовать некоторой производительностью ради меньшего размера вектора, не ставя под угрозу фундаментальные свойства встраивания. Эта гибкость особенно ценна в сценариях, где системы поддерживают встраивания только до определенного размера, предоставляя разработчикам универсальный инструмент для различных сценариев использования.

Откройте для себя новые модели встраивания OpenAI — text-embedding-3-small и text-embedding-3-large — улучшенную доступность, производительность и многое другое!
Доступность text-embedding-3-small подчеркивается пятикратным снижением цены по сравнению с его предшественником text-embedding-ada-5, что делает его экономически эффективным выбором для разработчиков (Кредит изображения)

Подводя итог, можно сказать, что новые модели внедрения OpenAI представляют собой значительный шаг вперед в области эффективности, доступности и производительности. Независимо от того, выбирают ли разработчики компактное, но эффективное представление text-embedding-3-small или более обширное и детальное внедрение text-embedding-3-large, эти модели предоставляют разработчикам универсальные инструменты для извлечения более глубокой информации из текстовых данных в их ИИ. Приложения.

Для получения более подробной информации о новых моделях внедрения OpenAI нажмите здесь и получите официальное объявление.

Рекомендуемые изображения кредит: Levart_Photographer/Unsplash

Отметка времени:

Больше от Датакономия