Сфера искусственного интеллекта продолжает развиваться благодаря новым моделям встраивания OpenAI. Они призваны пересмотреть подход разработчиков к обработке естественного языка. Прежде чем изучить две революционные модели, каждая из которых предназначена для расширения возможностей приложений искусственного интеллекта, вот что вложения имею в виду:
Текстовые встраивания OpenAI служат метрикой для измерения корреляции между текстовыми строками и поиска приложений в различных областях, в том числе:
- Поиск: используется для ранжирования результатов на основе их релевантности заданной строке запроса, что повышает точность результатов поиска.
- Кластеризация: используется для группировки текстовых строк на основе их сходства, что упрощает организацию связанной информации.
- Рекомендации: применяется в системах рекомендаций для предложения элементов, имеющих общие черты в текстовых строках, что повышает персонализацию предложений.
- Обнаружение аномалий: используется для выявления выбросов с минимальной связью, помогая обнаружить нерегулярные закономерности или точки данных.
- Измерение разнообразия: используется для анализа распределения сходства, что позволяет оценить разнообразие в наборах данных или текстовых корпусах.
- классификация: используется в задачах классификации, где текстовые строки классифицируются в соответствии с наиболее похожими метками, что упрощает процесс маркировки в приложениях машинного обучения.
Теперь вы готовы изучить новые модели встраивания OpenAI!
Поступили новые модели встраивания OpenAI
Внедрение новых моделей внедрения OpenAI знаменует собой значительный скачок в обработке естественного языка, позволяя разработчикам лучше представлять и понимать текстовый контент. Давайте углубимся в детали этих инновационных моделей: встраивание текста-3-маленький и встраивание текста-3-большой.
встраивание текста-3-маленький
Эта компактная, но мощная модель демонстрирует заметный прирост производительности по сравнению со своей предшественницей, text-embedding-ada-002. По тесту многоязычного поиска (MIRACL) средний балл вырос с 31.4% до впечатляющих 44.0%. Аналогичным образом, в тесте заданий по английскому языку (MTEB) средний балл увеличился с 61.0% до 62.3%. Однако отличием text-embedding-3-small является не только повышенная производительность, но и доступность.
Оценочный тест | Ада v2 | встраивание текста-3-маленький | встраивание текста-3-большой |
ЧУДО среднее | 31.4 | 44.0 | 54.9 |
среднее значение МТБ | 61.0 | 62.3 | 64.6 |
OpenAI значительно снизила цену, сделав ее в 5 раз более рентабельной по сравнению с text-embedding-ada-002, при этом цена за 1 тыс. токенов снизилась с 0.0001 до 0.00002 доллара США. Это делает text-embedding-3-small не только более эффективным выбором, но и более доступным для разработчиков.
встраивание текста-3-большой
Представляя следующее поколение моделей внедрения, text-embedding-3-large обеспечивает существенное увеличение размеров, поддерживая встраивания до 3072 измерений. Эта более крупная модель обеспечивает более детальное и детальное представление текстового контента. С точки зрения производительности text-embedding-3-large превосходит своего предшественника по всем тестам. Средний балл MIRACL вырос с 31.4% до впечатляющих 54.9%, что подчеркивает его мастерство в многоязычном поиске.
Ада v2 | встраивание текста-3-маленький | встраивание текста-3-большой | ||||
Размер встраивания | 1536 | 512 | 1536 | 256 | 1024 | 3072 |
Средний балл MTEB | 61.0 | 61.6 | 62.3 | 62.0 | 64.1 | 64.6 |
Аналогичным образом, по MTEB средний балл вырос с 61.0% до 64.6%, что свидетельствует о превосходстве ребенка в задачах по английскому языку. Text-embedding-0.00013-large при цене 1 доллара США за 3 тыс. токенов обеспечивает баланс между превосходной производительностью и экономической эффективностью, предлагая разработчикам надежное решение для приложений, требующих многомерного внедрения.
Встречайте Google Люмьер ИИ, двоюродный брат Барда, видеомейкер.
Встроенная поддержка сокращения вложений
Признавая разнообразные потребности разработчиков, OpenAI представляет встроенную поддержку сокращения вложений. Этот инновационный метод позволяет разработчикам настраивать размер встраивания, регулируя параметр API «Размеры». Поступая таким образом, разработчики могут пожертвовать некоторой производительностью ради меньшего размера вектора, не ставя под угрозу фундаментальные свойства встраивания. Эта гибкость особенно ценна в сценариях, где системы поддерживают встраивания только до определенного размера, предоставляя разработчикам универсальный инструмент для различных сценариев использования.
Подводя итог, можно сказать, что новые модели внедрения OpenAI представляют собой значительный шаг вперед в области эффективности, доступности и производительности. Независимо от того, выбирают ли разработчики компактное, но эффективное представление text-embedding-3-small или более обширное и детальное внедрение text-embedding-3-large, эти модели предоставляют разработчикам универсальные инструменты для извлечения более глубокой информации из текстовых данных в их ИИ. Приложения.
Для получения более подробной информации о новых моделях внедрения OpenAI нажмите здесь и получите официальное объявление.
Рекомендуемые изображения кредит: Levart_Photographer/Unsplash
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://dataconomy.com/2024/01/26/new-openai-embedding-models/
- :имеет
- :является
- :нет
- :куда
- $UP
- 1
- 31
- 54
- a
- О нас
- доступной
- По
- через
- регулировка
- достижения
- AI
- позволяет
- причислены
- an
- анализ
- и
- Объявление
- кроме
- API
- Приложения
- прикладной
- подхода
- МЫ
- искусственный
- искусственный интеллект
- AS
- оценки;
- At
- в среднем
- Баланс
- основанный
- до
- эталонный тест
- тесты
- Лучшая
- между
- Заблокировать
- повышение
- но
- by
- CAN
- возможности
- общественное питание
- определенный
- выбор
- классификация
- нажмите на
- Залез
- похвальный
- компактный
- сравненный
- компромат
- содержание
- продолжается
- Корреляция
- рентабельным
- кредит
- настроить
- данным
- точки данных
- Наборы данных
- более глубокий
- копаться
- требующий
- развернуть
- предназначенный
- подробный
- подробнее
- обнаружение
- Застройщик
- застройщиков
- размеры
- обнаружить
- распределения
- Разное
- Разнообразие
- приносит
- дело
- доменов
- каждый
- затрат
- эффективный
- ELEVATE
- вложения
- занятых
- расширение прав и возможностей
- позволяет
- Английский
- расширение
- повышение
- развивается
- Превосходство
- Экспонаты
- Больше
- Исследование
- обширный
- извлечение
- облегчающий
- обнаружение
- Трансформируемость
- Что касается
- вперед
- от
- фундаментальный
- калибр
- поколение
- получить
- данный
- новаторским
- Есть
- здесь
- High
- выделив
- Как
- Однако
- HTTPS
- определения
- изображение
- впечатляющий
- in
- В том числе
- Увеличение
- информация
- инновационный
- размышления
- Интеллекта
- в
- Представляет
- Введение
- IT
- пункты
- ЕГО
- JPG
- всего
- этикетка
- маркировка
- язык
- больше
- Leap
- изучение
- снижена
- машина
- обучение с помощью машины
- производитель
- ДЕЛАЕТ
- Создание
- макс-ширина
- значить
- метрический
- минимальный
- модель
- Модели
- БОЛЕЕ
- более эффективным
- самых
- родной
- натуральный
- Естественный язык
- Обработка естественного языка
- потребности
- Новые
- следующий
- Примечательно
- нюансы
- of
- предлагают
- предлагающий
- Официальный представитель в Грузии
- on
- ONE
- только
- OpenAI
- or
- организация
- Результаты
- за
- параметр
- особенно
- паттеранами
- для
- производительность
- воплощение
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- пунктов
- мощный
- Точность
- предшественник
- цена
- цены
- процесс
- обработка
- свойства
- приводит
- обеспечение
- доблесть
- ранг
- готовый
- область
- Рекомендация
- переопределить
- Цена снижена
- снижение
- Связанный
- актуальность
- представлять
- представление
- Итоги
- поиск
- надежный
- Сценарии
- Гол
- Поиск
- видел
- служить
- набор
- Наборы
- Поделиться
- демонстрации
- Showcasing
- значительный
- существенно
- аналогичный
- сходство
- Аналогичным образом
- Размер
- меньше
- So
- париться
- Решение
- некоторые
- Шаг
- упорядочение
- Забастовки
- строка
- существенный
- предлагать
- РЕЗЮМЕ
- поддержка
- поддержки
- хлынули
- системы
- ТАБЛИЦЫ
- задачи
- техника
- terms
- текст
- текстовый
- который
- Ассоциация
- их
- Эти
- они
- этой
- раз
- в
- Лексемы
- инструментом
- инструменты
- два
- понимать
- Применение
- использовать
- ценный
- различный
- разносторонний
- Видео
- Что
- будь то
- в
- без
- еще
- являетесь
- зефирнет