ChatGPT, встроенный в робота, Интернет опасается конца цивилизации

ChatGPT, встроенный в робота, Интернет опасается конца цивилизации

Исходный узел: 2611695

Группа аспирантов-исследователей из Саудовской Аравии разработала новый инструмент на базе ИИ MiniGPT-4, который имеет схожие характеристики с OpenAI-х ЧатGPT-4.

С ChatGPT был выпущен в ноябре и стал мировым хитом, разработчики не остановились ни перед чем, чтобы придумать новые инструменты искусственного интеллекта, которые либо конкурируют с популярным чат-ботом, либо дополняют его.

MiniGPT-4, разработанный с использованием модели ChatGPT, является лишь последним примером.

Читайте также: Билл Гейтс: Чат-боты с искусственным интеллектом могут научить детей читать за 18 месяцев

По Инструменты будущего, MiniGPT-4 способен выполнять множество задач, включая генерацию описаний изображений и создание веб-сайтов.

«Этот инструмент способен генерировать подробные описания изображений, создавать веб-сайты из рукописных черновиков, писать рассказы и стихи, вдохновленные данными изображениями, предлагать решения проблем, показанных на изображениях, и учить пользователей готовить на основе фотографий еды», — утверждает Future. Инструменты.

Когда ChatGPT-4 был выпущен, было показано видео модели, создающей веб-сайт из эскизного изображения. Согласно твиту Барси, MiniGPT-4 может проделать тот же подвиг. Разница лишь в том, что ChatGPT-4 в настоящее время доступен не всем, а MiniGPT-4 уже в дикой природе.

Понимание MiniGPT

По Ghacks, MiniGPT-4 использует расширенный LLM под названием Vicuna в качестве языкового декодера, который построен на LLaMa и, как сообщается, обеспечивает 90% качества ChatGPT по оценке GPT-4.

Модель искусственного интеллекта использовала предварительно обученный компонент предварительной подготовки языковых изображений начальной загрузки (BLIP-2) и добавила один слой инъекции для согласования закодированных визуальных функций с языковой моделью Vicuna путем замораживания всех других компонентов зрения и языка.

Дэвид Уотсон говорит, что MiniGPT легкий и может быть легко реализован в ситуациях реального времени, таких как чат-боты, виртуальные помощники и автоматизированные системы подписи к изображениям.

Он также перечисляет несколько возможных приложений, которые могут быть полезными для MiniGPT-4: создание систем подписей к изображениям, требующих лишь небольших ресурсов; и описание изображения для слабовидящих с использованием аудиоописания, метод, который потребует включения системы преобразования текста в аудио.

В то время как OpenAI подтвердили мультимодальные возможности GPT-4, они еще не выпустили его возможности обработки изображений. MiniGPT-4 заполняет этот пробел, обрабатывая изображения вместе с языком с использованием более сложного LLM.

Инструмент искусственного интеллекта для помощи в исследованиях

Эксперты говорят, что используемая современная базовая языковая модель предназначена для помощи исследователям в продвижении их работы в этом конкретном сегменте ИИ.

Учитывая, что OpenAI не раскрывает много информации об архитектуре GPT-4, размере модели, аппаратном обеспечении, обучающих вычислениях, построении набора данных или методе обучения, природа MiniGPT-4 с открытым исходным кодом может оказаться особенно ценной для исследователей.

«Способность MiniGPT обрабатывать изображения предоставляет исследователям новые возможности для изучения взаимосвязи между моделями языка и зрения», — сказала Яна Хара, пишущая для Аналитика Видхая.

«Предлагая исследователям более компактную и доступную модель, MiniGPT-4 может стимулировать инновации и достижения в области технологий искусственного интеллекта.

«Кроме того, открытый исходный код модели гарантирует, что исследовательское сообщество может сотрудничать и делиться своими выводами для дальнейшего прогресса в этой области».

MiniGPT выводит субтитры на новый уровень

Барси, который написал в Твиттере ветку, описывающую, как MiniGPT-4 можно использовать для чата с изображениями, включил некоторые из следующих случаев:

Исправление сломанных предметов

Загрузив изображение сломанного предмета на платформу MiniGPT и спросив, как можно исправить ситуацию на изображении, чат-бот объяснит ситуацию на изображении и предложит пути исправления выявленных проблем.

В чирикать, MiniGPT может легко идентифицировать проблему, протекающую стиральную машину, объясняя причины, по которым может произойти утечка, а также предоставляя список решений, которые пользователь может попробовать.

Написание рекламы

В другой твит от Барси в ветке MiniGPT он включил сценарий, в котором MiniGPT дали изображение кружки, которую пользователь делает и продает. Затем пользователь просит чат-бота написать рекламу для продажи кружек, что чат-бот должным образом делает.

Краткое введение

Просто загрузите изображение фильма и попросите MiniGPT дать вам краткое представление; затем он создаст введение абзаца к рассматриваемому фильму. Как видно в чирикать, чат-бот MiniGPT распознает изображение из «Крестного отца» и пишет вступление к фильму в соответствии с инструкциями.

С момента запуска ChatGPT на рынке появилось бесчисленное множество новых инструментов искусственного интеллекта. Есть больше альтернатив знаменитому чат-боту, и другие, как сообщается, опережают его, не в последнюю очередь. Авто-GPT, который до сих пор набирает обороты в сообществе ИИ. При таких темпах кажется почти неизбежным, что мы закончим смущением от богатства ИИ практически для любой человеческой задачи.

Отметка времени:

Больше от МетаНьюс