ChatGPT, вбудований у робота, Інтернет боїться кінця цивілізації

ChatGPT, вбудований у робота, Інтернет боїться кінця цивілізації

Вихідний вузол: 2611695

Команда аспірантів із Саудівської Аравії розробила новий інструмент на базі штучного інтелекту MiniGPT-4, який має подібні характеристики OpenAI ЧатGPT-4.

З ChatGPT був випущений у листопаді та став світовим хітом, розробники не зупинялися ні перед чим, щоб створити нові інструменти ШІ, які або конкурують із популярним чат-ботом, або доповнюють його.

MiniGPT-4, розроблений з використанням моделі ChatGPT, є лише останнім прикладом.

Читайте також: Білл Гейтс: ШІ-чат-боти можуть навчити дітей читати за 18 місяців

За оцінками Інструменти майбутнього, MiniGPT-4 здатний виконувати багато завдань, включаючи створення описів зображень і створення веб-сайтів.

«Цей інструмент здатний генерувати детальні описи зображень, створювати веб-сайти з рукописних чернеток, писати історії та вірші, натхненні зображеннями, забезпечувати вирішення проблем, показаних на зображеннях, і вчити користувачів готувати на основі фотографій їжі», — стверджує Future. Інструменти.

Під час випуску ChatGPT-4 було показано відео моделі, яка створює веб-сайт із ескізного зображення. Згідно з твітом автора Барсі, MiniGPT-4 має можливість зробити те саме. Єдина відмінність полягає в тому, що ChatGPT-4 наразі доступний не всім, тоді як MiniGPT-4 вже існує.

Розуміння MiniGPT

За оцінками Гакс, MiniGPT-4 використовує вдосконалений LLM під назвою Vicuna як декодер мови, який побудований на LLaMa та, як повідомляється, досягає 90% якості ChatGPT за оцінкою GPT-4.

Модель штучного інтелекту використала попередньо навчений компонент Bootstrapping Language Image Pre-training (BLIP-2) і додала один шар ін’єкції, щоб узгодити закодовані візуальні функції з мовною моделлю Vicuna, заморозивши всі інші візуальні та мовні компоненти.

Девід Уотсон каже, що MiniGPT легкий і його можна легко застосувати в ситуаціях реального часу, таких як чат-боти, віртуальні помічники та автоматизовані системи субтитрів до зображень.

Він також перераховує кілька можливих застосувань, які можуть бути гарним застосуванням для MiniGPT-4: створення систем субтитрів зображень, які потребують лише невеликих ресурсів; і опис зображення для людей із вадами зору з використанням аудіоопису, метод, який вимагатиме включення системи перетворення тексту в аудіо.

У той час як OpenAI підтвердили мультимодальні можливості GPT-4, вони ще не оприлюднили його можливості обробки зображень. MiniGPT-4 заповнює цю прогалину, обробляючи зображення разом із мовою за допомогою більш складного LLM.

Інструмент штучного інтелекту для дослідження

Експерти кажуть, що використовувана найсучасніша модель базової мови розроблена, щоб допомогти дослідникам просувати свою роботу в цьому конкретному сегменті ШІ.

З огляду на те, що OpenAI не розкрила багато інформації про архітектуру GPT-4, розмір моделі, апаратне забезпечення, навчальні обчислення, побудову набору даних або метод навчання, відкритий вихідний код MiniGPT-4 може виявитися особливо цінним для дослідників.

«Здатність MiniGPT обробляти зображення надає дослідникам нові можливості досліджувати взаємозв’язок між мовою та моделями бачення», — сказала Яна Кхара, автор статті для Аналітика Відхая.

«Пропонуючи меншу та більш доступну модель для роботи дослідників, MiniGPT-4 може стимулювати інновації та прогрес у технології ШІ.

«Крім того, основа моделі з відкритим кодом гарантує, що дослідницьке співтовариство може співпрацювати та ділитися своїми висновками для подальшого прогресу в цій галузі».

MiniGPT виводить підписи до зображень на новий рівень

Барсі, який опублікував у твіттері гілку з описом того, як MiniGPT-4 можна використовувати для спілкування із зображеннями, включив деякі з таких випадків:

Ремонт зламаних предметів

Завантаживши зображення зламаного предмета на платформу MiniGPT і запитавши, як ви можете виправити ситуацію на зображенні, чат-бот пояснить ситуацію на зображенні та запропонує шляхи вирішення виявлених проблем.

У твіт MiniGPT може легко визначити проблему, витік пральної машини, пояснюючи причини витоку, а також надаючи список рішень, які користувач може спробувати.

Написання реклами

В іншому твіт від Barsee у ланцюжку MiniGPT він включив сценарій, коли MiniGPT отримав зображення кухля, який користувач виготовляє та продає. Потім користувач просить чат-бота написати рекламу для продажу кухлів, що чат-бот належним чином робить.

Короткі вступи

Просто завантажте зображення фільму та попросіть MiniGPT дати вам короткий опис; потім він створить абзац вступу до фільму, про який йде мова. Як видно в твіт чат-бот MiniGPT розпізнає зображення з «Хрещеного батька» та пише заставку до фільму відповідно до вказівок.

З моменту запуску ChatGPT на ринку з’явилася незліченна кількість нових інструментів ШІ. Існує більше альтернатив відомому чат-боту, причому інші, як повідомляється, випереджають його Auto-GPT, який все ще викликає хвилю в спільноті ШІ. З такою швидкістю здається майже неминучим, що ми опинимося в незручному стані багатства штучного інтелекту практично для будь-якого людського завдання.

Часова мітка:

Більше від МетаНовини