Команда аспірантів із Саудівської Аравії розробила новий інструмент на базі штучного інтелекту MiniGPT-4, який має подібні характеристики OpenAI ЧатGPT-4.
З ChatGPT був випущений у листопаді та став світовим хітом, розробники не зупинялися ні перед чим, щоб створити нові інструменти ШІ, які або конкурують із популярним чат-ботом, або доповнюють його.
MiniGPT-4, розроблений з використанням моделі ChatGPT, є лише останнім прикладом.
Читайте також: Білл Гейтс: ШІ-чат-боти можуть навчити дітей читати за 18 місяців
За оцінками Інструменти майбутнього, MiniGPT-4 здатний виконувати багато завдань, включаючи створення описів зображень і створення веб-сайтів.
«Цей інструмент здатний генерувати детальні описи зображень, створювати веб-сайти з рукописних чернеток, писати історії та вірші, натхненні зображеннями, забезпечувати вирішення проблем, показаних на зображеннях, і вчити користувачів готувати на основі фотографій їжі», — стверджує Future. Інструменти.
Під час випуску ChatGPT-4 було показано відео моделі, яка створює веб-сайт із ескізного зображення. Згідно з твітом автора Барсі, MiniGPT-4 має можливість зробити те саме. Єдина відмінність полягає в тому, що ChatGPT-4 наразі доступний не всім, тоді як MiniGPT-4 вже існує.
Розуміння MiniGPT
За оцінками Гакс, MiniGPT-4 використовує вдосконалений LLM під назвою Vicuna як декодер мови, який побудований на LLaMa та, як повідомляється, досягає 90% якості ChatGPT за оцінкою GPT-4.
Модель штучного інтелекту використала попередньо навчений компонент Bootstrapping Language Image Pre-training (BLIP-2) і додала один шар ін’єкції, щоб узгодити закодовані візуальні функції з мовною моделлю Vicuna, заморозивши всі інші візуальні та мовні компоненти.
Девід Уотсон каже, що MiniGPT легкий і його можна легко застосувати в ситуаціях реального часу, таких як чат-боти, віртуальні помічники та автоматизовані системи субтитрів до зображень.
Він також перераховує кілька можливих застосувань, які можуть бути гарним застосуванням для MiniGPT-4: створення систем субтитрів зображень, які потребують лише невеликих ресурсів; і опис зображення для людей із вадами зору з використанням аудіоопису, метод, який вимагатиме включення системи перетворення тексту в аудіо.
У той час як OpenAI підтвердили мультимодальні можливості GPT-4, вони ще не оприлюднили його можливості обробки зображень. MiniGPT-4 заповнює цю прогалину, обробляючи зображення разом із мовою за допомогою більш складного LLM.
Інструмент штучного інтелекту для дослідження
Експерти кажуть, що використовувана найсучасніша модель базової мови розроблена, щоб допомогти дослідникам просувати свою роботу в цьому конкретному сегменті ШІ.
З огляду на те, що OpenAI не розкрила багато інформації про архітектуру GPT-4, розмір моделі, апаратне забезпечення, навчальні обчислення, побудову набору даних або метод навчання, відкритий вихідний код MiniGPT-4 може виявитися особливо цінним для дослідників.
«Здатність MiniGPT обробляти зображення надає дослідникам нові можливості досліджувати взаємозв’язок між мовою та моделями бачення», — сказала Яна Кхара, автор статті для Аналітика Відхая.
«Пропонуючи меншу та більш доступну модель для роботи дослідників, MiniGPT-4 може стимулювати інновації та прогрес у технології ШІ.
«Крім того, основа моделі з відкритим кодом гарантує, що дослідницьке співтовариство може співпрацювати та ділитися своїми висновками для подальшого прогресу в цій галузі».
MiniGPT виводить підписи до зображень на новий рівень
Барсі, який опублікував у твіттері гілку з описом того, як MiniGPT-4 можна використовувати для спілкування із зображеннями, включив деякі з таких випадків:
Ремонт зламаних предметів
Завантаживши зображення зламаного предмета на платформу MiniGPT і запитавши, як ви можете виправити ситуацію на зображенні, чат-бот пояснить ситуацію на зображенні та запропонує шляхи вирішення виявлених проблем.
У твіт MiniGPT може легко визначити проблему, витік пральної машини, пояснюючи причини витоку, а також надаючи список рішень, які користувач може спробувати.
Написання реклами
В іншому твіт від Barsee у ланцюжку MiniGPT він включив сценарій, коли MiniGPT отримав зображення кухля, який користувач виготовляє та продає. Потім користувач просить чат-бота написати рекламу для продажу кухлів, що чат-бот належним чином робить.
Короткі вступи
Просто завантажте зображення фільму та попросіть MiniGPT дати вам короткий опис; потім він створить абзац вступу до фільму, про який йде мова. Як видно в твіт чат-бот MiniGPT розпізнає зображення з «Хрещеного батька» та пише заставку до фільму відповідно до вказівок.
З моменту запуску ChatGPT на ринку з’явилася незліченна кількість нових інструментів ШІ. Існує більше альтернатив відомому чат-боту, причому інші, як повідомляється, випереджають його Auto-GPT, який все ще викликає хвилю в спільноті ШІ. З такою швидкістю здається майже неминучим, що ми опинимося в незручному стані багатства штучного інтелекту практично для будь-якого людського завдання.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoAiStream. Web3 Data Intelligence. Розширення знань. Доступ тут.
- Карбування майбутнього з Адріенн Ешлі. Доступ тут.
- джерело: https://metanews.com/chatgpt-embedded-in-robot-internet-fears-end-of-civilization/
- : має
- :є
- : ні
- :де
- $UP
- 8
- a
- здібності
- здатність
- МЕНЮ
- доступною
- За
- Achieve
- доданий
- просунутий
- досягнення
- реклама
- AI
- Можливість
- Aid
- вирівнювати
- ВСІ
- пліч-о-пліч
- вже
- Також
- альтернативи
- an
- та
- Інший
- будь-який
- застосування
- архітектура
- ЕСТЬ
- AS
- At
- Атрибути
- аудіо
- Автоматизований
- доступний
- заснований
- BE
- стали
- між
- Зламаний
- Створюємо
- побудований
- by
- званий
- CAN
- можливості
- здатний
- випадків
- Chatbot
- chatbots
- ChatGPT
- діти
- претензій
- співпрацювати
- Приходити
- співтовариство
- Доповнення
- компонент
- Компоненти
- обчислення
- Підтверджено
- будівництво
- може
- створення
- description
- призначений
- докладно
- розвиненою
- розробників
- різниця
- робить
- управляти
- легко
- або
- вбудований
- кінець
- гарантує
- оцінюється
- все
- приклад
- Пояснювати
- пояснюючи
- знаменитий
- страх
- подвиг
- риси
- кілька
- поле
- виправляти
- після
- харчування
- для
- фонд
- заморожування
- від
- далі
- майбутнє
- розрив
- Гейтс
- породжує
- покоління
- Давати
- даний
- Глобальний
- добре
- траплятися
- апаратні засоби
- Мати
- he
- хіт
- Як
- How To
- HTTPS
- людина
- ідентифікований
- ідентифікувати
- зображення
- обробка зображень
- зображень
- реалізовані
- in
- включені
- У тому числі
- неминучий
- інформація
- інновація
- натхненний
- інтернет
- Вступ
- дослідити
- IT
- ЙОГО
- просто
- мова
- останній
- запущений
- шар
- витік
- легкий
- як
- список
- списки
- Лама
- машина
- РОБОТИ
- Робить
- багато
- ринок
- Може..
- метод
- модель
- Моделі
- більше
- фільм
- багато
- природа
- Нові
- нічого
- Листопад
- of
- від
- пропонує
- on
- тільки
- з відкритим вихідним кодом
- OpenAI
- Можливості
- or
- Інше
- інші
- приватність
- особливо
- фотографії
- картина
- платформа
- plato
- Інформація про дані Платона
- PlatoData
- популярний
- це можливо
- представити
- Проблема
- проблеми
- процес
- обробка
- виробляти
- прогрес
- Доведіть
- забезпечує
- забезпечення
- якість
- питання
- ставка
- Читати
- реального часу
- Причини
- визнає
- відносини
- звільнити
- випущений
- Повідомляється
- вимагати
- дослідження
- Дослідницьке співтовариство
- Дослідники
- ресурси
- Суперник
- робот
- Зазначений
- то ж
- Саудівська
- Саудівська Аравія
- говорить
- сценарій
- Здається,
- бачив
- сегмент
- Продає
- Поділитись
- Короткий
- показаний
- аналогічний
- з
- один
- ситуація
- ситуацій
- Розмір
- менше
- Рішення
- деякі
- складний
- впроваджений
- Як і раніше
- зупинений
- історії
- студент
- система
- Systems
- приймає
- Завдання
- завдання
- Навчання
- команда
- Технологія
- Що
- Команда
- їх
- потім
- Там.
- вони
- це
- до
- інструмент
- інструменти
- Навчання
- чірікать
- Завантаження
- на
- використання
- використовуваний
- користувач
- користувачі
- використання
- Цінний
- ВІКУНЬЯ
- Відео
- Віртуальний
- фактично
- бачення
- було
- хвилі
- способи
- веб-сайт
- веб-сайти
- який
- в той час як
- ВООЗ
- чому
- Wild
- волі
- з
- Work
- б
- запис
- лист
- ще
- ви
- YouTube
- зефірнет