ChatGPT osadzony w robocie, Internet obawia się końca cywilizacji

ChatGPT osadzony w robocie, Internet obawia się końca cywilizacji

Węzeł źródłowy: 2611695

Zespół doktorantów z Arabii Saudyjskiej opracował nowe narzędzie oparte na sztucznej inteligencji, MiniGPT-4, które ma podobne cechy jak OpenAI's CzatGPT-4.

Ponieważ ChatGPT został wydany w listopadzie i stał się światowym hitem, programiści nie cofnęli się przed niczym, aby wymyślić nowe narzędzia AI, które albo rywalizują z popularnym chatbotem, albo go uzupełniają.

MiniGPT-4, opracowany przy użyciu modelu ChatGPT, to tylko najnowszy przykład.

Przeczytaj także: Bill Gates: Chatboty AI mogą nauczyć dzieci czytać w 18 miesięcy

Zgodnie z Narzędzia przyszłości, MiniGPT-4 może wykonywać wiele zadań, w tym generowanie opisów obrazów i tworzenie stron internetowych.

„To narzędzie jest w stanie generować szczegółowe opisy obrazów, tworzyć strony internetowe z odręcznych szkiców, pisać opowiadania i wiersze inspirowane danymi obrazami, dostarczać rozwiązania problemów pokazanych na obrazach i uczyć użytkowników, jak gotować na podstawie zdjęć jedzenia” — twierdzi Future Narzędzia.

Kiedy wypuszczono ChatGPT-4, pokazano wideo przedstawiające modelkę budującą stronę internetową ze szkicu. Według tweeta o Barsee, MiniGPT-4 ma możliwość wykonania tego samego wyczynu. Jedyna różnica polega na tym, że ChatGPT-4 nie jest obecnie dostępny dla wszystkich, podczas gdy MiniGPT-4 jest już na wolności.

Zrozumienie MiniGPT

Zgodnie z Ghacks, MiniGPT-4 używa zaawansowanego LLM o nazwie Vicuna jako dekodera języka, który jest zbudowany na LLaMa i według raportów osiąga 90% jakości ChatGPT według oceny GPT-4.

Model sztucznej inteligencji wykorzystał wstępnie wytrenowany komponent Bootstrapping Language Image Pre-training (BLIP-2) i dodał pojedynczą warstwę iniekcji, aby dopasować zakodowane funkcje wizualne do modelu języka Vicuna poprzez zamrożenie wszystkich innych komponentów wizyjnych i językowych.

Davida Watsona mówi, że MiniGPT jest lekki i można go łatwo wdrożyć w sytuacjach w czasie rzeczywistym, takich jak chatboty, wirtualni asystenci i zautomatyzowane systemy podpisów obrazów.

Wymienia również kilka możliwych zastosowań, które mogą być przydatne dla MiniGPT-4: tworzenie systemów napisów do obrazów, które wymagają jedynie lekkich zasobów; i opis obrazu dla osób niedowidzących za pomocą audiodeskrypcji, metody, która wymagałaby włączenia systemu text-to-audio.

Kompletujemy wszystkie dokumenty (wymagana jest kopia paszportu i XNUMX zdjęcia) potrzebne do OpenAI potwierdzili multimodalne możliwości GPT-4, nie udostępnili jeszcze swoich możliwości przetwarzania obrazu. MiniGPT-4 wypełnia tę lukę, przetwarzając obrazy wraz z językiem przy użyciu bardziej wyrafinowanego LLM.

Narzędzie AI wspomagające badania

Eksperci twierdzą, że zastosowany najnowocześniejszy model języka podstawowego został zaprojektowany, aby pomóc naukowcom w rozwijaniu ich pracy w tym konkretnym segmencie sztucznej inteligencji.

Biorąc pod uwagę, że OpenAI nie ujawniło zbyt wielu informacji na temat architektury GPT-4, rozmiaru modelu, sprzętu, mocy obliczeniowej szkolenia, konstrukcji zestawu danych czy metody szkolenia, otwartoźródłowy charakter MiniGPT-4 może okazać się szczególnie cenny dla badaczy.

„Zdolność MiniGPT do przetwarzania obrazów zapewnia naukowcom nowe możliwości badania relacji między modelami językowymi i wzrokowymi” — powiedziała Yana Khara, pisząc dla Analityk Vidhaya.

„Oferując mniejszy, bardziej dostępny model dla naukowców, MiniGPT-4 może napędzać innowacje i postęp w technologii sztucznej inteligencji.

„Ponadto, podstawa modelu typu open source gwarantuje, że społeczność naukowa może współpracować i dzielić się swoimi odkryciami w celu dalszego postępu w tej dziedzinie”.

MiniGPT przenosi napisy do obrazów na inny poziom

Barsee, który napisał na Twitterze wątek opisujący, w jaki sposób MiniGPT-4 może być używany do czatowania z obrazami, uwzględnił niektóre z następujących przypadków:

Naprawianie zepsutych przedmiotów

Przesyłając zdjęcie zepsutego przedmiotu na platformę MiniGPT i pytając, jak można naprawić sytuację na obrazie, chatbot wyjaśni sytuację na obrazie i zasugeruje sposoby rozwiązania zidentyfikowanych problemów.

W ćwierkać, MiniGPT może łatwo zidentyfikować problem, cieknącą pralkę, wyjaśniając przyczyny wycieku, a także dostarczając listę rozwiązań, które użytkownik może wypróbować.

Pisanie ogłoszeń

Winnym Tweet z Barsee w wątku MiniGPT zamieścił scenariusz, w którym MiniGPT otrzymało zdjęcie kubka, który użytkownik robi i sprzedaje. Następnie użytkownik prosi chatbota o napisanie reklamy promującej kubki, co chatbot należycie robi.

Krótkie wprowadzenie

Po prostu prześlij zdjęcie filmu i poproś MiniGPT o krótkie wprowadzenie; następnie stworzy akapit wprowadzający do danego filmu. Jak widać w ćwierkać, chatbot MiniGPT rozpoznaje obraz z filmu „Ojciec chrzestny” i zgodnie z instrukcją pisze wprowadzenie do filmu.

Od czasu uruchomienia ChatGPT na rynku pojawiły się niezliczone nowe narzędzia AI. Istnieje więcej alternatyw dla słynnego chatbota, a inne podobno go wyprzedzają Automatyczne GPT, która wciąż robi furorę w społeczności AI. W tym tempie wydaje się prawie nieuniknione, że skończymy z zawstydzeniem bogactwa AI dla praktycznie każdego ludzkiego zadania.

Znak czasu:

Więcej z MetaWiadomości