ChatGPT embutido em robô, Internet teme o fim da civilização

ChatGPT embutido em robô, Internet teme o fim da civilização

Nó Fonte: 2611695

Uma equipe de pesquisadores estudantes de doutorado da Arábia Saudita desenvolveu uma nova ferramenta baseada em IA, MiniGPT-4, que tem atributos semelhantes aos OpenAI's Bate-papoGPT-4.

Como ChatGPT foi lançado em novembro e se tornou um sucesso global, os desenvolvedores não pararam por nada para criar novas ferramentas de IA que rivalizam com o popular chatbot ou o complementam.

O MiniGPT-4, desenvolvido usando o modelo ChatGPT, é apenas o exemplo mais recente.

Veja também: Bill Gates: AI Chatbots podem ensinar crianças a ler em 18 meses

De acordo com o Ferramentas Futuras, O MiniGPT-4 é capaz de realizar muitas tarefas, incluindo geração de descrições de imagens e criação de sites.

“Essa ferramenta é capaz de gerar descrições detalhadas de imagens, criar sites a partir de rascunhos manuscritos, escrever histórias e poemas inspirados em determinadas imagens, fornecer soluções para problemas mostrados em imagens e ensinar aos usuários como cozinhar com base em fotos de alimentos”, afirma Future Ferramentas.

Quando o ChatGPT-4 foi lançado, foi exibido um vídeo do modelo construindo um site a partir de uma imagem de esboço. De acordo com um tweet de Barsee, O MiniGPT-4 tem a capacidade de realizar o mesmo feito. A única diferença é que o ChatGPT-4 não está disponível para todos no momento, enquanto o MiniGPT-4 já está disponível.

Entendendo o MiniGPT

De acordo com o Ghacks, o MiniGPT-4 usa um LLM avançado chamado Vicuna como decodificador de linguagem, que é construído sobre o LLaMa e atinge 90% da qualidade do ChatGPT conforme avaliado pelo GPT-4.

O modelo de IA usou o componente pré-treinado do Bootstrapping Language Image Pre-training (BLIP-2) e adicionou uma única camada de injeção para alinhar os recursos visuais codificados com o modelo de linguagem Vicuna, congelando todos os outros componentes de visão e linguagem.

David Watson diz que o MiniGPT é leve e pode ser facilmente implementado em situações em tempo real, como chatbots, assistentes virtuais e sistemas automatizados de legenda de imagens.

Ele também lista algumas possíveis aplicações que podem ser um bom uso para o MiniGPT-4: criação de sistemas de legendagem de imagens que requerem apenas recursos leves; e descrição de imagens para deficientes visuais usando descrição de áudio, um método que exigiria a inclusão de um sistema de texto para áudio.

Enquanto OpenAI confirmaram as capacidades multimodais do GPT-4, eles ainda não lançaram suas habilidades de processamento de imagem. O MiniGPT-4 preenche essa lacuna processando imagens junto com a linguagem usando um LLM mais sofisticado.

Uma ferramenta de IA para auxiliar na pesquisa

Especialistas dizem que o modelo de linguagem fundamental de última geração usado é projetado para ajudar os pesquisadores a avançar seu trabalho neste segmento específico de IA.

Dado que o OpenAI não divulgou muitas informações sobre a arquitetura, tamanho do modelo, hardware, computação de treinamento, construção do conjunto de dados ou método de treinamento do GPT-4, a natureza de código aberto do MiniGPT-4 pode ser particularmente valiosa para os pesquisadores.

“A capacidade do MiniGPT de processar imagens oferece aos pesquisadores novas oportunidades para investigar a relação entre a linguagem e os modelos de visão”, disse Yana Khara, escrevendo para Análise Vidhaya.

“Ao oferecer um modelo menor e mais acessível para os pesquisadores trabalharem, o MiniGPT-4 pode impulsionar a inovação e os avanços na tecnologia de IA.

“Além disso, a base de código aberto do modelo garante que a comunidade de pesquisa possa colaborar e compartilhar suas descobertas para promover o progresso no campo.”

O MiniGPT leva a legenda de imagens a outro nível

Barsee, que twittou um tópico descrevendo como o MiniGPT-4 pode ser usado para conversar com imagens, incluiu alguns dos seguintes casos:

Consertando itens quebrados

Ao fazer upload de uma foto de um item quebrado na plataforma MiniGPT e perguntar como você poderia corrigir a situação na imagem, o chatbot explicará a situação na imagem e sugerirá maneiras de corrigir os problemas identificados.

No tweet O MiniGPT pode identificar facilmente o problema, uma máquina de lavar com vazamento, explicando as razões pelas quais o vazamento pode acontecer e também fornecendo uma lista de soluções que o usuário pode tentar.

Escrever anúncios

Noutra tweet de Barsee no tópico do MiniGPT, ele incluiu um cenário em que o MiniGPT recebeu a foto de uma caneca que o usuário faz e vende. O usuário então pede ao chatbot para escrever um anúncio para comercializar as canecas, o que o chatbot faz devidamente.

Apresentações curtas

Basta carregar uma imagem de um filme e pedir ao MiniGPT para lhe dar uma breve introdução; ele então produzirá uma introdução de parágrafo do filme em questão. Como visto no tweet o chatbot MiniGPT reconhece a imagem de “O Poderoso Chefão” e escreve uma introdução do filme conforme as instruções.

O mercado viu inúmeras novas ferramentas de IA desenvolvidas desde o lançamento do ChatGPT. Existem mais alternativas para o famoso chatbot com outros supostamente superando-o, pelo menos Auto-GPT, que ainda está fazendo sucesso na comunidade de IA. Nesse ritmo, parece quase inevitável que acabemos com um embaraço de riquezas de IA para praticamente qualquer tarefa humana.

Carimbo de hora:

Mais de MetaNotícias