로봇에 내장된 ChatGPT, 인터넷은 문명의 종말을 두려워합니다

로봇에 내장된 ChatGPT, 인터넷은 문명의 종말을 두려워합니다

소스 노드 : 2611695

사우디 아라비아의 박사 과정 학생 연구원 팀은 유사한 속성을 가진 새로운 AI 기반 도구인 MiniGPT-4를 개발했습니다. OpenAI 채팅GPT-4.

이후 ChatGPT XNUMX월에 출시되어 세계적인 히트작이 된 이후 개발자들은 인기 있는 챗봇에 필적하거나 이를 보완하는 새로운 AI 도구를 내놓기 위해 아무 노력도 하지 않았습니다.

ChatGPT 모델을 사용하여 개발된 MiniGPT-4가 가장 최근의 예입니다.

또한 읽기 : 빌 게이츠: AI 챗봇은 18개월 안에 아이들에게 읽기를 가르칠 수 있습니다.

에 따르면 미래의 도구, MiniGPT-4는 이미지 설명 생성 및 웹 사이트 구축을 포함한 많은 작업을 수행할 수 있습니다.

"이 도구는 상세한 이미지 설명을 생성하고, 손으로 쓴 초안으로 웹사이트를 만들고, 주어진 이미지에서 영감을 받아 이야기와 시를 쓰고, 이미지에 표시된 문제에 대한 솔루션을 제공하고, 사용자에게 음식 사진을 기반으로 요리하는 방법을 가르칠 수 있습니다."라고 Future는 주장합니다. 도구.

ChatGPT-4가 출시되었을 때 스케치 이미지에서 웹 사이트를 구축하는 모델의 비디오가 표시되었습니다. 의 트윗에 따르면 바시, MiniGPT-4는 동일한 기능을 수행할 수 있습니다. 유일한 차이점은 ChatGPT-4는 현재 모든 사람이 사용할 수 없지만 MiniGPT-4는 이미 널리 사용되고 있다는 것입니다.

MiniGPT 이해

에 따르면 Ghacks, MiniGPT-4는 Vicuna라는 고급 LLM을 언어 디코더로 사용합니다. 이 LLaMa는 LLaMa를 기반으로 하며 GPT-90에서 평가한 ChatGPT 품질의 4%를 달성하는 것으로 보고되었습니다.

AI 모델은 BLIP-2(Bootstrapping Language Image Pre-training)의 사전 훈련된 구성 요소를 사용했으며 다른 모든 비전 및 언어 구성 요소를 동결하여 인코딩된 시각적 기능을 Vicuna 언어 모델과 정렬하기 위해 단일 주입 계층을 추가했습니다.

데이비드 왓슨 MiniGPT는 가볍고 챗봇, 가상 비서 및 자동화된 이미지 캡션 시스템과 같은 실시간 상황에서 쉽게 구현할 수 있다고 말합니다.

그는 또한 MiniGPT-4를 잘 활용할 수 있는 몇 가지 가능한 응용 프로그램을 나열합니다. 오디오 설명을 사용하여 시각 장애인을 위한 이미지 설명, 텍스트-오디오 시스템을 포함하는 방법이 필요합니다.

DaVinci에는 OpenAI GPT-4의 다중 모드 기능을 확인했지만 아직 이미지 처리 기능을 공개하지 않았습니다. MiniGPT-4는 보다 정교한 LLM을 사용하여 언어와 함께 이미지를 처리하여 이러한 격차를 해소합니다.

연구를 지원하는 AI 도구

전문가들은 사용된 최첨단 기본 언어 모델이 이 특정 AI 부문에서 연구를 발전시키는 데 도움이 되도록 설계되었다고 말합니다.

OpenAI가 GPT-4의 아키텍처, 모델 크기, 하드웨어, 교육 컴퓨팅, 데이터 세트 구성 또는 교육 방법에 대한 많은 정보를 공개하지 않았다는 점을 감안할 때 MiniGPT-4의 오픈 소스 특성은 연구자들에게 특히 가치가 있을 수 있습니다.

"MiniGPT의 이미지 처리 능력은 연구자에게 언어와 시각 모델 사이의 관계를 조사할 수 있는 새로운 기회를 제공합니다."라고 Yana Khara는 말했습니다. 애널리틱스 비다야.

“연구자들이 작업할 수 있는 더 작고 접근하기 쉬운 모델을 제공함으로써 MiniGPT-4는 AI 기술의 혁신과 발전을 주도할 수 있습니다.

"또한 모델의 오픈 소스 기반은 연구 커뮤니티가 협력하고 연구 결과를 공유하여 해당 분야에서 더 발전할 수 있도록 합니다."

MiniGPT는 이미지 캡션을 다른 수준으로 끌어 올립니다.

바르시는 MiniGPT-4를 사용하여 이미지와 채팅하는 방법을 설명하는 스레드를 트윗했으며 다음 사례 중 일부를 포함했습니다.

깨진 아이템 고치기

파손된 물품의 사진을 MiniGPT 플랫폼에 업로드하고 이미지 속 상황을 어떻게 고칠 수 있는지 물어보면 챗봇이 이미지 속 상황을 설명하고 파악된 문제를 고칠 방법을 제안한다.

. 짹짹, MiniGPT는 세탁기 누수 문제를 쉽게 식별하고 누수가 발생할 수 있는 이유를 설명하고 사용자가 시도할 수 있는 솔루션 목록을 제공할 수 있습니다.

광고 작성

또 다른 Barsee의 트윗 MiniGPT 스레드에서 그는 사용자가 만들고 판매하는 머그 사진을 MiniGPT에 제공하는 시나리오를 포함했습니다. 그런 다음 사용자는 챗봇에게 머그를 마케팅하기 위한 광고를 작성하도록 요청하고 챗봇은 이를 정당하게 수행합니다.

짧은 소개

영화 사진을 업로드하고 MiniGPT에게 짧은 소개를 요청하기만 하면 됩니다. 그런 다음 해당 영화의 단락 소개를 생성합니다. 에서 볼 수 있듯이 짹짹, MiniGPT 챗봇은 '대부'의 이미지를 인식하고 지시에 따라 영화의 인트로를 작성합니다.

시장에서는 ChatGPT가 출시된 이후 수많은 새로운 AI 도구가 개발되었습니다. 유명한 챗봇에 대한 더 많은 대안이 있으며 다른 사람들이 이를 능가하는 것으로 알려졌습니다. 자동 GPT, 여전히 AI 커뮤니티에서 파도를 일으키고 있습니다. 이 속도로 거의 모든 인간 작업에 대한 AI의 부를 난처하게 만드는 것이 거의 불가피해 보입니다.

타임 스탬프 :

더보기 메타뉴스