Meta, AI 언어 모델 LLaMA 출시로 연구원 지원 및 ChatGPT 인수

Meta, AI 언어 모델 LLaMA 출시로 연구원 지원 및 ChatGPT 인수

소스 노드 : 1976707

Meta는 금요일에 생성 AI 경쟁이 뜨거워짐에 따라 인공 지능을 기반으로 한 새로운 언어 모델을 출시한다고 발표했다고 CEO Mark Zuckerberg가 금요일에 말했습니다. 새로운 언어 모델은 연구에 사용하기 위한 것이며 학술 연구원, 정부, 시민 사회 및 학술 단체, 산업 연구에서 사용할 수 있습니다.

LLaMA라고 하는 언어 모델은 텍스트와 대화를 생성하고 서면 자료를 요약하며 수학 정리나 단백질 구조 예측과 같은 복잡한 작업을 수행하도록 설계되었습니다. 안에 페이스 북 게시물, 메타는 다음과 같이 말했습니다.

“7B에서 65B 매개변수 범위의 기본 언어 모델 모음인 LLaMA를 소개합니다. 우리는 수조 개의 토큰으로 모델을 교육하고 독점 및 액세스할 수 없는 데이터 세트에 의존하지 않고 공개적으로 사용 가능한 데이터 세트를 독점적으로 사용하여 최첨단 모델을 교육할 수 있음을 보여줍니다. 특히, LLaMA-13B는 대부분의 벤치마크에서 GPT-3(175B)보다 성능이 우수하며, LLaMA-65B는 최상위 모델인 Chinchilla70B, PaLM-540B와 경쟁력이 있다. 우리는 모든 모델을 연구 커뮤니티에 공개합니다.”

또한 Twitter 게시물에서 Facebook AI Research Guillaume Lample의 연구 과학자는 다음과 같이 말했습니다.

“오늘 우리는 4B에서 7B 매개변수 범위의 65가지 기본 모델인 LLaMA를 출시합니다. LLaMA-13B는 대부분의 벤치마크에서 OPT 및 GPT-3 175B를 능가합니다. LLaMA-65B는 Chinchilla 70B 및 PaLM 540B와 경쟁할 수 있습니다.”

ChatGPT는 30년 2022월 XNUMX일에 출시된 후 인기가 급상승했습니다. OpenAI의 AI 기반 챗봇은 시 쓰기, 자세한 예를 통해 코딩 실수 수정, AI 아트 프롬프트 생성에 이르기까지 거의 모든 작업을 수행할 수 있습니다. 버블 정렬 알고리즘의 최악의 경우 시간 복잡도를 설명할 수도 있습니다.

ChatGPT는 단 두 달 만에 100월에 20억 명의 월간 활성 사용자를 달성하여 역사상 가장 빠르게 성장하는 소비자 애플리케이션이 되었습니다. 지난 주, 이 회사는 인기 있는 AI 기반 챗봇에 대한 월 XNUMX달러 파일럿 구독 플랜인 ChatGPT Plus를 출시한다고 발표했습니다. ChatGPT의 갑작스러운 성공은 Google, Baidu 및 Alibaba를 포함한 다른 기술 회사에 더 많은 압력을 가했습니다.

ChatGPT는 대규모 언어 모델의 GPT-3 제품군을 위한 대화 기반 AI 채팅 인터페이스입니다. 놀라운 ChatGPT는 GPT-3(Generative Pre-trained Transformer 3)의 후속 제품으로 딥 러닝을 사용하여 인간과 유사한 텍스트를 생성하는 자동 회귀 언어 모델입니다.

ChatGPT는 GPT-3.5 모델에서 채택되었지만 더 많은 대화식 답변을 제공하도록 훈련되었습니다. 그러나 GPT-3와 달리 새로운 ChatGPT는 사용자와의 대화에 참여하고, 소프트웨어 코드를 작성하고, 스토리를 전달하고, 복잡한 수학 방정식에 대한 솔루션을 제공하는 기능을 포함하여 일련의 새로운 기능을 보여줍니다. 이 모든 것의 장점은 바로 여기에서 직접 새로운 챗봇을 테스트할 수 있다는 것입니다.

아래에서 LLaMA 백서의 PDF 사본을 다운로드할 수 있습니다.

333078981_693988129081760_4712707815225756708_n

타임 스탬프 :

더보기 테크스타트업