Meta để khởi chạy mô hình ngôn ngữ AI LLaMA để giúp các nhà nghiên cứu và tiếp nhận ChatGPT

Meta để khởi chạy mô hình ngôn ngữ AI LLaMA để giúp các nhà nghiên cứu và tiếp nhận ChatGPT

Nút nguồn: 1976707

Meta đã công bố vào thứ Sáu rằng họ sẽ phát hành một mô hình ngôn ngữ mới dựa trên trí tuệ nhân tạo khi cuộc đua AI tổng quát đang nóng lên, Giám đốc điều hành Mark Zuckerberg cho biết vào thứ Sáu. Mô hình ngôn ngữ mới nhằm mục đích sử dụng trong nghiên cứu và sẽ có sẵn cho các nhà nghiên cứu học thuật, chính phủ, xã hội dân sự và các tổ chức học thuật cũng như nghiên cứu ngành.

Mô hình ngôn ngữ, được gọi là LLaMA, được thiết kế để tạo văn bản và hội thoại, tóm tắt tài liệu bằng văn bản và thực hiện các tác vụ phức tạp như giải các định lý toán học hoặc dự đoán cấu trúc protein. trong một Đăng bài, Meta đã nói:

“Chúng tôi giới thiệu LLaMA, một bộ sưu tập các mô hình ngôn ngữ nền tảng có tham số từ 7B đến 65B. Chúng tôi đào tạo các mô hình của mình trên hàng nghìn tỷ mã thông báo và cho thấy rằng có thể đào tạo các mô hình tiên tiến nhất bằng cách sử dụng riêng các bộ dữ liệu có sẵn công khai mà không cần dùng đến các bộ dữ liệu độc quyền và không thể truy cập được. Đặc biệt, LLaMA-13B vượt trội so với GPT-3 (175B) trên hầu hết các điểm chuẩn và LLaMA-65B cạnh tranh với các mẫu tốt nhất, Chinchilla70B và PaLM-540B. Chúng tôi phát hành tất cả các mô hình của mình cho cộng đồng nghiên cứu.”

Cũng trong một bài đăng trên Twitter, Nhà khoa học nghiên cứu tại Facebook AI Research Guillaume Lample cho biết:

“Hôm nay chúng tôi phát hành LLaMA, 4 mô hình nền tảng có tham số từ 7B đến 65B. LLaMA-13B vượt trội so với OPT và GPT-3 175B trên hầu hết các điểm chuẩn. LLaMA-65B có khả năng cạnh tranh với Chinchilla 70B và PaLM 540B.”

ChatGPT đã tăng mức độ phổ biến sau khi phát hành vào ngày 30 tháng 2022 năm XNUMX. Chatbot hỗ trợ AI của OpenAI có thể làm hầu như mọi thứ, từ viết thơ và sửa lỗi mã hóa bằng các ví dụ chi tiết, đến tạo lời nhắc nghệ thuật AI. Nó thậm chí có thể giải thích độ phức tạp thời gian trong trường hợp xấu nhất của thuật toán sắp xếp bong bóng.

Chỉ trong hai tháng, ChatGPT đã đạt 100 triệu người dùng hoạt động hàng tháng vào tháng 20, khiến nó trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử. Tuần trước, công ty đã thông báo rằng họ sẽ ra mắt ChatGPT Plus, gói thuê bao thử nghiệm trị giá XNUMX đô la mỗi tháng cho chatbot phổ biến do AI cung cấp. Thành công bất ngờ của ChatGPT đã gây thêm áp lực lên các công ty công nghệ khác bao gồm Google, Baidu và Alibaba.

ChatGPT là giao diện trò chuyện AI dựa trên đối thoại dành cho dòng mô hình ngôn ngữ lớn GPT-3. ChatGPT gây chú ý là sự kế thừa của Generative Pre-training Transformer 3 (GPT-3), là một mô hình ngôn ngữ tự hồi quy sử dụng học sâu để tạo ra văn bản giống con người.

ChatGPT được điều chỉnh từ mô hình GPT-3.5 nhưng được đào tạo để cung cấp nhiều câu trả lời mang tính đàm thoại hơn. Tuy nhiên, không giống như GPT-3, ChatGPT mới thể hiện một loạt các khả năng mới bao gồm khả năng tham gia vào các cuộc trò chuyện với người dùng, viết mã phần mềm, kể chuyện và cung cấp giải pháp cho các phương trình toán học phức tạp. Điều thú vị là bạn có thể tự mình thử nghiệm chatbot mới ngay tại đây.

Bạn có thể tải xuống bản sao PDF của Báo cáo chính thức LLaMA bên dưới.

333078981_693988129081760_4712707815225756708_n

Dấu thời gian:

Thêm từ khởi nghiệp công nghệ