Meta เปิดตัวโมเดลภาษา AI LLaMA เพื่อช่วยนักวิจัยและใช้งาน ChatGPT

Meta เปิดตัวโมเดลภาษา AI LLaMA เพื่อช่วยนักวิจัยและใช้งาน ChatGPT

โหนดต้นทาง: 1976707

Meta ประกาศเมื่อวันศุกร์ว่าจะเปิดตัวโมเดลภาษาใหม่ที่ใช้ปัญญาประดิษฐ์ในขณะที่การแข่งขัน AI กำเนิดร้อนขึ้น CEO Mark Zuckerberg กล่าวเมื่อวันศุกร์ รูปแบบภาษาใหม่นี้มีวัตถุประสงค์เพื่อใช้ในการวิจัยและจะพร้อมใช้งานสำหรับนักวิจัยทางวิชาการ รัฐบาล ภาคประชาสังคมและองค์กรทางวิชาการ และการวิจัยในอุตสาหกรรม

โมเดลภาษาที่เรียกว่า LLaMA ได้รับการออกแบบมาเพื่อสร้างข้อความและบทสนทนา สรุปเนื้อหาที่เป็นลายลักษณ์อักษร และทำงานที่ซับซ้อน เช่น การแก้ทฤษฎีบททางคณิตศาสตร์หรือการทำนายโครงสร้างโปรตีน ใน โพสต์ FacebookMeta กล่าวว่า:

“เราแนะนำ LLaMA ซึ่งเป็นคอลเลกชันของโมเดลภาษาพื้นฐานตั้งแต่พารามิเตอร์ 7B ถึง 65B เราฝึกโมเดลของเราบนโทเค็นหลายล้านล้านโทเค็น และแสดงให้เห็นว่าเป็นไปได้ที่จะฝึกโมเดลที่ทันสมัยโดยใช้ชุดข้อมูลที่เปิดเผยต่อสาธารณะโดยเฉพาะ โดยไม่ต้องหันไปใช้ชุดข้อมูลที่เป็นกรรมสิทธิ์และไม่สามารถเข้าถึงได้ โดยเฉพาะอย่างยิ่ง LLaMA-13B มีประสิทธิภาพเหนือกว่า GPT-3 (175B) ในเกณฑ์มาตรฐานส่วนใหญ่ และ LLaMA-65B สามารถแข่งขันกับรุ่นที่ดีที่สุด Chinchilla70B และ PaLM-540B เราเผยแพร่แบบจำลองทั้งหมดของเราสู่ชุมชนการวิจัย”

นอกจากนี้ในโพสต์ Twitter นักวิทยาศาสตร์วิจัยของ Facebook AI Research Guillaume Lample กล่าวว่า:

“วันนี้เราเปิดตัว LLaMA ซึ่งเป็นรองพื้น 4 รุ่นตั้งแต่พารามิเตอร์ 7B ถึง 65B LLaMA-13B มีประสิทธิภาพดีกว่า OPT และ GPT-3 175B ในเกณฑ์มาตรฐานส่วนใหญ่ LLaMA-65B สามารถแข่งขันกับ Chinchilla 70B และ PaLM 540B ได้”

ChatGPT ได้รับความนิยมเพิ่มขึ้นหลังจากเปิดตัวเมื่อวันที่ 30 พฤศจิกายน 2022 แชทบอทที่ขับเคลื่อนด้วย AI ของ OpenAI สามารถทำได้แทบทุกอย่างตั้งแต่การเขียนบทกวี การแก้ไขข้อผิดพลาดในการเขียนโค้ดด้วยตัวอย่างโดยละเอียด มันยังสามารถอธิบายถึงความซับซ้อนของเวลาที่เลวร้ายที่สุดของอัลกอริทึมการเรียงลำดับแบบฟอง

ในเวลาเพียงสองเดือน ChatGPT มีผู้ใช้งานถึง 100 ล้านรายต่อเดือนในเดือนมกราคม ทำให้เป็นแอปพลิเคชันสำหรับผู้บริโภคที่เติบโตเร็วที่สุดในประวัติศาสตร์ เมื่อสัปดาห์ที่แล้ว บริษัทประกาศว่าจะเปิดตัว ChatGPT Plus ซึ่งเป็นแผนการสมัครสมาชิกนำร่องมูลค่า 20 ดอลลาร์ต่อเดือนสำหรับแชทบอทยอดนิยมที่ขับเคลื่อนด้วย AI ความสำเร็จอย่างกะทันหันของ ChatGPT สร้างแรงกดดันให้กับบริษัทเทคโนโลยีอื่นๆ เช่น Google, Baidu และ Alibaba

ChatGPT เป็นอินเทอร์เฟซการแชทด้วย AI แบบโต้ตอบสำหรับโมเดลภาษาขนาดใหญ่ในตระกูล GPT-3 ChatGPT ที่น่าทึ่งคือตัวต่อจาก Generative Pre-trained Transformer 3 (GPT-3) ซึ่งเป็นโมเดลภาษาแบบถดถอยอัตโนมัติที่ใช้การเรียนรู้เชิงลึกเพื่อสร้างข้อความที่เหมือนมนุษย์

ChatGPT ได้รับการดัดแปลงมาจากโมเดล GPT-3.5 แต่ได้รับการฝึกฝนเพื่อให้คำตอบในการสนทนามากขึ้น อย่างไรก็ตาม สิ่งที่แตกต่างจาก GPT-3 ก็คือ ChatGPT ใหม่แสดงให้เห็นถึงความสามารถใหม่ๆ มากมาย รวมถึงความสามารถในการมีส่วนร่วมในการสนทนากับผู้ใช้ เขียนโค้ดซอฟต์แวร์ บอกเล่าเรื่องราว และมอบคำตอบให้กับสมการทางคณิตศาสตร์ที่ซับซ้อน ข้อดีของมันคือคุณสามารถทดสอบแชทบอทใหม่ด้วยตัวคุณเองได้ที่นี่

คุณสามารถดาวน์โหลดสำเนา PDF ของ LLaMA Whitepaper ด้านล่าง

333078981_693988129081760_4712707815225756708_n

ประทับเวลา:

เพิ่มเติมจาก เทคสตาร์ทอัพ

จากที่รักการเสนอขายหุ้น IPO สู่การเพิกถอน: การเริ่มต้นเทคโนโลยีที่ขับเคลื่อนด้วยตนเองของ TuSimple การเดินทางที่สับสนอลหม่านจบลงด้วยการออกจาก Nasdaq – TechStartups

โหนดต้นทาง: 3067352
ประทับเวลา: ม.ค. 17, 2024