Meta תשיק את מודל שפת הבינה המלאכותית LLaMA כדי לעזור לחוקרים ולהתמודד עם ChatGPT

Meta תשיק את מודל שפת הבינה המלאכותית LLaMA כדי לעזור לחוקרים ולהתמודד עם ChatGPT

צומת המקור: 1976707

Meta הודיעה ביום שישי שהיא משחררת מודל שפה חדש המבוסס על בינה מלאכותית כאשר מירוץ הבינה המלאכותית הגנרטיבית מתחממת, אמר המנכ"ל מארק צוקרברג ביום שישי. מודל השפה החדש מיועד לשימוש במחקר ויהיה זמין עבור חוקרים אקדמיים, ממשלה, חברה אזרחית וארגונים אקדמיים, ומחקר בתעשייה.

מודל השפה, שנקרא LLaMA, נועד ליצור טקסט ושיחות, לסכם חומר כתוב ולבצע משימות מסובכות כמו פתרון משפטי מתמטיקה או חיזוי מבני חלבון. ב הפרסום ב- Facebook, מטה אמרה:

"אנחנו מציגים את LLaMA, אוסף של מודלים של שפות יסוד הנעים בין 7B עד 65B פרמטרים. אנו מאמנים את המודלים שלנו על טריליוני אסימונים, ומראים שאפשר לאמן מודלים חדישים באמצעות מערכי נתונים זמינים לציבור באופן בלעדי, מבלי להזדקק למערכי נתונים קנייניים ובלתי נגישים. בפרט, LLaMA-13B מתעלה על GPT-3 (175B) ברוב המדדים, ו-LAMA-65B תחרותי עם הדגמים הטובים ביותר, Chinchilla70B ו-PaLM-540B. אנחנו משחררים את כל המודלים שלנו לקהילת המחקר".

כמו כן, בפוסט בטוויטר, אמר מדען מחקר ב-Facebook AI Research Guillaume Lample:

"היום אנו משחררים את LLaMA, 4 דגמי יסוד הנעים בין 7B עד 65B פרמטרים. LLaMA-13B מתעלה על ה-OPT ו-GPT-3 175B ברוב המדדים. LLaMA-65B תחרותי עם Chinchilla 70B ו-PaLM 540B."

ה-ChatGPT זינק בפופולריות לאחר שחרורו ב-30 בנובמבר 2022. הצ'טבוט המופעל על ידי AI של OpenAI יכול היה לעשות כמעט הכל, החל מכתיבת שירה, ותיקון טעויות קידוד עם דוגמאות מפורטות, ועד להפקת הנחיות לאמנות בינה מלאכותית. זה אפילו יכול להסביר את מורכבות הזמן הגרוע ביותר של אלגוריתם מיון הבועות.

תוך חודשיים בלבד, ChatGPT הגיע בינואר ל-100 מיליון משתמשים פעילים חודשיים, מה שהפך אותו לאפליקציה הצרכנית הצומחת ביותר בהיסטוריה. בשבוע שעבר הודיעה החברה שהיא משיקה את ChatGPT Plus, תוכנית פיילוט של 20 דולר לחודש עבור הצ'טבוט הפופולרי שלה המופעל בבינה מלאכותית. ההצלחה הפתאומית של ChatGPT הפעילה יותר לחץ על חברות טכנולוגיה אחרות כולל גוגל, באידו ועליבאבא.

ChatGPT הוא ממשק צ'אט מבוסס-דיאלוג בינה מלאכותית עבור משפחת ה-GPT-3 של דגמי שפות גדולים. ה-ChatGPT המהמם הוא יורש של Generative Pre-trained Transformer 3 (GPT-3), שהוא מודל שפה אוטורגרסיבי המשתמש בלמידה עמוקה כדי לייצר טקסט דמוי אדם.

ChatGPT הותאם מדגם GPT-3.5 אך הוכשר לספק תשובות שיחה יותר. עם זאת, בניגוד ל-GPT-3, ה-ChatGPT החדש מפגין מערך של יכולות חדשות הכוללות את היכולת לנהל שיחות עם משתמשים, לכתוב קודי תוכנה, לספר סיפורים ולספק פתרונות למשוואות מתמטיות מורכבות. היופי בכל זה הוא שאתה יכול לבדוק את הצ'אטבוט החדש בעצמך ממש כאן.

אתה יכול להוריד עותק PDF של ה- LLaMA Whitepaper למטה.

333078981_693988129081760_4712707815225756708_n

בול זמן:

עוד מ TechStartups