אושרה דליפה של מיסטרל בינונית: הסביר Miqu 70b

אושרה דליפה של מיסטרל בינונית: הסביר Miqu 70b

צומת המקור: 3094214

לפי החדשות והציוצים האחרונים, הדלפת Mistral Medium חשפה את Miqu 70b. מה שעוד יותר מעניין הוא שמנכ"ל החברה, ארתור מנש, אישר זאת ב-X בציוץ די מצחיק.

ההדלפה האחרונה של דגם AI בשם "miqu-1-70b" משכה את תשומת לבם של חובבי טכנולוגיה ומומחים כאחד. האירוע הזה התחיל בהעלאת קובץ פשוטה על ידי מישהו בשם "Miqu Dev" בפלטפורמה בשם HuggingFace, ועורר עניין נרחב ושיחות על Mistral, חברת AI מובילה בפריז. ארתור מנש, מנכ"ל מיסטרל, אישר מאוחר יותר שהדגם שדלף הוא אכן גרסה ישנה יותר מהחברה שלהם, ששותף בטעות למישהו.

מיסטרל דליפה בינונית
Mistral AI נוסדה על ידי עובדי Meta ו-Google לשעבר (אשראי תמונה)

דליפה של Mistral Medium חושפת את Miqu 70b

הדלפות אינן נדירות בעולם ההומה של הטכנולוגיה, אך לעתים רחוקות הן לא מצליחות לעורר התרגשות וסקרנות. כך הוא המקרה עם הבאזז האחרון סביב קהילת הבינה המלאכותית בעקבות הופעתו הבלתי צפויה של מודל שפה חדש שזכה לכינוי "Miqu 70b" ב-HuggingFace, פלטפורמה מובילה לטכנולוגיות בינה מלאכותית בקוד פתוח. ההדלפה הזו הציתה דיונים על פני פלטפורמות שונות של מדיה חברתית, כשכולם להוטים להבין מה זה "Miqu 70b" ומה זה מסמל לעתיד של פיתוח בינה מלאכותית.

הסיפור החל להתפתח כאשר משתמש בשם "Miqu Dev" העלה קבצים ל-HuggingFace, המציגים לכאורה מודל שפה גדול חדש (LLM) הקשור קשר הדוק לטכנולוגיה שפיתחה Mistral, מנהיגה בפריז ב-AI בקוד פתוח. המצב קיבל תפנית דרמטית כאשר הופיע פוסט אנונימי ב-4chan, אולי על ידי "Miqu Dev", והוביל לטירוף של דיונים מקוונים על אופיו ומקורו של המודל הזה.

קהילת הבינה המלאכותית, שהתפרסה על פני פלטפורמות כמו X ולינקדאין, צללה לנתח את הפוטנציאל של המודל המסתורי הזה, עם ספקולציות על מקורותיו ויכולותיו.


השוואה: האם Mistral 7B באמת יכול לנצח את GPT-3.5 Turbo?


מיסטרל דליפה בינונית אושרה על ידי גורמים בחברה

ספקולציות אלו זכו עד מהרה להתייחסות על ידי לא אחר מאשר ארתור מנש, מנכ"ל מיסטרל, שאישר את האותנטיות של ההדלפה. בטוויסט מפתיע, נחשף כי "Miqu 70b" הוא אכן גרסה כמותית של דגם מיסטרל ישן יותר, שהודלף בטעות על ידי "עובד נלהב יתר על המידה" של לקוח בגישה מוקדמת. המודל הזה, שחלקם האמינו שהוא דליפה פנימית או מהלך נוכל, התברר כחלק מכריע בפאזל הפיתוח של מיסטרל, המציג את ההתקדמות והשאפתנות של החברה בתחום התחרותי של AI.

מה זה Miqu 70b?

התככים סביב "Miqu 70b" נובעים במידה רבה מהביצועים שלו. בדיקות מוקדמות של קהילת הבינה המלאכותית מצביעות על כך שזה לא סתם דגם; הוא מתפקד כמו, או אפילו טוב יותר, מדגמי הקוד הפתוח הטובים ביותר של מיסטרל. זה כולל התעלות על הדגמים המובילים של מיסטרל בחלק מהמבחנים ודירוג ממש מתחת ל-GPT-4 באחרים. הישגים כאלה עוררו באופן מובן סערה, והצביעו על "Miqu 70b" כעל התקדמות בולטת בטכנולוגיית AI.

התובנות של ארתור מנש חושפות כי "Miqu 70b" הוא גרסה שונה של דגם ישן יותר שפיתחה מיסטרל. הוא התבסס על טכנולוגיה אחרת בשם Llama 2, והיא הושלמה ממש כשמיסטרל הוציאה דגם גדול נוסף. רקע זה מציע הצצה לגישה של מיסטרל לפיתוח טכנולוגיות AI חדשניות.

מיסטרל דליפה בינונית
תגובתו של מנש עוררה שאלות כאילו הדליפו את הדגם בכוונה (אשראי תמונה)

גישה חדשה להדלפות?

מה שמעניין במיוחד במצב הזה הוא איך מיסטרל הגיבה. במקום לדרוש את הסרת הדגם שדלף מ- HuggingFace, Mensch הציע בשובבות שהמעלה ירצה לתת קרדיט ראוי בפעם הבאה. תגובה זו מעידה על שינוי באופן שבו חברות טכנולוגיה עשויות להתמודד עם הדלפות בעתיד, תוך התמקדות יותר בהכרה ובשיתוף פעולה פוטנציאלי במקום בהליכים משפטיים.


Mixtral 8x7B של Mistral AI עולה על GPT-3.5, ומטלטל את עולם הבינה המלאכותית


מה הלאה?

ההדלפה הזכירה את "Miqu 70b" והביאה את תשומת הלב לאסטרטגיות החדשניות של Mistral ולהתקדמותן בתחום הבינה המלאכותית. תגובת הקהילה הייתה חיובית ברובה, ורואה בכך התפתחות מרגשת בתחום הבינה המלאכותית. עם ההבטחה של מיסטרל להתקדמות נוספת באופק, עולם הטכנולוגיה ממתין בקוצר רוח למה שהם ימציאו בהמשך.

לסיכום, ההדלפה של "Miqu 70b" סיפקה תובנה ייחודית לעולם המהיר של פיתוח בינה מלאכותית. זה מדגיש את החשיבות של חדשנות, שיתוף פעולה ואולי דרך חדשה לנווט במים הבלתי צפויים של דליפות טכנולוגיה. כשאנחנו צופים במהלכים הבאים של מיסטרל, ברור שעתיד הבינה המלאכותית הוא מזהיר, עם תפניות בלתי צפויות שיכולות להוביל להתקדמות פורצת דרך.

אשראי תמונה מוצגת: Mistral AI

בול זמן:

עוד מ דאטונומיה