הפעלת Mixtral 8x7b ב-Google Colab בחינם - KDnuggets

הועלה מחדש על ידי אפלטון

עוקב: 0

הפעלת Mixtral 8x7b ב-Google Colab בחינם
תמונה מאת המחבר

בפוסט זה, נחקור את מודל הקוד הפתוח החדש והחדש שנקרא Mixtral 8x7b. נלמד גם כיצד לגשת אליו באמצעות ספריית LLaMA C++ וכיצד להפעיל מודלים של שפה גדולים על מחשוב וזיכרון מופחתים.

Mixtral 8x7b הוא דגם דליל באיכות גבוהה של מומחים (SMoE) עם משקולות פתוחות, שנוצר על ידי Mistral AI. הוא מורשה תחת Apache 2.0 ומתעלה על Llama 2 70B ברוב המדדים, בעוד שיש לו הסקה מהירה פי 6. Mixtral תואם או מנצח GPT3.5 ברוב המדדים הסטנדרטיים והוא הדגם הטוב ביותר במשקל פתוח לגבי עלות/ביצועים.

הפעלת Mixtral 8x7b ב-Google Colab בחינם
תמונה מתוך מיקסטרל של מומחים

Mixtral 8x7B משתמש ברשת תערובת דלילה של מומחים בלבד. זה כרוך בלוק Feedforward בחירה מתוך 8 קבוצות של פרמטרים, כאשר רשת נתבים בוחרת שתיים מהקבוצות הללו עבור כל אסימון, ומשלבת את הפלטים שלהם באופן נוסף. שיטה זו משפרת את ספירת הפרמטרים של המודל תוך ניהול עלות והשהייה, מה שהופך אותו ליעיל כמו מודל 12.9B, למרות שיש לו 46.7B פרמטרים בסך הכל.

דגם Mixtral 8x7B מצטיין בטיפול בהקשר רחב של 32k אסימונים ותומך במספר שפות, כולל אנגלית, צרפתית, איטלקית, גרמנית וספרדית. הוא מפגין ביצועים חזקים ביצירת קוד וניתן לכוונן אותו למודל העוקב אחר הוראות, משיג ציונים גבוהים במדדים כמו MT-Bench.

LLaMA.cpp היא ספריית C/C++ המספקת ממשק בעל ביצועים גבוהים עבור מודלים של שפה גדולה (LLMs) המבוסס על ארכיטקטורת LLM של פייסבוק. זוהי ספרייה קלת משקל ויעילה שיכולה לשמש למגוון משימות, כולל הפקת טקסט, תרגום ומענה לשאלות. LLaMA.cpp תומך במגוון רחב של LLMs, כולל LLaMA, LLaMA 2, Falcon, Alpaca, Mistral 7B, Mixtral 8x7B ו-GPT4ALL. זה תואם לכל מערכות ההפעלה ויכול לתפקד גם במעבדים וגם במעבדי GPU.

בחלק זה, נריץ את אפליקציית האינטרנט llama.cpp ב-Colab. על ידי כתיבת כמה שורות קוד, תוכל לחוות את הביצועים החדשים של הדגם החדש במחשב האישי שלך או ב-Google Colab.

תחילת העבודה

ראשית, נוריד את מאגר GitHub llama.cpp באמצעות שורת הפקודה למטה:

!git clone --depth 1 https://github.com/ggerganov/llama.cpp.git

לאחר מכן, נשנה ספרייה למאגר ונתקין את ה-llama.cpp באמצעות הפקודה 'make'. אנו מתקינים את llama.cpp עבור NVidia GPU עם CUDA מותקן.

%cd llama.cpp

!make LLAMA_CUBLAS=1

הורד את הדגם

נוכל להוריד את הדגם מ-Hugging Face Hub על ידי בחירת הגרסה המתאימה של קובץ הדגם `.gguf`. מידע נוסף על גרסאות שונות ניתן למצוא ב TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF.

הפעלת Mixtral 8x7b ב-Google Colab בחינם
תמונה מתוך TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF

אתה יכול להשתמש בפקודה `wget` כדי להוריד את הדגם בספרייה הנוכחית.

!wget https://huggingface.co/TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF/resolve/main/mixtral-8x7b-instruct-v0.1.Q2_K.gguf

כתובת חיצונית עבור שרת LLaMA

כאשר אנו מפעילים את שרת LLaMA הוא ייתן לנו IP של localhost שהוא חסר תועלת עבורנו ב-Colab. אנחנו צריכים את החיבור ל-proxy localhost באמצעות יציאת ה-proxy של Colab.

לאחר הפעלת הקוד למטה, תקבל את ההיפר-קישור הגלובלי. אנו נשתמש בקישור הזה כדי לגשת לאפליקציית האינטרנט שלנו מאוחר יותר.

from google.colab.output import eval_js
print(eval_js("google.colab.kernel.proxyPort(6589)"))

https://8fx1nbkv1c8-496ff2e9c6d22116-6589-colab.googleusercontent.com/

הפעלת השרת

כדי להפעיל את שרת LLaMA C++, עליך לספק את פקודת השרת עם המיקום של קובץ הדגם ומספר היציאה הנכון. חשוב לוודא שמספר היציאה תואם לזה שיזמנו בשלב הקודם עבור יציאת ה-proxy.

%cd /content/llama.cpp

!./server -m mixtral-8x7b-instruct-v0.1.Q2_K.gguf -ngl 27 -c 2048 --port 6589

הפעלת Mixtral 8x7b ב-Google Colab בחינם

ניתן לגשת לאפליקציית הצ'אט על ידי לחיצה על ההיפר-קישור של יציאת ה-proxy בשלב הקודם מכיוון שהשרת אינו פועל באופן מקומי.

אפליקציה אינטרנטית של LLaMA C++

לפני שנתחיל להשתמש בצ'אטבוט, עלינו להתאים אותו. החלף את "LLaMA" בשם הדגם שלך בסעיף ההנחיות. בנוסף, שנה את שם המשתמש ואת שם הבוט כדי להבחין בין התגובות שנוצרו.

הפעלת Mixtral 8x7b ב-Google Colab בחינם

התחל בצ'אט על ידי גלילה מטה והקלדה בקטע הצ'אט. אל תהסס לשאול שאלות טכניות שדגמי קוד פתוח אחרים לא הצליחו לענות עליהן כראוי.

הפעלת Mixtral 8x7b ב-Google Colab בחינם

אם אתה נתקל בבעיות עם האפליקציה, תוכל לנסות להפעיל אותה בעצמך באמצעות Google Colab שלי: https://colab.research.google.com/drive/1gQ1lpSH-BhbKN-DdBmq5r8-8Rw8q1p9r?usp=sharing

מדריך זה מספק מדריך מקיף כיצד להפעיל את מודל הקוד הפתוח המתקדם, Mixtral 8x7b, ב-Google Colab באמצעות ספריית LLaMA C++. בהשוואה לדגמים אחרים, Mixtral 8x7b מספק ביצועים ויעילות מעולים, מה שהופך אותו לפתרון מצוין למי שרוצה להתנסות במודלים של שפות גדולות אך אין להם משאבי חישוב נרחבים. אתה יכול להפעיל אותו בקלות על המחשב הנייד שלך או על מחשב ענן חינמי. זה ידידותי למשתמש, ואתה יכול אפילו לפרוס את אפליקציית הצ'אט שלך כדי שאחרים יוכלו להשתמש בה ולהתנסות איתה.

אני מקווה שמצאת את הפתרון הפשוט הזה להפעלת הדגם הגדול מועיל. אני תמיד מחפש אפשרויות פשוטות וטובות יותר. אם יש לך פתרון אפילו יותר טוב, אנא הודע לי, ואני אעסוק בו בפעם הבאה.

עביד עלי אוואן (@1abidaliawan) הוא איש מקצוע מוסמך של מדען נתונים שאוהב לבנות מודלים של למידת מכונה. נכון לעכשיו, הוא מתמקד ביצירת תוכן וכתיבת בלוגים טכניים על למידת מכונה וטכנולוגיות מדעי נתונים. עביד הוא בעל תואר שני בניהול טכנולוגיה ותואר ראשון בהנדסת טלקומוניקציה. החזון שלו הוא לבנות מוצר בינה מלאכותית באמצעות רשת עצבית גרפית עבור תלמידים הנאבקים במחלות נפש.

עוד בנושא זה

הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
מקור: https://www.kdnuggets.com/running-mixtral-8x7b-on-google-colab-for-free?utm_source=rss&utm_medium=rss&utm_campaign=running-mixtral-8x7b-on-google-colab-for-free

בול זמן: ינואר 12, 2024

בול זמן: יאן 5, 2023

חדשות KDnuggets ™ 21: n40, 20 באוקטובר: 20 חבילות הפיתון הדרושות לך ללמידת מכונות ומדעי נתונים; ראיונות Ace Data Science עם פרויקטי פורטפוליו

אשכול המקור:

KDnuggets

צומת המקור: 1878426

בול זמן: אוקטובר 20, 2021

סמינר מקוון של שירותי האינטרנט של אמזון: נצל מערכי נתונים כדי ליצור אסטרטגיה ממוקדת בלקוח ולשפר את התוצאות העסקיות

אשכול המקור:

KDnuggets

צומת המקור: 1877942

בול זמן: אוקטובר 14, 2021

השבוע בבינה מלאכותית, 7 באוגוסט: AI גנרטיבי מגיע ל-Jupyter & Stack Overflow • עדכוני ChatGPT - KDnuggets

השבוע בבינה מלאכותית, 7 באוגוסט: בינה מלאכותית גנרית מגיעה ל-Jupyter & Stack Overflow • עדכוני ChatGPT – KDnuggets

אשכול המקור:

KDnuggets

צומת המקור: 2811308

בול זמן: אוגוסט 8, 2023

הפעלת Mixtral 8x7b ב-Google Colab בחינם - KDnuggets

הועלה מחדש על ידי אפלטון

תחילת העבודה

הורד את הדגם

כתובת חיצונית עבור שרת LLaMA

הפעלת השרת

אפליקציה אינטרנטית של LLaMA C++

עוד בנושא זה

עוד מ KDnuggets

כיצד לבנות פלטפורמת אנליטיקס מובנית למחצה ב-Snowflake – KDnuggets

חדשות KDnuggets, 8 במרץ: גיליון בגידות של ChatGPT למדעי נתונים • קורסים מקוונים מובילים בחינם למדעי נתונים לשנת 2023

למד כיצד לעצב, למדוד וליישם בדיקות A/B אמינות מהמומחה המוביל לניסויים רוני כוכבי (לשעבר אמזון, Airbnb, מיקרוסופט)

חדשות KDnuggets ™ 21: n40, 20 באוקטובר: 20 חבילות הפיתון הדרושות לך ללמידת מכונות ומדעי נתונים; ראיונות Ace Data Science עם פרויקטי פורטפוליו

אודות

חיפוש אנכי ו- Ai

פלטפורמה

שמור על קשר

חֶשְׁבּוֹן