Running Mixtral 8x7b On Google Colab For Free - KDnuggets

Taasavaldanud Platon

järgijaid: 0

Mixtral 8x7b käitamine Google Colabis tasuta
Pilt autorilt

Selles postituses uurime uut nüüdisaegset avatud lähtekoodiga mudelit nimega Mixtral 8x7b. Samuti õpime, kuidas sellele juurde pääseda LLaMA C++ teegi abil ja kuidas käivitada suuri keelemudeleid vähendatud andmetöötluse ja mäluga.

Mixtral 8x7b on Mistral AI poolt loodud kõrgekvaliteediline avatud raskustega ekspertsegude (SMoE) mudel. See on litsentsitud Apache 2.0 alusel ja ületab enamiku võrdlusaluste puhul Llama 2 70B, tehes samas kuus korda kiirema järelduse. Mixtral sobib või ületab GPT6 enamiku standardsete võrdlusnäitajate puhul ja on kulude ja jõudluse osas parim avatud kaaluga mudel.

Mixtral 8x7b käitamine Google Colabis tasuta
Pilt Ekspertide segu

Mixtral 8x7B kasutab ainult dekoodri hõredat ekspertide seguvõrku. See hõlmab edasisuunamisplokki, mis valib 8 parameetrirühma hulgast, kusjuures ruuterivõrk valib iga märgi jaoks kaks neist rühmadest, kombineerides nende väljundeid aditiivselt. See meetod suurendab mudeli parameetrite arvu, haldades samal ajal kulusid ja latentsust, muutes selle sama tõhusaks kui 12.9 B mudel, hoolimata sellest, et sellel on 46.7 B koguparameetreid.

Mixtral 8x7B mudel paistab silma 32 XNUMX žetoonide laia konteksti haldamisel ja toetab mitut keelt, sealhulgas inglise, prantsuse, itaalia, saksa ja hispaania keelt. See demonstreerib tugevat jõudlust koodi genereerimisel ja seda saab peenhäälestada juhiseid järgivaks mudeliks, saavutades kõrgeid tulemusi sellistel võrdlusalustel nagu MT-Bench.

LLaMA.cpp on C/C++ teek, mis pakub suure jõudlusega liidest suurte keelemudelite (LLM) jaoks, mis põhinevad Facebooki LLM-i arhitektuuril. See on kerge ja tõhus raamatukogu, mida saab kasutada mitmesuguste ülesannete jaoks, sealhulgas teksti genereerimiseks, tõlkimiseks ja küsimustele vastamiseks. LLaMA.cpp toetab laia valikut LLM-e, sealhulgas LLaMA, LLaMA 2, Falcon, Alpaca, Mistral 7B, Mixtral 8x7B ja GPT4ALL. See ühildub kõigi operatsioonisüsteemidega ja võib töötada nii protsessoritel kui ka GPU-del.

Selles jaotises käitame Colabis veebirakendust llama.cpp. Kirjutades mõne koodirea, saate kogeda uue tipptasemel mudeli jõudlust oma arvutis või Google Colabis.

Alustamine

Esiteks laadime alloleva käsurea abil alla GitHubi hoidla llama.cpp:

!git clone --depth 1 https://github.com/ggerganov/llama.cpp.git

Pärast seda muudame kataloogi hoidlasse ja installime llama.cpp, kasutades käsku "make". Installime faili llama.cpp NVidia GPU-le, kus on installitud CUDA.

%cd llama.cpp

!make LLAMA_CUBLAS=1

Laadige mudel alla

Mudeli saame alla laadida Hugging Face Hubist, valides .gguf mudelifaili sobiva versiooni. Lisateavet erinevate versioonide kohta leiate aadressilt TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF.

Mixtral 8x7b käitamine Google Colabis tasuta
Pilt TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF

Mudeli praegusesse kataloogi allalaadimiseks saate kasutada käsku "wget".

!wget https://huggingface.co/TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF/resolve/main/mixtral-8x7b-instruct-v0.1.Q2_K.gguf

LLaMA serveri välisaadress

Kui käitame LLaMA serverit, annab see meile kohaliku hosti IP-aadressi, mis on meie jaoks Colabis kasutu. Vajame ühendust kohaliku hosti puhverserveriga, kasutades Colabi tuuma puhverserveri porti.

Pärast alloleva koodi käivitamist saate globaalse hüperlingi. Kasutame seda linki oma veebirakendusele hiljem juurdepääsuks.

from google.colab.output import eval_js
print(eval_js("google.colab.kernel.proxyPort(6589)"))

https://8fx1nbkv1c8-496ff2e9c6d22116-6589-colab.googleusercontent.com/

Serveri käitamine

LLaMA C++ serveri käitamiseks peate andma serverikäsule mudelifaili asukoha ja õige pordi numbri. Oluline on veenduda, et pordi number ühtiks puhverserveri pordi eelmises etapis algatatud numbriga.

%cd /content/llama.cpp

!./server -m mixtral-8x7b-instruct-v0.1.Q2_K.gguf -ngl 27 -c 2048 --port 6589

Mixtral 8x7b käitamine Google Colabis tasuta

Vestluse veebirakendusele pääseb juurde, klõpsates eelmises etapis puhverserveri pordi hüperlingil, kuna server ei tööta kohapeal.

LLaMA C++ veebirakendus

Enne kui hakkame vestlusrobotit kasutama, peame seda kohandama. Asendage “LLaMA” oma mudeli nimega viipade jaotises. Lisaks muutke loodud vastuste eristamiseks kasutajanime ja roboti nime.

Mixtral 8x7b käitamine Google Colabis tasuta

Alustage vestlust, kerides alla ja tippides vestluse jaotisesse. Küsige julgelt tehnilisi küsimusi, millele teised avatud lähtekoodiga mudelid pole korralikult vastanud.

Mixtral 8x7b käitamine Google Colabis tasuta

Kui teil tekib rakendusega probleeme, võite proovida seda oma Google Colabi abil ise käivitada: https://colab.research.google.com/drive/1gQ1lpSH-BhbKN-DdBmq5r8-8Rw8q1p9r?usp=sharing

See õpetus sisaldab põhjalikku juhendit selle kohta, kuidas käitada täiustatud avatud lähtekoodiga mudelit Mixtral 8x7b teenuses Google Colab, kasutades LLaMA C++ teeki. Võrreldes teiste mudelitega pakub Mixtral 8x7b suurepärast jõudlust ja tõhusust, muutes selle suurepäraseks lahenduseks neile, kes soovivad katsetada suurte keelemudelitega, kuid kellel ei ole ulatuslikke arvutusressursse. Saate seda hõlpsalt käitada sülearvutis või tasuta pilvandmetöötluses. See on kasutajasõbralik ja saate isegi oma vestlusrakenduse teistele kasutamiseks ja katsetamiseks juurutada.

Loodan, et see lihtne lahendus suure mudeli käitamiseks oli teile kasulik. Otsin alati lihtsaid ja paremaid võimalusi. Kui teil on veelgi parem lahendus, andke mulle sellest teada ja ma räägin sellest järgmisel korral.

Abid Ali Awan (@1abidaliawan) on sertifitseeritud andmeteadlase professionaal, kes armastab masinõppemudelite loomist. Praegu keskendub ta sisu loomisele ning tehniliste ajaveebide kirjutamisele masinõppe ja andmeteaduse tehnoloogiate kohta. Abid on omandanud magistrikraadi tehnoloogiajuhtimises ja bakalaureusekraadi telekommunikatsioonitehnikas. Tema visioon on luua graafilise närvivõrgu abil tehisintellekti toode vaimuhaigustega võitlevatele õpilastele.

Veel selle teema kohta

SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
Allikas: https://www.kdnuggets.com/running-mixtral-8x7b-on-google-colab-for-free?utm_source=rss&utm_medium=rss&utm_campaign=running-mixtral-8x7b-on-google-colab-for-free

Ajatempel: Jaanuar 12, 2024

Ajatempel: Jan 5, 2023

KDnuggets™ News 21:n40, 20. oktoober: 20 Pythoni paketti, mida vajate masinõppeks ja andmeteaduseks; Ace Data Science intervjuud portfelliprojektidega

Allikaklaster:

KDnuggets

Allikasõlm: 1878426

Ajatempel: Oktoober 20, 2021

Amazoni veebiteenuste veebiseminar: kasutage andmekogumeid kliendikeskse strateegia loomiseks ja äritulemuste parandamiseks

Allikaklaster:

KDnuggets

Allikasõlm: 1877942

Ajatempel: Oktoober 14, 2021

See nädal AI-s, 7. august: Jupyteri & Stack Overflow'sse jõuab generatiivne AI • ChatGPT värskendused – KDnuggets

Allikaklaster:

KDnuggets

Allikasõlm: 2811308

Ajatempel: August 8, 2023

Mixtral 8x7b käivitamine Google Colabis tasuta – KDnuggets

Taasavaldanud Platon

Alustamine

Laadige mudel alla

LLaMA serveri välisaadress

Serveri käitamine

LLaMA C++ veebirakendus

Veel selle teema kohta

Veel alates KDnuggets

Kuidas luua voogesituse poolstruktureeritud analüüsiplatvormi Snowflake'is – KDnuggets

KDnuggetsi uudised, 8. märts: ChatGPT andmeteaduse petuleht • 2023. aasta parimad tasuta andmeteaduse veebikursused

Juhtivalt eksperimenteerimiseksperdilt Ronny Kohavilt (endine Amazon, Airbnb, Microsoft) saate teada, kuidas kujundada, mõõta ja rakendada usaldusväärseid A/B-teste.

KDnuggets™ News 21:n40, 20. oktoober: 20 Pythoni paketti, mida vajate masinõppeks ja andmeteaduseks; Ace Data Science intervjuud portfelliprojektidega

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto