Meta Lets Code Llama Run Riot تحت شرایط تقریباً باز

بازنشر افلاطون

دنبال: 0

متا یک مدل یادگیری ماشینی دیگر را منتشر کرده است که این بار برای تولید کد منبع نرم افزار تنظیم شده است.

کد لاما یک خانواده از مدل‌های زبان بزرگ است - از این رو با حروف بزرگ "LLaMA" - بر اساس مدل Llama 2 است. منتشر شد در ماه جولای. به‌خوبی تنظیم و آموزش داده شده است تا کد منبع را در پاسخ به درخواست‌های متنی، به‌جای نثری مانند مولد آن، توزیع و بحث کند.

همانند تمام فناوری‌های پیشرفته، Code Llama با خطراتی همراه است

متا ادعا کرد: "Code Llama این پتانسیل را دارد که به عنوان یک ابزار بهره وری و آموزشی برای کمک به برنامه نویسان برای نوشتن نرم افزارهای قوی تر و مستند استفاده شود." یک اطلاعیه پنج شنبه.

متا می‌گوید اگر از Code Llama بخواهید تابعی بنویسد که دنباله فیبوناچی را تولید کند، مدل هم کد و هم زبان طبیعی را تولید می‌کند که منبع را توضیح می‌دهد. و مدل AI می تواند این کار را در Python، C++، Java، PHP، Typescript (Javascript)، C#، Bash و سایر زبان ها انجام دهد.

با این حال، به کاربران دستور داده می‌شود تا Code Llama را به زبان انگلیسی خطاب کنند، زیرا این مدل در تست ایمنی به زبان‌های دیگر قرار نگرفته است و ممکن است در صورت پرس و جو در یک زبان، فقط چیز وحشتناکی بگوید. خارج از دامنه زبان

متا توضیح می‌دهد: «همانند تمام فناوری‌های پیشرفته، Code Llama با خطراتی همراه است.

به گفته متا، Code Llama در دو معیار از LLM های منبع باز و کد خاص و مادر خود Llama 2 بهتر عمل می کند. HumanEval و عمدتاً برنامه نویسی پایه پایتون (MBPP) – و با عملکرد ChatGPT OpenAI مطابقت دارد.

Code Llama در سه اندازه - پارامترهای 7B، 13B و 34B عرضه می‌شود و هر کدام از انواع آن با 500 میلیارد کد کد و داده‌های مرتبط با کد آموزش داده شده‌اند. یک نشانه در زبان انگلیسی تقریباً چهار کاراکتر است. بزرگترین نسخه کدکس OpenAI، زمانی که منتشر شد، داشت پارامترهای 12B.

متا می گوید که دو مدل کوچک Code Llama برای پر کردن منبع گم شده آموزش دیده اند که به آنها امکان می دهد بدون تنظیم دقیق بیشتر برای تکمیل کد استفاده شوند. گفته می شود که نسخه 34B بهترین نتایج را ارائه می دهد، اما دو نسخه کوچکتر سریعتر پاسخ می دهند و آنها را برای کارهایی مانند تکمیل کد که تأخیر قابل توجه است بهتر می کند.

همچنین دو نوع وجود دارد: Code Llama – Python و Code Llama – Instruct. اولی از تنظیم دقیق Code Llama با 100 میلیارد توکن اضافی کد پایتون می آید. دومی به خوبی تنظیم شده است تا به الگوهای ورودی و خروجی پایبند باشد و برای تولید کد مناسب تر باشد.

قابلیت اطمینان، کسی؟

LLM ها اغلب ارائه می دهند غلط پاسخ به دستورهای برنامه نویسی، اگرچه با این وجود بسیاری از توسعه دهندگان از آنها برای یادآوری الگوهای روت و پارامترهای API یا اجتناب از جستارهای جستجو و بررسی اسناد استفاده می کنند.

یکی از نکات فروش Code Llama این است که می‌تواند ورودی و خروجی دنباله‌های کدی را که حداکثر از 100,000 توکن تشکیل شده است، مدیریت کند. به این معنا که شما می توانید مدل را با خطوط کد زیادی درخواست کنید و ممکن است پاسخی پرمخاطب دریافت کنید.

متا توضیح داد: «علاوه بر اینکه پیش نیازی برای تولید برنامه‌های طولانی‌تر است، داشتن توالی‌های ورودی طولانی‌تر، موارد استفاده جدید هیجان‌انگیز را برای کد LLM باز می‌کند. به عنوان مثال، کاربران می توانند مدل را با زمینه بیشتری از پایگاه کد خود ارائه دهند تا نسل ها مرتبط تر شوند. همچنین به اشکال‌زدایی سناریوها در پایگاه‌های کد بزرگ‌تر کمک می‌کند، جایی که در بالای همه کدهای مرتبط با یک مشکل مشخص می‌تواند برای توسعه‌دهندگان چالش‌برانگیز باشد.

کاربران می‌توانند مدل را با زمینه‌های بیشتری از پایگاه کد خود برای مرتبط‌تر کردن نسل‌ها فراهم کنند

Code Llama به حوزه رو به رشدی از مدل‌های آشنا به کد می‌پیوندد که در ابتدا توسط Codex OpenAI و GitHub مرتبط با آن آغاز شد. مشمول دعوی قضایی سرویس پیشنهاد برنامه نویسی Copilot (2021). مدل‌های مثبت برنامه‌نویسی که به دنبال آن‌ها دنبال شد، شامل DeepMind است آلفا کد (2022)، OpenAI's GPT-4 (2023)، آمازون کد Whisperer (2023) و Google's Bard (2023) که در آوریل تنظیم شده است برای تولید کد منبع

علاوه بر این، LLM های منبع باز (یا نوعی باز) مختلفی مانند وجود داشته است StarCoder و XGen، به نام دو.

متا Code Llama را تحت همین عنوان منتشر کرده است مجوز جامعه به عنوان Llama 2، از اعتقاد این شرکت بزرگ به "رویکرد باز به هوش مصنوعی" به عنوان بهترین راه برای توسعه ابزارهای نوآورانه، ایمن و مسئولیت پذیر است.

اما همانطور که به طور گسترده در مورد Llama 2 ذکر شد، مجوز جامعه وجود دارد مجوز منبع باز نیست. "رویکرد باز" متا به هوش مصنوعی برای رقابت بسته است - مجوز به صراحت استفاده از نرم افزار "برای بهبود هر مدل زبان بزرگ دیگر" را ممنوع می کند.

و در حالی که مجوز انجمن متا استفاده تجاری از لاماهای مختلف آن را مجاز می‌سازد، خدماتی را با «بیش از ۷۰۰ میلیون کاربر فعال ماهانه» ترسیم می‌کند.

که نه گروه را انتخاب کنید خدمات بزرگ - YouTube، WeChat، TikTok، LinkedIn، Telegram، Snapchat و Douyin، در میان پلتفرم‌های رسانه‌های اجتماعی که قبلاً توسط Meta اجرا نشده‌اند، و احتمالاً شرکت‌هایی که پلتفرم‌های مبتنی بر سیستم‌عامل مانند اپل، گوگل و مایکروسافت را اجرا می‌کنند، باید درخواست کنند. مجوزی از متا، که متا ممکن است به صلاحدید خود به شما اعطا کند…” ®