Meta выпустила еще одну своего рода открытую модель машинного обучения, на этот раз настроенную для генерации исходного кода программного обеспечения.
Код Ламы — это семейство больших языковых моделей (отсюда и случайное написание слова «LLaMA»), основанное на модели Llama 2. выпустил в июле. Он был прекрасно настроен и обучен выдавать и обсуждать исходный код в ответ на текстовые подсказки, а не в виде прозы, как его прародитель.
Как и все передовые технологии, Code Llama сопряжена с рисками.
«Code Llama потенциально может использоваться в качестве инструмента повышения производительности и обучения, который поможет программистам писать более надежное и хорошо документированное программное обеспечение», — заявила Мета в объявление Четверг.
Если вы попросите Code Llama написать функцию, которая создает последовательность Фибоначчи, модель сгенерирует как код, так и естественный язык, объясняющий источник, говорит Мета. И модель ИИ может делать это на Python, C++, Java, PHP, Typescript (Javascript), C#, Bash и других языках.
Однако пользователям рекомендуется обращаться к Code Llama на английском языке, поскольку модель не прошла тестирование на безопасность на других языках и может просто сказать что-то ужасное, если ее запросить в вне сферы язык.
«Как и все передовые технологии, Code Llama сопряжена с рисками», — объясняет Meta, отмечая, что во время собственного тестирования красной командой по провоцированию создания вредоносного кода Code Llama ответила более безопасными ответами, чем ChatGPT (GPT3.5 Turbo).
По данным Meta, Code Llama превосходит LLM с открытым исходным кодом, ориентированный на конкретный код, и свою собственную родительскую Llama 2 в двух тестах: HumanEval и в основном базовое программирование на Python (МБПП) – и соответствует производительности ChatGPT OpenAI.
Code Llama поставляется в трех размерах — 7B, 13B и 34B параметров — и каждый вариант был обучен с использованием 500B токенов кода и данных, связанных с кодом. Один токен составляет примерно четыре символа в английском языке. Самая большая версия Кодекса OpenAI на момент ее выпуска имела 12B параметры.
По словам Меты, две самые маленькие модели Code Llama были обучены заполнять недостающий исходный код, что позволяет использовать их для завершения кода без дальнейшей тонкой настройки. Говорят, что версия 34B обеспечивает наилучшие результаты, но две меньшие реагируют быстрее, что делает их лучше для таких задач, как завершение кода, где заметна задержка.
Также есть два варианта: Code Llama – Python и Code Llama – Instruct. Первый вариант получен в результате тонкой настройки Code Llama с добавлением 100 миллиардов токенов кода Python. Последний был точно настроен для соответствия шаблонам ввода и вывода, что делает его более подходящим для генерации кода.
Надежность, кто-нибудь?
LLM часто предоставляют неправильный ответы к подсказкам программирования, хотя они, тем не менее, используются многими разработчиками для вызова шаблонов и параметров API или для того, чтобы избежать поисковых запросов и проверки документации.
Одним из преимуществ Code Llama является то, что он может обрабатывать ввод и вывод последовательностей кода, состоящих до 100,000 XNUMX токенов. То есть вы можете запросить модель с помощью многих строк кода и получить подробный ответ.
«Помимо того, что наличие более длинных входных последовательностей является обязательным условием для создания более длинных программ, они открывают новые захватывающие варианты использования кода LLM», — объяснил Мета. «Например, пользователи могут предоставить модели больше контекста из своей кодовой базы, чтобы сделать поколения более актуальными. Это также помогает в отладке сценариев в более крупных базах кода, где разработчикам может быть сложно оставаться в курсе всего кода, связанного с конкретной проблемой».
Пользователи могут предоставить модели больше контекста из своей кодовой базы, чтобы сделать поколения более актуальными.
Code Llama присоединяется к растущей области моделей, ориентированных на код, первоначально зародившихся Codex OpenAI и связанным с ним GitHub. обремененный судебными разбирательствами Служба предложений по программированию Copilot (2021). Последующие модели позитивного программирования включают модель DeepMind. АльфаКод (2022 г.), GPT-4 OpenAI (2023 г.), Amazon Код Шепчущий (2023 г.) и Google's Bard (2023 г.), настроено в апреле. генерировать исходный код.
Кроме того, существовали различные LLM с открытым исходным кодом (или своего рода открытые), такие как Старкодер и XGen, чтобы назвать два.
Meta выпустила Code Llama под тем же общественная лицензия как Llama 2, ссылаясь на веру мегакорпорации в «открытый подход к ИИ» как лучший способ разработки инновационных, безопасных и ответственных инструментов.
Но, как было широко отмечено в случае с Llama 2, лицензия сообщества не лицензия с открытым исходным кодом. «Открытый подход» Meta к ИИ закрыт для конкуренции — лицензия прямо запрещает использовать программное обеспечение «для улучшения любой другой большой языковой модели».
И хотя общественная лицензия Meta разрешает коммерческое использование различных лам, она ограничивает сервисы с «более 700 миллионами активных пользователей в месяц».
Это скорее выберите группу мегасервисов – YouTube, WeChat, TikTok, LinkedIn, Telegram, Snapchat и Douyin, среди платформ социальных сетей, которые еще не управляются Meta, и, предположительно, компаний, использующих платформы на базе операционных систем, такие как Apple, Google и Microsoft – «должны запросить лицензию от Meta, которую Meta может предоставить вам по своему усмотрению…» ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Автомобили / электромобили, Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- ЧартПрайм. Улучшите свою торговую игру с ChartPrime. Доступ здесь.
- Смещения блоков. Модернизация права собственности на экологические компенсации. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2023/08/25/meta_lets_code_llama_run/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 100
- 2021
- 2022
- 2023
- 700
- a
- активный
- дополнение
- адрес
- придерживаться
- AI
- Все
- позволяет
- уже
- причислены
- Amazon
- среди
- an
- и
- Другой
- ответы
- любой
- кто угодно
- API
- Apple
- подхода
- апрель
- МЫ
- AS
- связанный
- At
- избегающий
- основанный
- колотить
- основной
- BE
- было
- не являетесь
- вера
- тесты
- ЛУЧШЕЕ
- Лучшая
- изоферменты печени
- но
- by
- C + +
- CAN
- капитализация
- случаев
- сложные
- символы
- ChatGPT
- Проверки
- заявил
- закрыто
- CO
- код
- Codebase
- выходит
- коммерческая
- сообщество
- Компании
- конкурс
- завершение
- контекст
- создание
- резки
- данным
- DeepMind
- развивать
- застройщиков
- DID
- обсуждать
- do
- документации
- Douyin
- рисует
- в течение
- каждый
- Edge
- образовательных
- Английский
- Эфир (ETH)
- пример
- захватывающий
- объяснены
- объясняя
- Объясняет
- дополнительно
- семья
- быстрее
- FB
- Fibonacci
- поле
- заполнять
- конец
- следует
- Что касается
- Бывший
- 4
- от
- функция
- далее
- порождать
- порождающий
- поколение
- поколения
- получить
- GitHub
- предоставлять
- большой
- Рост
- было
- обрабатывать
- Есть
- имеющий
- помощь
- помогает
- следовательно
- Однако
- HTTPS
- if
- улучшать
- in
- В других
- включают
- первоначально
- инновационный
- вход
- вместо
- вопрос
- IT
- ЕГО
- Java
- JavaScript
- Играя
- JPG
- июль
- всего
- язык
- Языки
- большой
- больше
- крупнейших
- Задержка
- изучение
- Lets
- Лицензия
- такое как
- линия
- линий
- Лама
- дольше
- машина
- обучение с помощью машины
- сделать
- Создание
- многих
- Май..
- Медиа
- Мета
- Microsoft
- может быть
- миллиона
- отсутствующий
- модель
- Модели
- ежемесячно
- БОЛЕЕ
- в основном
- должен
- имя
- натуральный
- Естественный язык
- Новые
- отметил,
- отметив,
- случайный
- of
- .
- on
- ONE
- открытый
- с открытым исходным кодом
- OpenAI
- операционный
- or
- Другое
- Превосходит
- выходной
- собственный
- параметры
- паттеранами
- производительность
- PHP
- Платформы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- пунктов
- потенциал
- производит
- производительность
- прародитель
- Программисты
- Программирование
- Программы
- обеспечивать
- положил
- Питон
- Запросы
- скорее
- RE
- Red
- Связанный
- выпустил
- соответствующие
- запросить
- Реагируйте
- ответ
- ответственный
- Итоги
- Бунт
- рисках,
- надежный
- грубо
- Run
- Бег
- s
- безопасный
- безопаснее
- Сохранность
- Сказал
- то же
- сообщили
- говорит
- Сценарии
- Поиск
- продажа
- Последовательность
- обслуживание
- Услуги
- Размеры
- меньше
- snapchat
- So
- Соцсети
- социальные сети
- социальные медиа-платформы
- Software
- удалось
- Источник
- исходный код
- T
- задачи
- команда
- Технологии
- Telegram
- terms
- Тестирование
- чем
- который
- Ассоциация
- Источник
- их
- Их
- Там.
- они
- этой
- хоть?
- три
- Через
- Четверг
- TikTok
- время
- в
- знак
- Лексемы
- инструментом
- инструменты
- топ
- специалистов
- два
- Машинопись
- под
- отпирает
- использование
- используемый
- пользователей
- через
- Вариант
- различный
- версия
- законопроект
- Путь..
- когда
- , которые
- в то время как
- широко
- Википедия.
- будете
- без
- записывать
- еще
- являетесь
- YouTube
- зефирнет