Чому організації переходять від OpenAI до точно налаштованих моделей з відкритим вихідним кодом - DATAVERSITY

Чому організації переходять від OpenAI до точно налаштованих моделей з відкритим вихідним кодом – DATAVERSITY

Вихідний вузол: 3081727

У генеративному штучному інтелекті, що швидко розвивається, OpenAI зробив революцію в тому, як розробники створюють прототипи, створюють демонстрації та досягають чудових результатів за допомогою великі мовні моделі (LLM). Однак, коли настає час запускати LLM у виробництво, організації все більше відходять від комерційних LLM, таких як OpenAI, на користь точно налаштованих моделей з відкритим кодом. Що зумовило цей зсув і чому розробники приймають його?

Основні мотиви прості: 1. ефективність і 2. уникнення прив’язки до постачальника, одночасно зберігаючи інтелектуальну власність, пов’язану як з даними, так і з моделями. Моделі з відкритим кодом, такі як Llama2 і Mistral, тепер відповідають, а в деяких випадках навіть перевершують комерційні LLM за продуктивністю, водночас вони можуть похвалитися значно меншим розміром. Перехід до моделей з відкритим вихідним кодом не тільки забезпечує значну економію коштів, але й надає розробникам більший контроль і нагляд за своїми моделями.

Захист інтелектуальної власності та уникнення блокування постачальника

Для більшості організацій комерційні LLM є чорною скринькою, оскільки вони не надають доступу до вихідного коду моделі або можливості експортувати артефакти моделі. Покладатися виключно на моделі чорної скриньки, доступні через API, більше не ідеально для критично важливих і комерційних програм. Організації повинні визначити володіння моделлю та відрізняти свій продукт від конкурентів, зберігаючи інтелектуальну власність на штучний інтелект та дані. Згідно з нещодавнім опитуванням, проведеним моєю компанією, три чверті респондентів не хотіли б використовувати комерційний LLM у виробництві. Ці респонденти назвали право власності, конфіденційність і вартість їх основними проблемами.

Забезпечення відповідності та конфіденційності залишається першорядним, і розробники стикаються з проблемою перевірки того, що дані кінцевого користувача захищені від зловмисників, коли вони передаються в систему «чорних скриньок». Крім того, залежність від сторонніх платформ викликає занепокоєння щодо затримки та підтримки угод про рівень обслуговування виробничого рівня для комерційних програм (SLA). Нарешті, бізнес-лідери все більше бачать AI як основу своєї інтелектуальної власності, і вони все частіше бачать індивідуальні моделі з власними даними як ключову відмінність, яка виділить їх серед конкурентів. Простіше кажучи, підприємства більше не задоволені ідеєю довірити інтелектуальну власність третій стороні та бути лише тонким шаром над чужим API.

Спеціалізовані моделі: продуктивність і економічна ефективність

Колись моделі з відкритим вихідним кодом, які вважалися непродуктивними, зазнали чудової трансформації завдяки тонкому налаштуванню, і тепер вони постають як потужні суперники. Досконалі моделі з відкритим вихідним кодом тепер відповідають, якщо не перевищують, комерційним моделям. рівень продуктивності, зберігаючи при цьому значно меншу площу. 

Результати наших недавніх експериментів: тонко налаштовані, менші LLM для конкретних завдань перевершують альтернативи від комерційних постачальників.

Це являє собою величезну можливість, оскільки виробництво великих комерційних LLM спричинило труднощі для багатьох організацій через розмір LLM та пов’язані з цим витрати. Використовуючи точно налаштовані моделі, розробники можуть досягти відмінних результатів, маючи справу з моделями, які на два-три порядки менші за комерційні аналоги, а отже, значно дешевші та швидші. 

Розглянемо випадок організації, яка використовує LLM для обробки сотень тисяч повідомлень від працівників на першій лінії. Організація може зменшити свої витрати, використовуючи тонко налаштовану модель, а не масштабний LLM. Здатність досягати вражаючих результатів за невелику частку витрат робить тонке налаштування привабливим варіантом для організацій, які прагнуть оптимізувати свої впровадження ШІ.

Висновок

Перехід від OpenAI до моделей з відкритим кодом є наступним етапом для компаній, які прагнуть зберегти право власності на свою інформацію та моделі, гарантувати недоторканність приватного життя, і уникайте блокування постачальника. Моделі з відкритим вихідним кодом, оскільки вони продовжують розвиватися, пропонують привабливу альтернативу для розробників, які прагнуть запровадити штучний інтелект у виробничих середовищах. В епоху спеціального штучного інтелекту спеціалізовані моделі не тільки забезпечують оптимальну продуктивність, але й сприяють значному зниженню витрат, вказуючи на світле майбутнє.

Однак залишаються проблеми щодо спрощення процесу тонкого налаштування та керування ним, створення надійної виробничої інфраструктури та забезпечення якості, надійності, безпеки та етики програм ШІ. Щоб вирішити ці проблеми, інноваційні платформи пропонують декларативні рішення, які допомагають організаціям створювати спеціальні додатки ШІ. Забезпечуючи прості у використанні можливості тонкого налаштування та готову до виробництва інфраструктуру, ці платформи дають організаціям можливість розкрити величезний потенціал моделей з відкритим кодом, зберігаючи максимальний контроль і досягаючи оптимальної продуктивності.

Часова мітка:

Більше від ПЕРЕДАЧА