Dolly 2.0: Ticari Kullanım için ChatGPT Açık Kaynak Alternatifi

Dolly 2.0: Ticari Kullanım için ChatGPT Açık Kaynak Alternatifi

Kaynak Düğüm: 2599440

Dolly 2.0: Ticari Kullanım için ChatGPT Açık Kaynak Alternatifi
Yazardan Resim | Bing Görüntü Oluşturucu
 

Bebek 2.0 insan tarafından oluşturulan bir veri kümesi üzerinde ince ayar yapılmış, açık kaynaklı, talimatların takip edildiği, büyük bir dil modelidir (LLM). Hem araştırma hem de ticari amaçlarla kullanılabilir. 

 

Dolly 2.0: Ticari Kullanım için ChatGPT Açık Kaynak Alternatifi
Image RamAnanth1 tarafından Sarılma Yüz Alanı
 

Daha önce Databricks ekibi şunları yayınladı: Bebek 1.0, LLM, ChatGPT benzeri talimatları takip etme yeteneği sergiliyor ve eğitim maliyeti 30 dolardan az. Kısıtlı lisans kapsamındaki (Yalnızca Araştırma) Stanford Alpaca ekibinin veri kümesini kullanıyordu. 

Dolly 2.0, 12B parametre dili modeline ince ayar yaparak bu sorunu çözmüştür (Pythia) bir Datbricks çalışanı tarafından etiketlenen aşağıdaki veri kümesinde yüksek kaliteli, insan tarafından oluşturulan bir talimat üzerinde. Hem model hem de veri seti ticari kullanıma uygundur.

Dolly 1.0, OpenAI API kullanılarak oluşturulan Stanford Alpaca veri kümesi üzerinde eğitildi. Veri kümesi, ChatGPT'den gelen çıktıyı içerir ve herhangi birinin OpenAI ile rekabet etmek için onu kullanmasını engeller. Kısacası bu veri setini temel alarak ticari bir chatbot veya dil uygulaması oluşturamazsınız. 

Son birkaç hafta içinde piyasaya sürülen en son modellerin çoğu aynı sorunlardan muzdaripti; Alpaka, Koala, GPT4Tümü, ve Vicuna. Bunu aşmak için ticari kullanım için kullanılabilecek yeni yüksek kaliteli veri kümeleri oluşturmamız gerekiyor ve Databricks ekibinin databricks-dolly-15k veri kümesiyle yaptığı da budur. 

Yeni veri seti, büyük dil modellerini ayarlayan talimatları tasarlamak için kullanılabilecek 15,000 yüksek kaliteli, insan etiketli istem/yanıt çifti içeriyor. databricks-dolly-15k veri seti ile birlikte gelir Creative Commons Atıf-ShareAlike 3.0 Taşınmayan LisansBu, herkesin onu kullanmasına, değiştirmesine ve üzerinde ticari bir uygulama oluşturmasına olanak tanır. 

Databricks-dolly-15k veri kümesini nasıl oluşturdular?

OpenAI araştırması kâğıt orijinal InstructGPT modelinin 13,000 istem ve yanıtla eğitildiğini belirtiyor. Databricks ekibi bu bilgiyi kullanarak bunun üzerinde çalışmaya başladı ve 13 bin soru ve cevap oluşturmanın zor bir iş olduğu ortaya çıktı. Sentetik verileri veya yapay zekanın üretken verilerini kullanamazlar ve her soruya orijinal yanıtlar üretmeleri gerekir. Burası, insanlar tarafından üretilen verileri oluşturmak için 5,000 Databricks çalışanını kullanmaya karar verdikleri yer. 

Databricks, en iyi 20 etiketleyicinin büyük bir ödül alacağı bir yarışma düzenledi. Bu yarışmaya LLM'lere büyük ilgi duyan 5,000 Databricks çalışanı katıldı

Dolly-v2-12b son teknoloji ürünü bir model değildir. Bazı değerlendirme kriterlerinde Dolly-v1-6b'den daha düşük performans gösteriyor. Bunun nedeni, temeldeki ince ayar veri kümelerinin bileşimi ve boyutundan kaynaklanıyor olabilir. Dolly model ailesi aktif olarak geliştirilme aşamasında olduğundan gelecekte daha iyi performansa sahip güncellenmiş bir sürüm görebilirsiniz.  

Kısacası, Dolly-v2-12b modeli EleutherAI/gpt-neox-20b ve EleutherAI/pythia-6.9b'den daha iyi performans gösterdi.

 

Dolly 2.0: Ticari Kullanım için ChatGPT Açık Kaynak Alternatifi
Image Ücretsiz Dolly

Dolly 2.0 %100 açık kaynaktır. Eğitim kodu, veri kümesi, model ağırlıkları ve çıkarım hattıyla birlikte gelir. Bileşenlerin tamamı ticari kullanıma uygundur. Modeli Hugging Face Spaces üzerinde deneyebilirsiniz. Dolly V2 RamAnanth1 tarafından.

 

Dolly 2.0: Ticari Kullanım için ChatGPT Açık Kaynak Alternatifi
Image Sarılma Yüz
 

Kaynak: 

Dolly 2.0 Demosu: Dolly V2 RamAnanth1 tarafından
 
 
Abid Ali Avan (@1abidaliwan), makine öğrenimi modelleri oluşturmayı seven sertifikalı bir veri bilimcisi uzmanıdır. Şu anda, makine öğrenimi ve veri bilimi teknolojileri üzerine içerik oluşturmaya ve teknik bloglar yazmaya odaklanıyor. Abid, Teknoloji Yönetimi alanında yüksek lisans ve Telekomünikasyon Mühendisliği alanında lisans derecesine sahiptir. Vizyonu, akıl hastalığı ile mücadele eden öğrenciler için bir grafik sinir ağı kullanarak bir AI ürünü oluşturmaktır.
 

Zaman Damgası:

Den fazla KDNuggets