Yazardan Resim | Bing Görüntü Oluşturucu
Bebek 2.0 insan tarafından oluşturulan bir veri kümesi üzerinde ince ayar yapılmış, açık kaynaklı, talimatların takip edildiği, büyük bir dil modelidir (LLM). Hem araştırma hem de ticari amaçlarla kullanılabilir.
Image RamAnanth1 tarafından Sarılma Yüz Alanı
Daha önce Databricks ekibi şunları yayınladı: Bebek 1.0, LLM, ChatGPT benzeri talimatları takip etme yeteneği sergiliyor ve eğitim maliyeti 30 dolardan az. Kısıtlı lisans kapsamındaki (Yalnızca Araştırma) Stanford Alpaca ekibinin veri kümesini kullanıyordu.
Dolly 2.0, 12B parametre dili modeline ince ayar yaparak bu sorunu çözmüştür (Pythia) bir Datbricks çalışanı tarafından etiketlenen aşağıdaki veri kümesinde yüksek kaliteli, insan tarafından oluşturulan bir talimat üzerinde. Hem model hem de veri seti ticari kullanıma uygundur.
Dolly 1.0, OpenAI API kullanılarak oluşturulan Stanford Alpaca veri kümesi üzerinde eğitildi. Veri kümesi, ChatGPT'den gelen çıktıyı içerir ve herhangi birinin OpenAI ile rekabet etmek için onu kullanmasını engeller. Kısacası bu veri setini temel alarak ticari bir chatbot veya dil uygulaması oluşturamazsınız.
Son birkaç hafta içinde piyasaya sürülen en son modellerin çoğu aynı sorunlardan muzdaripti; Alpaka, Koala, GPT4Tümü, ve Vicuna. Bunu aşmak için ticari kullanım için kullanılabilecek yeni yüksek kaliteli veri kümeleri oluşturmamız gerekiyor ve Databricks ekibinin databricks-dolly-15k veri kümesiyle yaptığı da budur.
Yeni veri seti, büyük dil modellerini ayarlayan talimatları tasarlamak için kullanılabilecek 15,000 yüksek kaliteli, insan etiketli istem/yanıt çifti içeriyor. databricks-dolly-15k veri seti ile birlikte gelir Creative Commons Atıf-ShareAlike 3.0 Taşınmayan LisansBu, herkesin onu kullanmasına, değiştirmesine ve üzerinde ticari bir uygulama oluşturmasına olanak tanır.
Databricks-dolly-15k veri kümesini nasıl oluşturdular?
OpenAI araştırması kâğıt orijinal InstructGPT modelinin 13,000 istem ve yanıtla eğitildiğini belirtiyor. Databricks ekibi bu bilgiyi kullanarak bunun üzerinde çalışmaya başladı ve 13 bin soru ve cevap oluşturmanın zor bir iş olduğu ortaya çıktı. Sentetik verileri veya yapay zekanın üretken verilerini kullanamazlar ve her soruya orijinal yanıtlar üretmeleri gerekir. Burası, insanlar tarafından üretilen verileri oluşturmak için 5,000 Databricks çalışanını kullanmaya karar verdikleri yer.
Databricks, en iyi 20 etiketleyicinin büyük bir ödül alacağı bir yarışma düzenledi. Bu yarışmaya LLM'lere büyük ilgi duyan 5,000 Databricks çalışanı katıldı
Dolly-v2-12b son teknoloji ürünü bir model değildir. Bazı değerlendirme kriterlerinde Dolly-v1-6b'den daha düşük performans gösteriyor. Bunun nedeni, temeldeki ince ayar veri kümelerinin bileşimi ve boyutundan kaynaklanıyor olabilir. Dolly model ailesi aktif olarak geliştirilme aşamasında olduğundan gelecekte daha iyi performansa sahip güncellenmiş bir sürüm görebilirsiniz.
Kısacası, Dolly-v2-12b modeli EleutherAI/gpt-neox-20b ve EleutherAI/pythia-6.9b'den daha iyi performans gösterdi.
Image Ücretsiz Dolly
Dolly 2.0 %100 açık kaynaktır. Eğitim kodu, veri kümesi, model ağırlıkları ve çıkarım hattıyla birlikte gelir. Bileşenlerin tamamı ticari kullanıma uygundur. Modeli Hugging Face Spaces üzerinde deneyebilirsiniz. Dolly V2 RamAnanth1 tarafından.
Image Sarılma Yüz
Kaynak:
Dolly 2.0 Demosu: Dolly V2 RamAnanth1 tarafından
Abid Ali Avan (@1abidaliwan), makine öğrenimi modelleri oluşturmayı seven sertifikalı bir veri bilimcisi uzmanıdır. Şu anda, makine öğrenimi ve veri bilimi teknolojileri üzerine içerik oluşturmaya ve teknik bloglar yazmaya odaklanıyor. Abid, Teknoloji Yönetimi alanında yüksek lisans ve Telekomünikasyon Mühendisliği alanında lisans derecesine sahiptir. Vizyonu, akıl hastalığı ile mücadele eden öğrenciler için bir grafik sinir ağı kullanarak bir AI ürünü oluşturmaktır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. Buradan Erişin.
- Adryenn Ashley ile Geleceği Basmak. Buradan Erişin.
- Kaynak: https://www.kdnuggets.com/2023/04/dolly-20-chatgpt-open-source-alternative-commercial.html?utm_source=rss&utm_medium=rss&utm_campaign=dolly-2-0-chatgpt-open-source-alternative-for-commercial-use
- :vardır
- :dır-dir
- :olumsuzluk
- $UP
- 000
- 1
- 20
- a
- kabiliyet
- aktif
- AI
- Türkiye
- veriyor
- alternatif
- an
- ve
- cevaplar
- kimse
- api
- Uygulama
- ARE
- etrafında
- yazar
- mevcut
- ödül
- merkezli
- BE
- kriterler
- Berkeley
- Daha iyi
- Büyük
- Bing
- birisinde
- her ikisi de
- inşa etmek
- bina
- by
- CAN
- yapamam
- Onaylı
- chatbot
- ChatGPT
- kod
- ticari
- Avam
- yarışmak
- bileşenler
- içeren
- içerik
- içerik yaratımı
- yarışma
- maliyetler
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- oluşturma
- Şu anda
- veri
- veri bilimi
- veri bilimcisi
- veri tuğlaları
- veri kümeleri
- karar
- derece
- Gösteri
- Dizayn
- gelişme
- DID
- zor
- bebek
- Işçi
- çalışanların
- Mühendislik
- değerlendirme
- Her
- sergileyen
- Yüz
- aile
- az
- odaklanma
- takip etme
- İçin
- itibaren
- gelecek
- oluşturmak
- üreten
- üretken
- almak
- grafik
- Grafik Sinir Ağı
- Var
- he
- Yüksek kaliteli
- tutar
- HTML
- HTTPS
- hastalık
- görüntü
- in
- bilgi
- ilgili
- konu
- sorunlar
- IT
- jpg
- KDNuggets
- dil
- büyük
- Soyad
- son
- öğrenme
- Lisans
- sevmek
- makine
- makine öğrenme
- yönetim
- usta
- zihinsel
- Zihinsel hastalık
- olabilir
- model
- modelleri
- değiştirmek
- gerek
- ağ
- sinirsel
- sinir ağı
- yeni
- of
- on
- bir tek
- açık
- açık kaynak
- OpenAI
- or
- orijinal
- çıktı
- çiftleri
- parametre
- katıldı
- performans
- boru hattı
- Platon
- Plato Veri Zekası
- PlatoVeri
- PLATFORM
- profesyonel
- amaçlı
- soru
- Sorular
- serbest
- araştırma
- çözüldü
- kısıtlı
- s
- aynı
- Bilim
- bilim adamı
- set
- kısa
- beden
- So
- biraz
- Kaynak
- uzay
- alanlarda
- stanford
- başladı
- state-of-the-art
- Devletler
- Mücadele
- Öğrenciler
- uygun
- sentetik
- sentetik veri
- Görev
- takım
- Teknik
- Teknolojileri
- Teknoloji
- telekomünikasyon
- göre
- o
- The
- Gelecek
- onlar
- Re-Tweet
- için
- üst
- Tren
- eğitilmiş
- Eğitim
- altında
- altında yatan
- güncellenmiş
- kullanım
- Kullanılmış
- kullanma
- versiyon
- vizyonumuz
- oldu
- we
- Haftalar
- vardı
- Ne
- hangi
- DSÖ
- ile
- İş
- olur
- yazı yazıyor
- sen
- zefirnet