Neden Tek Başına Kullanılan Yüksek Lisanslar Şirketinizin Tahmini İhtiyaçlarını Karşılayamıyor - KDnuggets

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Sponsor İçerik

Büyük dil modellerine (LLM'ler) dayalı ChatGPT ve benzeri araçlar harikadır. Ancak bunlar çok amaçlı araçlar değildir.

Tıpkı inşa etmek ve yaratmak için diğer araçları seçmek gibidir. İş için doğru olanı seçmelisiniz. Çekiçle bir cıvatayı sıkmaya veya çırpma teli ile hamburger köftesini çevirmeye çalışmazsınız. Süreç karmaşık bir başarısızlıkla sonuçlanacak şekilde garip olacaktır.

Yüksek Lisans gibi dil modelleri, hem üretken yapay zekayı hem de tahmine dayalı yapay zekayı kapsayan daha geniş makine öğrenimi araç setinin yalnızca bir bölümünü oluşturur. Görevinizin gereksinimlerine uyum sağlamak için doğru makine öğrenimi modeli türünü seçmek çok önemlidir.

Yüksek Lisans'ların neden işletmenizin en kritik tahmine dayalı modelleme görevleriyle uğraşmak yerine metin taslağı hazırlamanıza veya hediye fikirleri üzerine beyin fırtınası yapmanıza yardımcı olmak için daha uygun olduğunu daha derinlemesine inceleyelim. Yüksek Lisans'lardan önce gelen ve işletmelerde değerini defalarca kanıtlayan "geleneksel" makine öğrenimi modellerinin hâlâ hayati bir rolü var. Ayrıca bu araçları birlikte kullanmaya yönelik öncü bir yaklaşımı da keşfedeceğiz; Pecan olarak bunu heyecan verici bir gelişme olarak adlandırıyoruz. Tahmine Dayalı GenAI.

Yüksek Lisans'lar sayılar için değil kelimeler için tasarlanmıştır

Makine öğreniminde, "eğitim verileri" olarak bilinen verileri analiz etmek için farklı matematiksel yöntemler kullanılır; bu, bir veri analistinin veya veri bilimcinin çözmeyi umduğu sorunu temsil eden bir başlangıç veri kümesidir.

Eğitim verilerinin önemi abartılamaz. Bir makine öğrenimi modelinin daha sonra yeni, görünmeyen veriler verildiğinde sonuçları tahmin etmek için "öğreneceği" kalıpları ve ilişkileri içinde tutar.

Peki, LLM özellikle nedir? Büyük Dil Modelleri veya LLM'ler, makine öğreniminin şemsiyesi altına girer. Derin öğrenmeden kaynaklanırlar ve yapıları özellikle doğal dil işleme için geliştirilmiştir.

Kelimelerden oluşan bir temel üzerine inşa edildiklerini söyleyebilirsiniz. Amaçları basitçe bir kelime dizisinde bir sonraki kelimenin hangi kelime olacağını tahmin etmektir. Örneğin, iOS 17'deki iPhone'ların otomatik düzeltme özelliği, bir sonraki adımda büyük olasılıkla hangi kelimeyi yazmayı planladığınızı daha iyi tahmin etmek için artık bir LLM kullanıyor.

Yüksek Lisans ve Geleneksel Makine Öğreniminin Güçlü Yönleri

Şimdi bir makine öğrenimi modeli olduğunuzu hayal edin. (Bize sabırlı olun, bunun biraz zor olduğunu biliyoruz.) Kelimeleri tahmin etmek için eğitildiniz. Her türlü konu hakkında geniş bir kaynak yelpazesinden milyonlarca kelimeyi okudunuz ve çalıştınız. Akıl hocalarınız (diğer adıyla geliştiriciler), kelimeleri tahmin etmenin ve kullanıcının isteğine uygun yeni metin oluşturmanın en iyi yollarını öğrenmenize yardımcı oldu.

Ama burada bir değişiklik var. Artık bir kullanıcı size milyonlarca satırlık sayılardan oluşan devasa bir müşteri ve işlem verileri elektronik tablosu veriyor ve sizden bu mevcut verilerle ilgili sayıları tahmin etmenizi istiyor.

Tahminlerinizin nasıl sonuçlanacağını düşünüyorsunuz? İlk olarak, muhtemelen bu görevin öğrenmek için bu kadar çok çalıştığınız şeyle eşleşmemesinden rahatsız olursunuz. (Neyse ki, bildiğimiz kadarıyla yüksek lisans öğrencilerinin henüz duyguları yok.) Daha da önemlisi sizden, yapmayı öğrendiklerinizle eşleşmeyen bir görev yapmanız isteniyor. Ve muhtemelen o kadar iyi performans göstermeyeceksin.

Eğitim ve görev arasındaki boşluk, LLM'lerin neden çoğu işletmenin topladığı birincil veri formatı olan sayısal, tablosal verileri içeren tahmine dayalı görevler için pek uygun olmadığını açıklamaya yardımcı olur. Bunun yerine, bu tür verileri işlemek için özel olarak hazırlanmış ve ince ayar yapılmış bir makine öğrenimi modeli daha etkilidir. Kelimenin tam anlamıyla bunun için eğitildi.

Yüksek Lisans'ın verimlilik ve optimizasyon zorlukları

Geleneksel makine öğrenimi yöntemleri, sayısal veriler için daha iyi bir eşleşme olmasının yanı sıra, LLM'lerden çok daha verimlidir ve daha iyi performans için optimize edilmesi daha kolaydır.

Yüksek Lisans'ı taklit etme deneyiminize geri dönelim. Tüm bu kelimeleri okumak, tarzları ve sıraları üzerinde çalışmak çok fazla iş gibi geliyor, değil mi? Tüm bu bilgileri içselleştirmek çok çaba gerektirecektir.

Benzer şekilde, Yüksek Lisans'ın karmaşık eğitimi milyarlarca parametreli modellerle sonuçlanabilir. Bu karmaşıklık, bu modellerin insan dilinin zorlu nüanslarını anlamasına ve bunlara yanıt vermesine olanak tanır. Bununla birlikte, ağır hizmet eğitimi, LLM'ler yanıtlar ürettiğinde ağır iş hesaplama taleplerini de beraberinde getirir. Karar ağaçları veya sinir ağları gibi sayısal odaklı "geleneksel" makine öğrenimi algoritmaları muhtemelen çok daha az bilgi işlem kaynağına ihtiyaç duyacaktır. Ve bu "daha büyük olan daha iyidir" durumu değil. Yüksek Lisans'lar sayısal verileri işleyebilse bile bu fark, geleneksel makine öğrenimi yöntemlerinin hâlâ daha hızlı, daha verimli, çevresel açıdan daha sürdürülebilir ve daha uygun maliyetli olacağı anlamına gelecektir.

Ek olarak, ChatGPT'ye belirli bir yanıt vermeyi nasıl bildiğini hiç sordunuz mu? Cevabı muhtemelen biraz belirsiz olacaktır:

Lisanslı veriler, insan eğitmenleri tarafından oluşturulan veriler ve kamuya açık verilerin bir karışımına dayanarak yanıtlar oluşturuyorum. Eğitimim ayrıca insan diline ilişkin geniş kapsamlı bir anlayış geliştirmek için kitaplar, web siteleri ve diğer metinler dahil olmak üzere çeşitli kaynaklardan elde edilen büyük ölçekli veri kümelerini de içeriyordu. Eğitim süreci, haftalar veya aylar boyunca binlerce GPU üzerinde hesaplamaların yürütülmesini içerir, ancak kesin ayrıntılar ve zaman çizelgeleri OpenAI'nin mülkiyetindedir.

Bu yanıta yansıyan "bilginin" ne kadarı insan eğitmenlerinden, ne kadarı kamuya açık verilerden ve kitaplardan geldi? ChatGPT'nin kendisi bile emin değil: "Bu kaynakların göreceli oranları bilinmiyor ve hangi belirli belgelerin eğitim setimin parçası olduğuna ilişkin ayrıntılı görünürlüğe sahip değilim."

ChatGPT'nin sorularınıza bu kadar kendinden emin yanıtlar vermesi ancak yanıtlarını belirli kaynaklara göre izleyememesi biraz sinir bozucu. Yüksek Lisans'ların sınırlı yorumlanabilirliği ve açıklanabilirliği, bunların belirli iş ihtiyaçları için optimize edilmesinde de zorluklar doğurmaktadır. Verdikleri bilgilerin veya tahminlerin ardındaki mantığı anlamak zor olabilir. İşleri daha da karmaşık hale getiren bazı işletmeler, bir modelin tahminlerini etkileyen faktörleri açıklayabilmeleri gerektiği anlamına gelen düzenleyici taleplerle mücadele ediyor. Sonuç olarak, bu zorluklar, genellikle daha yorumlanabilir ve açıklanabilir olan geleneksel makine öğrenimi modellerinin iş kullanım durumları için muhtemelen daha uygun olduğunu göstermektedir.

İşletmelerin tahmine dayalı araç setinde Yüksek Lisans için doğru yer

Öyleyse, Yüksek Lisans'ları kelimeyle ilgili görevlerine bırakıp tahmine dayalı kullanım senaryoları için onları unutmalı mıyız? Artık müşteri kaybını veya müşteri yaşam boyu değerini tahmin etmede yardımcı olamayacaklar gibi görünebilir.

Olay şu: "Geleneksel makine öğrenimi modelleri" demek bu tekniklerin geniş çapta anlaşılmasını ve kullanımının kolay olmasını sağlarken, Pecan'daki deneyimimizden biliyoruz ki işletmeler hâlâ bu daha tanıdık yapay zeka biçimlerini bile benimsemekte büyük ölçüde zorlanıyor.

Kuzey Amerika'daki şirketlerin %42'si yapay zekayı hiç kullanmaya başlamadı veya seçeneklerini araştırmaya yeni başlıyor.

Workday tarafından yapılan son araştırma, Kuzey Amerika'daki şirketlerin %42'sinin ya yapay zeka kullanımına başlamadığını ya da seçeneklerini keşfetmenin henüz erken aşamalarında olduğunu ortaya koyuyor. Makine öğrenimi araçlarının şirketler için daha erişilebilir hale gelmesinin üzerinden on yıldan fazla zaman geçti. Zamanları vardı ve çeşitli araçlar mevcuttu.

Bazı nedenlerden dolayı, başarılı yapay zeka uygulamaları, veri bilimi ve yapay zeka konusundaki yoğun ilgiye ve bunların iş üzerinde önemli etkiler yarattığı kabul edilen potansiyele rağmen şaşırtıcı derecede nadirdir. Yapay zekanın verdiği sözler ile bunu verimli bir şekilde uygulama yeteneği arasındaki boşluğu doldurmaya yardımcı olacak bazı önemli mekanizmalar eksik.

İşte tam da bu noktada Yüksek Lisans'ın artık hayati bir köprü rolü oynayabileceğine inanıyoruz. Yüksek Lisans, iş kullanıcılarının çözülmesi gereken bir iş problemini tanımlama ile tahmine dayalı bir model geliştirme arasındaki uçurumu aşmalarına yardımcı olabilir.

Artık Yüksek Lisans'ların (LLM) ortaya çıkmasıyla, makine öğrenimi modellerini elle kodlama becerisine veya kapasitesine sahip olmayan iş ve veri ekipleri artık ihtiyaçlarını modellere daha iyi çevirebilir. Modelleme sürecini başlatmak için ebeveynlerin deyimiyle “kendi sözlerini” kullanabilirler.

Yüksek Lisans'ları iş verileri üzerinde üstünlük sağlamak için oluşturulmuş makine öğrenimi teknikleriyle birleştirmek

Bu yetenek artık Pecan'ın LLM'lerin güçlü yanlarını zaten oldukça gelişmiş ve otomatikleştirilmiş makine öğrenimi platformumuzla birleştiren Predictive GenAI'ye ulaştı. Yüksek Lisans destekli Tahminli Sohbetimiz, tahmine dayalı bir sorunun (kullanıcının bir modelle çözmek istediği spesifik sorun) tanımlanmasına ve geliştirilmesine rehberlik etmek için bir iş kullanıcısından girdi toplar.

Daha sonra platformumuz, GenAI'yi kullanarak modellemeye yönelik bir sonraki adımı daha da kolaylaştırmak için bir Tahmine Dayalı Not Defteri oluşturur. Yine LLM yeteneklerinden yararlanan dizüstü bilgisayar, tahmine dayalı model için eğitim verilerini seçmek üzere önceden doldurulmuş SQL sorguları içerir. Pecan'ın otomatik veri hazırlama, özellik mühendisliği, model oluşturma ve dağıtım yetenekleri, sürecin geri kalanını rekor sürede, diğer tahmine dayalı modelleme çözümlerinden daha hızlı gerçekleştirebilir.

Kısacası, Pecan'ın Predictive GenAI'si, sınıfının en iyisi tahmine dayalı modelleme platformumuzu iş kullanıcıları için çok daha erişilebilir ve kullanıcı dostu hale getirmek için LLM'lerin benzersiz dil becerilerini kullanıyor. Bu yaklaşımın çok daha fazla şirketin yapay zeka konusunda başarılı olmasına nasıl yardımcı olacağını görmekten heyecan duyuyoruz.

Yani, Yüksek Lisans dereceleri tek başına tüm tahmine dayalı ihtiyaçlarınızı karşılamaya pek uygun olmasalar da, yapay zeka projelerinizi ileriye taşımada güçlü bir rol oynayabilirler. Pecan'ın Predictive GenAI'si, kullanım durumunuzu yorumlayarak ve otomatik olarak oluşturulan SQL koduyla size bir avantaj sağlayarak, bu teknolojilerin birleştirilmesine öncülük ediyor. Yapabilirsiniz ücretsiz denemeyle şimdi kontrol edin.