GDDR6, AI/ML Çıkarımı İçin Performans Sağlıyor

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

FİKİR

Çıkarımların veri merkezinden ağ ucuna kayması nedeniyle bellek aktarım hızı ve düşük gecikme süresi kritik öneme sahiptir.

AI/ML ışık hızında gelişiyor. Şu anda bu alanda bazı yeni ve heyecan verici gelişmelerin yaşanmadığı bir hafta bile geçmiyor ve ChatGPT gibi uygulamalar, üretken yapay zeka yeteneklerini kamuoyunun dikkatine sağlam bir şekilde ön plana çıkardı.

AI/ML aslında iki uygulamadır: eğitim ve çıkarım. Her biri bellek performansına dayanır ve her biri, en iyi bellek çözümünün seçimini yönlendiren benzersiz gereksinimlere sahiptir.

Eğitimde bellek bant genişliği ve kapasitesi kritik gereksinimlerdir. Bu, özellikle yılda 10 kat büyüyen sinir ağı veri modellerinin boyutu ve karmaşıklığı göz önüne alındığında böyledir. Sinir ağının doğruluğu, eğitim veri setindeki örneklerin kalitesine ve miktarına bağlıdır; bu da çok büyük miktarda veriye ve dolayısıyla bellek bant genişliğine ve kapasitesine ihtiyaç duyulduğu anlamına gelir.

Eğitim yoluyla yaratılan değer göz önüne alındığında, eğitim çalışmalarının mümkün olan en kısa sürede tamamlanması yönünde güçlü bir teşvik vardır. Eğitim uygulamalarının güç ve alan açısından giderek daha kısıtlı hale gelen veri merkezlerinde çalıştırılması nedeniyle, güç verimliliği ve daha küçük boyut sunan çözümler tercih ediliyor. Tüm bu gereksinimler göz önüne alındığında HBM3, yapay zeka eğitim donanımı için ideal bir bellek çözümüdür. Mükemmel bant genişliği ve kapasite yetenekleri sağlar.

Sinir ağı eğitiminin çıktısı, geniş çapta uygulanabilecek bir çıkarım modelidir. Bu model ile bir çıkarım cihazı, eğitim verilerinin sınırları dışındaki girdileri işleyebilir ve yorumlayabilir. Çıkarım için bellek işlem hızı ve düşük gecikme süresi, özellikle gerçek zamanlı eyleme ihtiyaç duyulduğunda kritik öneme sahiptir. Veri merkezinin kalbinden ağ ucuna giderek daha fazla yapay zeka çıkarımının kaymasıyla birlikte, bu bellek özellikleri daha da kritik hale geliyor.

Tasarımcıların AI/ML çıkarımı için çeşitli bellek seçenekleri vardır, ancak bant genişliği gibi kritik bir parametrede GDDR6 bellek gerçekten parlıyor. Saniyede 24 Gigabit (Gb/s) veri hızında ve 32 bit geniş arayüzde, bir GDDR6 cihazı saniyede 96 Gigabayt (GB/s) bellek bant genişliği sunabilir; bu, herhangi bir alternatif DDR veya LPDDR çözümleri. GDDR6 bellek, özellikle uçta çıkarım için AI/ML çıkarımı için mükemmel bir hız, bant genişliği ve gecikme performansı kombinasyonu sunar.

Rambus GDDR6 bellek arayüzü alt sistemi, 24 Gb/sn'lik performans sunar ve GDDR30'yı yüksek hızlarda çalıştırmak için kritik önem taşıyan, 6 yılı aşkın yüksek hızlı sinyal bütünlüğü ve güç bütünlüğü (SI/PI) uzmanlığının temeli üzerine inşa edilmiştir. Eksiksiz bir GDDR6 bellek arayüzü alt sistemi sağlayan bir PHY ve dijital denetleyiciden oluşur.

Bu ayki Rambus web seminerinde bana katılın:24G GDDR6 Bellek ile Yüksek Performanslı Yapay Zeka/ML Çıkarımı” GDDR6'nın AI/ML çıkarım iş yüklerinin bellek ve performans gereksinimlerini nasıl desteklediğini keşfetmek ve GDDR6 bellek arayüzü alt sistemlerinin bazı temel tasarım ve uygulama hususları hakkında bilgi edinmek için.

Kaynaklar:

Frank Ferro

(tüm gönderiler)
Frank Ferro, Rambus'ta IP çekirdekleri için ürün pazarlamasının kıdemli direktörüdür.

SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
PlatoAiStream. Web3 Veri Zekası. Bilgi Genişletildi. Buradan Erişin.
Adryenn Ashley ile Geleceği Basmak. Buradan Erişin.
PREIPO® ile PRE-IPO Şirketlerinde Hisse Al ve Sat. Buradan Erişin.
Kaynak: https://semiengineering.com/gddr6-delivers-the-performance-for-ai-ml-inference/

Zaman Damgası: Mayıs 15, 2023

Zaman Damgası: Temmuz 12, 2023

GDDR6, AI/ML Çıkarımı İçin Performans Sunar

Plato tarafından yeniden yayınlandı

Frank Ferro

Den fazla Yarı Mühendislik

İnceleme Belgesi: Negatif Kapasitans GAA-FET

Kümeleme Yöntemlerinin 3DIC'ler İçin Bölümleme Kararları Üzerindeki Etkisi (imec, Université libre de Bruxelles)

Beş Dijital İş Parçacığı Elektronik Sistem Tasarımını ve Üretimini Birleştiriyor ve Basitleştiriyor

Araştırma Bitleri: 28 Şubat

Hafif Kriptografi ile IoT Cihazlarının Güvenliğini Sağlama

Veri Merkezlerinde Gücün Azaltılması

Üretim Otomasyonu İçin Yapay Zeka Odaklı İnovasyon

Sürücü Akımını ve Transistör Yoğunluğunu Artırmak İçin Yüksek İstiflenmiş Nanotel FET'ler

Hakkımızda

Dikey Arama ve Ai

Platform

Bağlı Kal

Hesap