مدلهای هوش مصنوعی مولد ممکن است در خوشههای عظیم پردازندههای گرافیکی آموزش ببینند، اما Cloudflare استدلال میکند که مکان واضح برای اجرای آنها فقط در لبه نیست، بلکه در خود شبکه است.
روز چهارشنبه غول تحویل اعلام کرد مجموعهای از خدمات هوش مصنوعی با هدف دور کردن پیچیدگی استقرار و اجرای مدلهای زبان بزرگ (LLM) و دیگر الگوریتمهای یادگیری ماشین (ML) و در عین حال دستیابی به کمترین تأخیر ممکن.
خوب، در واقع، کمترین تأخیر ممکن با اجرای بار کار استنتاج بر روی دستگاه کاربر به دست می آید. اینتل در این مورد معامله بزرگی کرد، ترویج ظهور نسل رایانه های شخصی هوش مصنوعی، هفته گذشته در Intel Innovation. اما در حالی که این ممکن است در برخی موارد منطقی باشد، Cloudflare استدلال می کند که دستگاه های محلی هنوز به اندازه کافی قدرتمند نیستند.
این شبکه را به طلای استنباط تبدیل می کند. خیلی دور نیست، با قدرت محاسباتی کافی - درست است، بیز می نویسد.
بدون سرور برای پردازنده های گرافیکی
مجموعه هوش مصنوعی شامل سه سرویس اصلی است. اولین مورد از این موارد، گسترش پلتفرم Workers بدون سرور برای پشتیبانی از بارهای کاری تسریع شده GPU است. این سرویس که Workers AI نامیده می شود، برای ساده سازی فرآیند استقرار مدل های از پیش آموزش دیده طراحی شده است.
"بدون تخصص یادگیری ماشین، بدون جست و جو برای GPU ها. فقط یکی از مدل های ارائه شده را انتخاب کنید و بروید،" Cloudflare ادعا می کند.
به ما گفته شده است که این پلتفرم روی پردازندههای گرافیکی انویدیا اجرا میشود، اگرچه Cloudflare به ما نمیگوید کدام یکها. در این بیانیه آمده است: «فناوری که Cloudflare ساخته است میتواند یک کار استنتاج را در چندین GPU مختلف تقسیم کند، زیرا ما از زمانبندی و سیستم مراقبت میکنیم و تصمیم خواهیم گرفت که چه تراشه یا چیپهایی برای ارائه آن منطقیتر هستند. ثبت نام در بیانیه ای.
به دلیل سادگی، این پلتفرم - حداقل نه در ابتدا - از مدل های ارائه شده توسط مشتری پشتیبانی نمی کند. به ما گفته شده است که قصد دارد این را در آینده به صورت کاربردی عرضه کند، اما در حال حاضر، به شش مدل از پیش آموزش دیده محدود شده است که شامل موارد زیر است:
- متا Llama 2 7B Int8 برای تولید متن
- M2m100-1.2 متا برای ترجمه
- Whisper OpenAI برای تشخیص گفتار
- Hugging Face's Distilbert-sst-2-int8 برای طبقه بندی متن
- Resnet-50 مایکروسافت برای طبقه بندی تصاویر
- bge-base-en-v1.5 Baai برای جاسازی
با این حال، Cloudflare می گوید که در حال کار برای گسترش این لیست در آینده نزدیک است. مانند بسیاری از امیدواران هوش مصنوعی، این کار را کرده است درخواست شده است کمک Hugging Face برای بهینه سازی مدل های اضافی برای این سرویس.
مشخص نیست که آیا محدودیتی برای اندازه مدل هایی که پلتفرم می تواند پشتیبانی کند وجود دارد یا خیر، اما فهرست اولیه سرنخ هایی را ارائه می دهد. Cloudflare پارامتر هفت میلیاردی متا Llama 2 LLM را در حال اجرا در Int8 در دسترس قرار می دهد که به حدود 7 گیگابایت حافظه GPU نیاز دارد. این شرکت همچنین خاطرنشان می کند که "اگر به دنبال اجرای مدل های صد میلیاردی با پارامتر هستید، ابر متمرکز برای حجم کاری شما مناسب تر خواهد بود."
پس از راهاندازی و اجرا، Cloudflare میگوید که مشتریان میتوانند این سرویس را با استفاده از REST API یا با اتصال آن به صفحه وب سایت Pages خود، در برنامههای خود ادغام کنند.
همه اش رو بذار کنار هم
از آنجایی که Workers AI تنها از استنباط بر روی مدل های از پیش آموزش دیده پشتیبانی می کند، Cloudflare می گوید که یک سرویس پایگاه داده برداری به نام Vectorize را توسعه داده است تا مدل های ML را برای انتقال داده های مشتری به کاربران آسان تر کند.
به عنوان مثال، برای یک ربات چت، یک مشتری ممکن است کاتالوگ محصول خود را در پایگاه داده برداری آپلود کند، که مدل آن را به یک دارایی جاسازی شده تبدیل می کند.
به نظر می رسد ایده این است که، در حالی که مدل Llama 2 ارائه شده توسط Cloudflare ممکن است دانش خاصی از داده های مشتری نداشته باشد، چت ربات همچنان می تواند با اتصال به سرویس پایگاه داده، اطلاعات مربوطه را نشان دهد. با توجه به Cloudflare، این رویکرد می سازد استنتاج در دسترستر، سریعتر و منابع کمتری چون دادههای مشتری را از خود مدل جدا میکند.
در کنار Workers AI و Vectorize، مجموعه هوش مصنوعی Cloudflare همچنین دارای پلتفرمی برای نظارت، بهینهسازی و مدیریت بارهای کاری استنتاج در مقیاس است.
این سرویس که دروازه هوش مصنوعی نامیده میشود، چندین ویژگی را که معمولاً با شبکههای تحویل محتوا و پروکسیهای وب مرتبط هستند، مانند حافظه پنهان و محدود کردن نرخ، برای استنتاج هوش مصنوعی اعمال میکند تا به مشتریان در کنترل هزینهها کمک کند.
این شرکت در پست وبلاگ توضیح میدهد: «با ذخیرهسازی پاسخهای متداول هوش مصنوعی، تأخیر را کاهش میدهد و قابلیت اطمینان سیستم را تقویت میکند، در حالی که محدودیت نرخ تخصیص کارآمد منابع را تضمین میکند و چالشهای ناشی از افزایش هزینههای هوش مصنوعی را کاهش میدهد».
قیمت گذاری و در دسترس بودن
Cloudflare خاطرنشان می کند که این سرویس هنوز در مراحل اولیه استقرار است و امروزه هفت سایت آنلاین است. با این حال، این شرکت در حال استقرار پردازندههای گرافیکی است تا این سرویس را تا پایان سال به 100 نقطه و تا پایان سال 2024 «تقریباً در همه جا» برساند.
در نتیجه، هنوز استقرار برنامههای تولیدی روی Workers AI را توصیه نمیکند و آن را بهعنوان «بتای اولیه» توصیف میکند.
در پست وبلاگ آمده است: «آنچه امروز منتشر کردیم فقط یک پیشنمایش کوچک است تا به شما مزه آنچه را که در راه است بچشید.
طبق معمول، Cloudflare میگوید که در روز اول برای این سرویس صورتحساب نمیشود. با این گفته، انتظار دارد برای هر هزار «نرون منقبض معمولی» حدود یک سنت و برای هر هزار «نرون سریع انقباض» 0.125 دلار دریافت کند. تفاوت بین این دو در این است که مورد دوم نزدیکی به کاربر نهایی را در اولویت قرار می دهد، در حالی که هر دو ارزان تر در هر جایی که Cloudflare ظرفیت اضافی دارد اجرا می شود.
این شرکت توضیح داد که نورون ها راهی برای اندازه گیری خروجی هوش مصنوعی هستند و افزودند که هزار نورون برای حدود 130 پاسخ LLM، 830 طبقه بندی تصویر یا 1,250 جاسازی خوب است.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://go.theregister.com/feed/www.theregister.com/2023/09/28/cloudflare_ai_edge/
- : دارد
- :است
- :نه
- $UP
- 1
- 100
- 125
- 2024
- 250
- a
- درباره ما
- تسریع شد
- در دسترس
- مطابق
- دست
- دستیابی به
- در میان
- واقعا
- اضافه کردن
- اضافی
- AI
- مدل های هوش مصنوعی
- خدمات هوش مصنوعی
- هدف
- الگوریتم
- معرفی
- تخصیص
- همچنین
- an
- و
- هر جا
- رابط های برنامه کاربردی
- ظاهر می شود
- برنامه های کاربردی
- اعمال میشود
- روش
- برنامه های
- هستند
- استدلال می کند
- AS
- دارایی
- مرتبط است
- At
- در دسترس
- دور
- BE
- زیرا
- بتا
- بهتر
- میان
- بزرگ
- صدور صورت حساب
- BIZ
- بلاگ
- تقویت می کند
- به ارمغان بیاورد
- ساخته
- اما
- by
- نام
- CAN
- ظرفیت
- اهميت دادن
- موارد
- کاتالوگ
- درصد
- متمرکز
- چالش ها
- بار
- chatbot
- تراشه
- چیپس
- ادعای
- واضح
- ابر
- CloudFlare را
- CO
- آینده
- شرکت
- پیچیدگی
- شامل
- محاسبه
- محتوا
- کنترل
- تبدیل
- هسته
- هزینه
- مشتری
- اطلاعات مشتری
- مشتریان
- داده ها
- پایگاه داده
- روز
- مقدار
- تصمیم گیری
- ارائه
- تحویل
- استقرار
- گسترش
- طراحی
- توسعه
- دستگاه
- دستگاه ها
- تفاوت
- مختلف
- میکند
- ندارد
- دوبله شده
- در اوایل
- آسان تر
- لبه
- موثر
- جاسازی شده
- پایان
- کافی
- تضمین می کند
- اتر (ETH)
- هر
- در همه جا
- مثال
- مازاد
- گسترش
- انتظار می رود
- گران
- تخصص
- توضیح داده شده
- توضیح می دهد
- گسترش
- چهره
- بسیار
- FAST
- سریعتر
- امکانات
- نام خانوادگی
- برای
- غالبا
- از جانب
- ظاهر
- عملا
- آینده
- دروازه
- نسل
- غول
- دادن
- Go
- رفتن
- خوب
- GPU
- GPU ها
- آیا
- کمک
- اما
- HTTPS
- اندیشه
- if
- تصویر
- in
- شامل
- شامل
- اطلاعات
- اول
- در ابتدا
- ابداع
- ادغام
- اینتل
- علاقه
- به
- نیست
- IT
- ITS
- خود
- JPG
- تنها
- دانش
- نام
- تاخیر
- یادگیری
- کمترین
- کمتر
- اجازه می دهد تا
- پسندیدن
- محدود
- محدود شده
- فهرست
- ll
- پشم لاما
- محلی
- به دنبال
- پایین ترین
- دستگاه
- فراگیری ماشین
- ساخته
- ساخت
- باعث می شود
- ساخت
- مدیریت
- بسیاری
- عظیم
- ممکن است..
- اندازه
- حافظه
- متا
- قدرت
- تسکین دهنده
- ML
- مدل
- مدل
- نظارت بر
- بیش
- اکثر
- متحرک
- چندگانه
- نزدیک
- تقریبا
- شبکه
- شبکه
- نورون ها
- نه
- یادداشت
- اکنون
- کارت گرافیک Nvidia
- واضح
- of
- ارائه
- ارائه شده
- on
- ONE
- آنهایی که
- آنلاین
- فقط
- بهینه سازی
- بهینه سازی
- or
- سفارش
- دیگر
- خارج
- تولید
- صفحات
- پارامتر
- عبور
- PC
- انتخاب کنید
- محل
- برنامه
- سکو
- افلاطون
- هوش داده افلاطون
- PlatoData
- نقطه
- ممکن
- پست
- قدرت
- قوی
- حضور
- پیش نمایش
- اولویت بندی می کند
- روند
- محصول
- تولید
- ارائه
- پروکسی ها
- نرخ
- RE
- توصیه
- را کاهش می دهد
- منظم
- منتشر شد
- مربوط
- قابلیت اطمینان
- نیاز
- منابع
- پاسخ
- REST
- نتیجه
- راست
- طلوع
- نورد
- دویدن
- در حال اجرا
- اجرا می شود
- s
- سعید
- می گوید:
- مقیاس
- زمان بندی
- حس
- بدون سرور
- سرویس
- خدمات
- هفت
- چند
- سادگی
- سایت
- شش
- اندازه
- کوچک
- برخی از
- خاص
- سخنرانی - گفتار
- انشعاب
- مراحل
- بیانیه
- هنوز
- ساده کردن
- کافی
- دنباله
- پشتیبانی
- پشتیبانی از
- سطح
- سیستم
- T
- مصرف
- کار
- طعم
- پیشرفته
- گفتن
- متن
- که
- La
- آینده
- شان
- آنها
- آنجا.
- اینها
- این
- اگر چه؟
- هزار
- سه
- به
- امروز
- گفته شده
- هم
- آموزش دیده
- انقباض
- دو
- به طور معمول
- us
- استفاده
- کاربر
- با استفاده از
- مسیر..
- we
- وب
- سایت اینترنتی
- چهار شنبه
- هفته
- چی
- که
- در حین
- نجوا
- با
- برنده شد
- کارگران
- کارگر
- خواهد بود
- نمی خواست
- سال
- هنوز
- شما
- شما
- زفیرنت