آینده محاسبات تطبیقی: مرکز داده ترکیبی

گره منبع: 805091

AdobeStock_267083342 (002).jpeg

این پست وبلاگ برگرفته از سخنرانی اصلی سالیل راجه، EVP و GM Xilinx Data Center است که در 24 مارس 2021 در Xilinx Adapt: ​​Data Center ارائه شد. برای دیدن سخنان کلیدی سالیل بر حسب تقاضا، همراه با ارائه‌های عالی توسط کارشناسان صنعت، می‌توانید ثبت نام کنید و محتوا را اینجا ببینید.

پس از تغییر پارادایم ناشی از همه گیری کووید-19، بسیاری از ما همچنان از طریق کنفرانس ویدئویی آنلاین با همکاران خود ملاقات می کنیم. احتمالاً به این فکر نمی‌کنید که چه چیزی برای پخش جریانی همه محتوا و فیدهای جلسات خود لازم است. اما اگر یک اپراتور مرکز داده هستید، احتمالاً در طول سال گذشته زیاد نخوابیده اید و نگران این هستید که چگونه با افزایش بی سابقه همه گیری ترافیک ویدیویی مقابله کنید.

نه تنها این، بلکه مراکز داده این روزها باید با انفجار داده‌های بدون ساختار از طیف گسترده‌ای از حجم‌های کاری مانند کنفرانس ویدیویی، محتوای جریانی، بازی آنلاین و تجارت الکترونیک مقابله کنند. بسیاری از این برنامه ها به تأخیر بسیار حساس هستند و همچنین تابع استانداردهای در حال تکامل برای فشرده سازی، رمزگذاری و معماری پایگاه داده هستند.

این امر مراکز داده را مجبور کرده است که زیرساخت های خود را برای برآورده کردن الزامات عملکرد و تأخیر در انواع بارهای کاری سخت و در عین حال تلاش برای به حداقل رساندن هزینه و مصرف انرژی افزایش دهند. ثابت شده است که این بسیار دشوار است و اپراتورهای مرکز داده را وادار می کند تا در معماری فعلی خود تجدید نظر کنند و پیکربندی های جدیدی را کشف کنند که ذاتا مقیاس پذیرتر و کارآمدتر هستند.

در حال حاضر، اکثر مراکز داده دارای رک هایی با مجموعه های ثابت منابع هستند که SSD ها، CPU ها و شتاب دهنده ها را در یک سرور واحد ترکیب می کنند. در حالی که این امر یک اتصال پهنای باند بالا بین محاسبات و ذخیره سازی را تضمین می کند، از نظر استفاده از منابع بسیار ناکارآمد است، زیرا یک نسبت ثابت ذخیره سازی و محاسبه در هر سرور وجود دارد. از آنجایی که بارهای کاری به ترکیب متفاوتی از محاسبات و ذخیره سازی نیاز دارند، جزیره هایی از منابع استفاده نشده در هر سرور باقی می مانند.

زیرساخت قابل ترکیب

معماری جدیدی در حال ظهور است که نویدبخش بهبود چشمگیر در استفاده از منابع است. آن را به عنوان "زیرساخت های قابل ترکیب" می شناسند. زیرساخت های قابل ترکیب مستلزم آن است جدا کردن منابع و در عوض آنها را با هم ترکیب کرده و آنها را از هر جایی در دسترس قرار دهید. زیرساخت های قابل ترکیب، فراهم کردن بارهای کاری را فقط با مقدار مناسب منابع و پیکربندی مجدد سریع از طریق نرم افزار امکان پذیر می کند.

یک معماری ترکیب‌پذیر با مجموعه‌ای از CPU، SSDS و شتاب‌دهنده‌هایی که با هم شبکه شده‌اند و توسط یک چارچوب تدارکات مبتنی بر استاندارد کنترل می‌شوند، کارایی منابع مرکز داده را به‌شدت بهبود می‌بخشد. در چنین معماری، بارهای کاری مختلف ممکن است نیازهای محاسباتی، ذخیره سازی و شتاب متفاوتی داشته باشند، و این منابع بر این اساس بدون سخت افزار هدر رفته تخصیص داده می شوند. همه اینها در تئوری عالی به نظر می رسد، اما در عمل، یک مسئله بزرگ وجود دارد: تأخیر.

چالش تاخیر

همانطور که منابع را تفکیک می کنید و آنها را از هم دورتر می کنید، به دلیل ترافیک شبکه بین CPU و SSD یا بین CPU و شتاب دهنده ها، با تاخیر بیشتری مواجه می شوید و پهنای باند کاهش می یابد. مگر اینکه راهی برای کاهش ترافیک شبکه و اتصال منابع به روشی کارآمد داشته باشید، این می تواند به شدت محدود کننده باشد. اینجاست که FPGA ها سه نقش اصلی را در حل چالش تأخیر ایفا می کنند:

  • FPGA ها به عنوان شتاب دهنده های سازگار عمل می کنند که می توانند برای هر بار کاری برای حداکثر کارایی سفارشی شوند. 
  • FPGAها همچنین می‌توانند محاسبات را به داده‌ها نزدیک‌تر کنند و در نتیجه تأخیر را کاهش داده و پهنای باند مورد نیاز را به حداقل برسانند.
  • ساختار سازگار و هوشمند FPGA ها، ادغام کارآمد منابع را بدون ایجاد تأخیر بیش از حد امکان پذیر می کند. 

شتاب قابل تطبیق

اولین مزیت قابل توجه برای شتاب‌دهنده‌های محاسباتی مبتنی بر FPGA، بهبود چشمگیر عملکرد برای بارهای کاری است که این روزها تقاضای زیادی دارند. در موارد استفاده از رمزگذاری ویدیو برای برنامه‌های پخش زنده، راه‌حل‌های FPGA معمولاً 86 برابر از CPUهای x30 بهتر عمل می‌کنند، که به اپراتورهای مرکز داده کمک می‌کند تا با افزایش عظیم تعداد استریم‌های همزمان مواجه شوند. مثال دیگر در زمینه بحرانی توالی یابی ژنومی است. یکی از مشتریان اخیر Xilinx Genomics دریافت که شتاب دهنده مبتنی بر FPGA ما پاسخ را 90 برابر سریعتر از یک CPU ارائه می دهد و به محققان پزشکی کمک می کند تا نمونه های DNA را در کسری از زمانی که یک بار طول می کشید آزمایش کنند.

حرکت محاسبات به داده ها

دومین مزیت کلیدی FPGA ها در یک مرکز داده ترکیبی، توانایی نزدیک کردن محاسبات قابل تطبیق به داده ها، چه در حالت استراحت و چه در حال حرکت است. Xilinx FPGAهای مورد استفاده در دستگاه‌های ذخیره‌سازی محاسباتی SmartSSD عملکردهایی مانند جستجوی پرسرعت، تجزیه، فشرده‌سازی و رمزگذاری را که معمولاً توسط یک CPU انجام می‌شود، تسریع می‌کنند. این به تخلیه CPU برای کارهای پیچیده تر کمک می کند، اما همچنین ترافیک بین CPU و SSD ها را کاهش می دهد، در نتیجه مصرف پهنای باند را کاهش می دهد و تاخیر را کاهش می دهد.

به طور مشابه، FPGA های ما اکنون در SmartNIC ها مانند Alveo SN1000 جدید ما برای سرعت بخشیدن به داده ها در حرکت با پردازش بسته های سیمی، فشرده سازی و خدمات رمزنگاری و همچنین توانایی انطباق با نیازهای سوئیچینگ سفارشی برای یک مرکز داده یا مشتری خاص استفاده می شوند.   

پارچه هوشمند

هنگامی که شتاب محاسباتی قابل تطبیق FPGA را با اتصال کم تأخیر ترکیب می‌کنید، می‌توانید در مرکز داده ترکیبی یک قدم فراتر بروید. می‌توانید حجم کاری سنگین محاسباتی را به دسته‌ای از شتاب‌دهنده‌ها اختصاص دهید که توسط یک پارچه هوشمند سازگار به هم متصل شده‌اند - ایجاد یک رایانه با کارایی بالا در صورت تقاضا.

البته، اگر نتوانید شتاب‌دهنده‌های محاسباتی، SmartSSD و SmartNIC‌ها را با الگوریتم‌های شتاب بهینه برنامه‌ریزی کنید و سپس آن‌ها را با اعداد مناسب برای هر بار کاری تهیه کنید، هیچ‌یک از اینها ممکن نیست. برای این کار، ما یک پشته نرم‌افزار جامع ساخته‌ایم که از چارچوب‌های صنعتی خاص دامنه مانند TensorFlow و FFMPEG استفاده می‌کند که در ارتباط با پلتفرم توسعه Vitis ما کار می‌کنند. ما همچنین نقشی برای چارچوب‌های تدارکات سطح بالاتر مانند RedFish برای کمک به تخصیص منابع هوشمند می‌بینیم.

آینده اکنون است

وعده مرکز داده ترکیبی یک تغییر هیجان‌انگیز است و دستگاه‌های Xilinx و کارت‌های شتاب بلوک‌های کلیدی این معماری کارآمد جدید هستند. Xilinx با قابلیت پیکربندی مجدد سریع، تأخیر کم و معماری انعطاف‌پذیری که می‌تواند خود را با بارهای کاری در حال تغییر سازگار کند، موقعیت خوبی برای تبدیل شدن به یک بازیگر اصلی در این تکامل دارد.

منبع: https://forums.xilinx.com/t5/Xilinx-Xclusive-Blog/The-Future-of-Adaptive-Computing-The-Composable-Data-Center/ba-p/1221927

تمبر زمان:

بیشتر از xlnx