উচ্চ কার্যক্ষমতার জন্য RISC-V 64 বিট আইপি - সেমিউইকি

উচ্চ কার্যক্ষমতার জন্য RISC-V 64 বিট আইপি – সেমিউইকি

উত্স নোড: 2855188

RISC-V একটি নির্দেশনা সেট আর্কিটেকচার (ISA) হিসাবে 2015 সালে উন্মুক্ত সম্প্রদায়ের কাছে প্রকাশের পর থেকে বাণিজ্যিক গুরুত্ব এবং প্রাসঙ্গিকতায় দ্রুত বৃদ্ধি পেয়েছে, অনেক আইপি বিক্রেতাকে আকর্ষণ করেছে যারা এখন বিভিন্ন ধরনের RTL কোর সরবরাহ করে। রজার এসপাসা, সিইও এবং প্রতিষ্ঠাতা সেমিডিনামিক্স, RISC-V ইভেন্টে উপস্থাপন করেছে যে কীভাবে তাদের আইপি কম্পিউট চ্যালেঞ্জগুলির জন্য কাস্টমাইজ করা হয় যেগুলির জন্য ভেক্টর ইউনিটগুলির সাথে উচ্চ ব্যান্ডউইথ এবং উচ্চ কার্যকারিতা কোরের প্রয়োজন হয়৷ সেমিডাইনামিক্স 2016 সালে প্রতিষ্ঠিত হয়েছিল, সদর দপ্তরের জন্য বার্সেলোনা রয়েছে এবং ইতিমধ্যেই দুটি কাস্টমাইজযোগ্য RISC-V IP অফার করে মার্কিন যুক্তরাষ্ট্র এবং এশিয়াতে গ্রাহক রয়েছে:

  • অ্যাভিসপাডো – ইন-অর্ডার RISCV64GCV, AXI এবং CHI সমর্থন করে
  • Atrevido - RISCV64GC-এর বাইরে, AXI এবং CHI সমর্থন করে

একটি সাধারণ সিপিইউতে মুষ্টিমেয় বড় কোর এবং বড় ক্যাশে থাকে, যা উচ্চ কার্যক্ষমতা না থাকলেও প্রোগ্রাম করা সহজ করে তোলে।

বিপরীতে, জিপিইউ-তে অনেকগুলি ক্ষুদ্র কোর রয়েছে যা সমান্তরাল কোডের জন্য উচ্চ কার্যক্ষমতা প্রদান করে, কিন্তু CPU এবং GPU-এর মধ্যে ডেটা পাস করার প্রয়োজন হলে PCIe বাসের মাধ্যমে প্রোগ্রাম করা এবং যোগাযোগের লেটেন্সি যোগ করা কঠিন।

CPU, GPU মিন
সিপিইউ, জিপিইউ তুলনা

Espasa-এর পদ্ধতি হল কম্পিউট কোরগুলির সাথে সংযুক্ত একটি RISC-V কোর ব্যবহার করা যা প্রোগ্রাম করা সহজ করে, সমান্তরাল কোডগুলির জন্য উচ্চতর কর্মক্ষমতা এবং শূন্য যোগাযোগের বিলম্ব প্রদান করে। CPU প্লাস ভেক্টর ইউনিট উভয় বিশ্বের সেরা প্রদান করে।

RISC-V CPU প্লাস ভেক্টর ইউনিট, উচ্চতর কর্মক্ষমতা
CPU প্লাস ভেক্টর ইউনিট

RISC-V স্পেসিফিকেশন নথিপত্র 32 ভেক্টর রেজিস্টার, এবং আপনি একটি ভেক্টর ইউনিটের ভিতরে আপনার ক্যাশে সংযোগ সহ বেশ কয়েকটি ভেক্টর কোর যোগ করতে পারেন।

ভেক্টর ইউনিট মিন
ভেক্টর ইউনিট

সেমিডাইনামিক্স আইপি দিয়ে আপনি ভেক্টর কোরের সংখ্যা কাস্টমাইজ করতে পারেন: 4, 8, 16, 32। এটি দেখার আরেকটি উপায় হল লক্ষ্য করুন যে 4টি ভেক্টর কোর হল 256-বিট, 32টি ভেক্টর কোর পর্যন্ত যা 2,048-বিট।

আইপি ব্যবহারকারীরা কোন ডেটা প্রকারগুলি বেছে নেয়: FP64, FP32, FP16, BF16, INT64, INT32, INT16, INT8। একটি AI অ্যাপ্লিকেশনের জন্য তারা FP16, BF16-এর ডেটা প্রকার নির্বাচন করতে পারে, যখন একটি HPC অ্যাপ্লিকেশন FP64, FP32 নির্বাচন করতে পারে।

তৃতীয় কাস্টমাইজেশন হ'ল ভেক্টর রেজিস্টার দৈর্ঘ্য, যেখানে আরও কর্মক্ষমতা এবং কম শক্তির জন্য আপনি ভেক্টর রেজিস্টারকে ভেক্টর ইউনিটের চেয়ে বড় করতে পারেন।

এখানে Atrevideo 423-V8-এর ব্লক ডায়াগ্রাম রয়েছে:

আত্রেভিডো মিন
Atrevido 423 + V8 ভেক্টর ইউনিট

ভেক্টর ইউনিট সম্পূর্ণরূপে শৃঙ্খলার বাইরে, যা RISC-V আইপি বিক্রেতাদের মধ্যে অনন্য। ভেক্টর ইউনিট প্লাস গ্যাজিলিয়ন ইউনিটের সংমিশ্রণ 60 বাইট/সাইকেলে ডেটা স্ট্রিমিং করতে সক্ষম।

ভেক্টর + গ্যাজিলিয়ন, বাইট/সাইকেল কর্মক্ষমতা
উচ্চ ব্যান্ডউইথ: ভেক্টর + গ্যাজিলিয়ন

বেগুনি রেখাটি রিড পারফরম্যান্স দেখায় এবং L1 ক্যাশে এটি 20-60 বাইট/চক্র, অন্যান্য মেশিনগুলি L1 ক্যাশে ছেড়ে যাওয়ার পরে ব্যান্ডউইথের দ্রুত হ্রাস দেখায়, যখন এই পদ্ধতিটি চলতে থাকে, 56-এ সমতল হয়। এমনকি DDR মেমরিতেও যায় 40 এর ব্যান্ডউইথ দেখায়। 1.0GHz এর ক্লক রেট যা 40 GB/s ব্যান্ডউইথ করে।

IP গ্রাহকরা এমনকি তাদের নিজস্ব উদ্দেশ্যে ভেক্টর ইউনিটের সাথে সংযুক্ত তাদের নিজস্ব RTL কোড যোগ করতে পারেন।

AI ওয়ার্কলোডে ম্যাট্রিক্স গুণনের পারফরম্যান্স গুরুত্বপূর্ণ, এবং OOO V8 ভেক্টর ইউনিটে 16 FP64 FLOPS/চক্রের সর্বোচ্চ এবং একটি ম্যাট্রিক্স আকার >= 99 এর জন্য 400% শিখর রয়েছে। 24×24 এর একটি ছোট ম্যাট্রিক্স আকারের জন্য কর্মক্ষমতা 7 FP64 FLOPS/চক্র, বা সর্বোচ্চ 50%। 16 ভেক্টর কোর সহ একটি ভেক্টর ইউনিট ব্যবহার করে FP8-এর জন্য ম্যাট্রিক্স গুণনের সর্বোচ্চ 64 FP16 FLOPS/চক্র, এবং M >= 99-এর জন্য সর্বোচ্চ 600%।

YOLO (ইউ অনলি লুক ওয়ানস) নামক একটি রিয়েল-টাইম অবজেক্ট ডিটেকশন বেঞ্চমার্ক Atrevido 423-V8 প্ল্যাটফর্মে চালানো হয়েছিল এবং এটি প্রতি ভেক্টর কোর প্রতি প্রতিযোগীদের তুলনায় 58% বেশি পারফরম্যান্স দেখায়। এই ফলাফল 24 স্তর সহ ভিডিও জন্য ছিল. 5.56 Gops/ফ্রেম এবং প্রায় 9M প্যারামিটার।

YOLO কর্মক্ষমতা
YOLO তুলনা

সারাংশ

একটি RISC-V আইপি বিক্রেতা নির্বাচন করা একটি জটিল কাজ, তাই সেমিডাইনামিক্সের মতো বিক্রেতাদের সম্পর্কে জানা আপনাকে আরও ভালভাবে বুঝতে সাহায্য করতে পারে যে কীভাবে একটি কাস্টমাইজড পদ্ধতি আপনার নির্দিষ্ট কাজের চাপগুলিকে সবচেয়ে দক্ষতার সাথে চালাতে পারে। সেমিডাইনামিক্সের সাহায্যে আপনি ভেক্টর ইউনিট সহ বা ব্যতীত স্থাপত্যগত পছন্দগুলির মধ্যে অর্ডার বা ক্রমছাড়া বাছাই করতে পারেন। এই আইপি বিক্রেতার কাছ থেকে রিপোর্ট করা সংখ্যাগুলি আশাব্যঞ্জক দেখাচ্ছে এবং আমি তাদের ভবিষ্যতের ঘোষণার অপেক্ষায় রয়েছি।

সংশ্লিষ্ট ভিডিও

এর মাধ্যমে এই পোস্টটি ভাগ করুন:

সময় স্ট্যাম্প:

থেকে আরো সেমিউইকি