رونمایی از پردازنده گرافیکی Hopper H100 با ۸۰ گیگابایت حافظه
انویدیا در جریان کنفرانس GPU Technology Conference از پردازنده گرافیکی Nvidia H100 مبتنی بر معماری هاپر (Hopper) رونمایی کرد. معماری هاپر جدا از پردازندههای گرافیکی Ada Lovelace است که برای کارت گرافیکهای رده مصرفکننده مورد استفاده قرار میگیرد، نسل بعدی پردازندههای گرافیکی دیتاسنتر انویدیا را شکل میدهد و بیشتر در زمینه ابررایانهها با تمرکز بر قابلیتهای هوش مصنوعی کاربرد دارد. بهطور کلی معماری هاپر قرار است حل مسائلی همچون محاسبات کوانتومی، بهینهسازی مسیر پردازش و الگوریتمهای ژنومیک (شاخهای از زیست شناسی مولکولی) را تا ۴۰ برابر بهبود ببخشد و به پیشرفت علوم جدید کمک کند.
پردازنده گرافیکی هاپر H100 از فرایند سفارشی TSMC 4N استفاده میکند و از ۸۰ میلیارد ترانزیستور تشکیل شده است. H100 از نسل چهارم رابط NVLink انویدیا بهره میبرد که میتواند سرعت ۱۲۸ گیگابایت بر ثانیه پهنای باند را ارائه دهد. اتصال NVLink بهروزشده ۱٫۵ برابر پهنای باند بیشتری نسبت به A100 ارائه میدهد؛ درحالیکه PCIe 5.0 دو برابر پهنای باند PCIe 4.0 را دراختیار سیستم میگذارد.
هاپر پشتیبانی بهبودیافته FP8 را با حداکثر ۴۰۰۰ TFLOPS محاسباتی ارائه میکند که شش برابر سریعتر از A100 است. برای کمک به بهینهسازی عملکرد، انویدیا موتور ترانسفورماتور جدیدی نیز دارد که براساس حجمکاری بهطور خودکار بین فرمتهای FP8 و FP16 جابهجا میشود. H100 دارای ۱۳۲ کلاستر با ۱۶۸۹۶ هسته CUDA برای استاندارد SXM و ۱۴۵۹۲ هسته CUDA برای استاندارد PCIe 5.0 است که تعداد آن نسبت به نسل قبلی دو برابر شده است.
انویدیا در جریان معرفی معماری هاپر، از دستورالعمل جدید DPX رونمایی کرد که در ساختار پردازنده H100 کاربرد دارد. DPX به توسعهدهندگان در زمینه کد نویسی کمک میکند تا در تکنیکهای برنامهنویسی پویا در زمینههای مختلفی از قبیل تشخیص بیماریها، شبیهسازی کوانتومی، تجزیه و تحلیل گرافها و بهینهسازی مسیر به سرعت بیشتری دست پیدا کنند.
منظور از برنامهنویسی پویا چیست؟ برنامهنویسی پویا یا Dynamic Programming اولینبار در دهه ۱۹۵۰ ابداع شد. این روش که یکی از محبوبترین و پرکاربردترین تکنیکهای حل مسائل پیچیده در علوم آماری و برنامهنویسی محسوب میشود، از دو عامل اصلی تشکیل شده است: تکرار و به خاطر سپردن. در مرحله تکرار یا بازگشت مسئله، مشکل مورد نظر به مشکلات کوچکتر تقسیم میشود که شرایط لازم برای کاهش زمان محاسبات در تلاش برای حل مسئله را فراهم میآوردی. تکنیک به خاطر سپاری نیز پاسخ این مسائل کوچکتر است که در زمان حل مسئلهی اصلی، چند بار مورد استفاده قرار میگیرند. به خاطر سپردن پاسخ مسائل کوچک باعث بهینهسازی بیشتر و عدم نیاز برای پردازش مجدد مسائل کوچک موقع پرداختن به یک مشکل بزرگ میشود.
دستورالعمل DPX باعث افزایش شتاب برنامهنویسی پویا شده است و سرعت الکوریتم برنامهنویسی در پردازنده NVIDIA H100 را تا ۷ برابر بیشتر از پردازندههای گرافیکی Ampere افزایش میدهد. با تشکیل شبکهای از چهار پردازنده گرافیکی NVIDIA H100، این شتاب بیشتر و بیشتر افزایش مییابد. تکنیکهای برنامهنویسی پویا معمولا در بسیاری از الگوریتمهای بهینهسازی، پردازش دادهها، کامپیوترهای کوانتومی، روباتیک و کاربردهای پزشکی به کار میرود.
سیستمهای DGX POD و DGX SuperPOD بهعنوان اولین سیستمهای مبتنی بر پردازنده گرافیکی NVIDIA DGX H100 از سهماهه سوم سال جاری میلادی در اختیار شرکای تجاری انویدیا در سراسر جهان قرار میگیرند.
در پایان نظرات خود را در اینباره با زومجی و سایر کاربران در میان بگذارید.