بررسی اختصاصی کارت گرافیک AORUS RTX 3080 MASTER
همانطور که حتما میدانید، چند ماهی از عرضهی کارتهای گرافیکی پرچمدار انویدیا از نسل جدید آمپر به بازار میگذرد و علیرغم عرضهی بسیار محدود و تقاضای بالا برای این مدلها، بسیاری از سازندگان مطرح و قدیمی قطعات پیسی هم مدلهای اختصاصی خود را بر مبنای این کارتهای گرافیکی معرفی کرده و به فروش میرسانند. اما از سوی دیگر کاربران در سرتاسر دنیا با دشواریهای فراوانی برای دسترسی به این محصولات مواجه شدند و کمبود عرضه مزیدِ بر این علت شد که قیمت این محصولات به میزان سرسامآوری کاذب و دو تا سه برابر قیمت اصلی فروخته شود. از مدلهای تاکنون عرضه شده، GeForce RTX 3080 بعد از GeForce RTX 3090، قویترین مدل از کارتهای پرچمدار نسل آمپر است. اکنون نمونهای از کارت AORUS RTX 3080 Master برای بررسی در اختیارِ زومجی گذاشته شده که در اینجا قصد داریم به ویژگیها و امکانات اختصاصی و جنبی این مدل و بررسی راندمان آن در عناوین مطرح بازیهای روز بپردازیم و ببینیم که نسبت به نسل قبلی چه پیشرفتهایی داشته است.
مشخصات فنی GeForce RTX 3080
کارت گرافیک GeForce RTX 3080 اولین کارت گرافیکی بود که در رویداد اختصاصی انویدیا رونمایی شد و از آن به عنوان پرچمدار جدید یاد شد، محصولی که راندمانی بسیار بالاتر از پرچمدار نسل قبلی دارد و از همه مهمتر با قیمتِ رسمی معقولتر از نسل قبلی به فروش میرسد. RTX 3080 با قیمت پایهی ۶۹۹ دلاری برای مدل Founders Edition ساخت انویدیا، در تاریخ ۲۷ شهریورماه عرضه شد. این کارت ۱۰ گیگابایت حافظهی کاملا جدید GDDR6X ساخت شرکت مایکرون را در جوار GPU در بر دارد و توان محاسباتی آن برای FP32 روی واحدهای Shader یا سایهزن سنتی حدود ۳۰ ترافلاپس عنوان شده است. توان محاسباتی واحد رهگیری پرتو هم بر خلاف نسل تورینگ با ترافلاپس ارائه شده و میزان آن برای RTX 3080 برابر با ۵۸ ترافلاپس است. در آخر واحدهای هوش مصنوعی و یادگیری ماشینی Tensor هم ۲۳۸ ترافلاپس توان محاسباتی را در اختیار دارند.
کارت گرافیک RTX 3080 از همان تراشهی GA102، اما با تعداد واحدهای پردازشی کمتر نسبت به RTX 3090 بهره میبرد. تعداد واحدهای پردازشی فعال CUDA در اینجا ۸۷۰۴ واحد است که نسبت به ۱۰۴۹۶ واحد در RTX 3090، به میزان ۱۷۹۲ واحد یا حدود ۱۸ درصد کمتر است. همچنین این محصول با گذرگاه ۳۲۰ بیتی به ۱۰ تراشهی یک گیگابایتی GDDR6X متصل شده است. در نتیجه شاهد ۱۰ گیگابایت حافظهی پرسرعت گرافیکی برای RTX 3080هستیم که پهنای باندی برابر با ۷۶۰ گیگابایت بر ثانیه دارد. این پهنای باند هنوز هم از پهنای باند ۶۱۶ گیگابایت بر ثانیهایِ کارت RTX 2080 Ti به میزان ۱۴۴ گیگابایت بر ثانیه سریعتر است.
تراشهی Ampere GA102
بیشتر پردازشهای گرافیکی از عملیات بر مبنای اعداد اعشاری ۳۲ بیتی یا FP32 تشکیل شدهاند. واحد Streaming Multiprocessor یا به اختصار SMدر معماری گرافیکی GA10x،برای پشتیبانی از پردازش دو برابریِ عملیات FP32 طراحی شده است. در نسل تورینگ، هر ۴ واحد SM (که پارتیشن هم گفته میشوند) دارای دو مسیر دادهای اولیه بودند، اما فقط یکی از آنها میتوانست عملیات FP32 را پردازش کند. مسیر دادهی دوم به عملیات عدد صحیح یا INT محدود بود. در GA10x پردازش روی هر دو مسیر دادهای برای FP32ممکن است و به همین دلیل حداکثر نرخ پردازش عملیات FP32 دو برابر شده است. در نتیجهی این طراحی، کارت GeForce RTX 3090 بیش از ۳۵ ترافلاپس توان پردازشی را ارائه میکند که بیش از دو برابر بیشتر از تراشههای گرافیکیِ Turing است.
بلاک دیاگرام تراشهی GA102 استفاده شده در کارت گرافیک RTX 3080
مانند GPU-های قبلی انویدیا، GA102 از کلاسترهای پردازش گرافیکی (Graphics Processing Clusters یا به اختصار GPC)، واحدهای پردازش بافت (Texture Processing Cluster یا به اختصار TPC)، واحدهای SM، واحدهای ترسیم (Raster Operator یا به اختصار ROP) و کنترلرهای حافظه تشکیل شده است. یک تراشهی کامل GA102 دارای ۷ واحد GPC، تعداد ۴۲ واحد TPC و ۸۴ واحد SM میشود که مطابق قسمتهای قرمزرنگ شده در دیاگرام فوق، برخی قسمتهای آن برای استفاده در تراشهی GA102-200 در قلبِ RTX 3080غیر فعال شده است. همچنین هر SM هم ۱۲۸ هستهی CUDA و ۴ هستهی Tensor دارد و ۱ هستهی RT و ۴ واحد پردازش بافت یا همان TU را در خود جای میدهد. تراشهی GA102-200 به میزان ۸۷۰۴ کیلوبایت حافظهی کش L1 و ۵۱۲۰ کیلوبایت حافظهی کش L2 در اختیار دارد.
نسل دوم RT
هستههای RT (مخفف Ray Tracing یا رهگیریِ پرتو) جدید برخی پیشرفتها را شامل میشوند که در ترکیب با بهینهسازیهای صورت گرفته روی زیرسیستمِ حافظهی کَش، به صورت موثر میتواند تا دو برابر افزایش راندمان را نسبت به هستههای RT در معماری تورینگ به همراه داشته باشد. بهعلاوه، واحدهای SM در معماری آمپر توانایی اجرای همزمان کارهای هستهی RT+ گرافیک یا هستهی RT + محاسبه (Compute) را در اختیار دارد که به میزان قابل توجهی پردازشهای رهگیری پرتو را شتاب میبخشد.
نسل سوم Tensor
نسلِ سوم و جدید هستههای Tensor انواع دادهای (Data Type) جدیدی را برای افزایش راندمان، بهرهوری و انعطاف در برنامه نویسی پشتیبانی میکند که میتواند تا سقف دو برابر راندمان بالاتر در پردازشهای هوش مصنوعی مانند DLSS عرضه کند.
حافظههای GDDR6X با افزایش سرعت انتقال دادهها برای اولین بار با کارتهای نسل آمپر معرفی و استفاده شدهاند و کارتهای سری RTX 3000 برای اولین بار در محصولات انویدیا از گذرگاه PCI express 4.0 هم پشتیبانی میکنند. فناورهای جانبی دیگری نیز معرفی شدهاند که در ادامه بررسی آنها میپردازیم.
NVIDIA RTX IO
امروزه ذخیرهسازها با وجود پیشرفت زیاد و استفاده از SSD-های سریع، هنوز هم ضعیفترین قسمت رایانهها محسوب میشوند. سرعت SSD-های مدرن با بهره گیری از توانِ کامل گذرگاه PCIe در هر نسل افزایش مییابد و در PCIe نسل چهارم، سرعت این گذرگاه به ۶۴ گیگابیت بر ثانیه (۸ گیگابایت بر ثانیه) در دو جهت رسیده است. هماینک شرکت ایامدی پلتفرم مبتنی بر PCIe 4.0 را عرضه کرده، اما اینتل فقط در پلتفرم نسل یازدهم موبایلی از آن استفاده کرده و قرار است آن را همزمان با عرضهی پردازندههای نسل یازدهمِ دسکتاپی با نام Rocket Lake، به کاربران رایانههای رومیزی نیز عرضه کند.
با اینکه افزایش پهنای باند ذخیرهساز امری مثبت تلقی میشود، اما پردازش اطلاعات باینری صفر و یک ذخیره شده روی بخش فیزیکی دیسکها هنوز بر عهدهی پردازندهی مرکزی یا CPU است. با افزایش پهنای باند ذخیرهسازها، بار پردازشیِ عملیات ورودی/خروجی یا I/O هم به همان نسبت روی پردازنده به تدریج افزایش پیدا میکند و به جایی میرسد که راندمان را تحت تاثیر قرار میدهد. مایکروسافت راه حل رابط برنامهنویسی DirectStorage را برای حل این معضل در نظر گرفته و انویدیا هم فناوری RTX IO را بر مبنای همین API ابداع کرده است.
انویدیا میگوید دادههای غیر فشرده حداکثر با سرعت ۷ گیگابایت بر ثانیه از یک SSD از نوع NVMe و روی گذرگاه PCIe 4.0 خوانده میشوند و برای پردازش در این سرعت به توان کاملِ دو هستهی پردازنده نیاز دارند. اما اگر همین اطلاعات بصورت فشرده شده و محتوایی مانند دادههای بازی باشند، به هزاران درخواست I/O و منابع متعددی نیاز است تا اطلاعات از حالت فشرده، به حداکثر ۱۴ گیگابایت بر ثانیه در حالت غیرِ فشرده تبدیل شوند. سربار ناشی از درخواستهای مضاعف I/O و توان مورد نیاز برای خواندن دادهها از داخل فایلهای متعدد و بارگذاری آنها در بافر کارت گرافیکی، توان پردازشی مورد نیاز در سمت پردازنده را به ۲۴ هسته افزایش میدهد. اینجا DirectStorage وارد عمل میشود و مسیری را برای دسترسی مستقیم به منابع مورد نیاز و برداشتن سربار پردازنده ایجاد میکند.
همچنین RTX IO به عنوان لایهی بیرونی DirectStorage که برای بازیها و معماری تراشههای گرافیکی انویدیا بهینه شده، غیر فشرده کردن دادههای فشرده شده را به صورت سختافزاری روی GPU انجام میدهد. انویدیا ادعا میکند که این فناوری تا ۲ برابر راندمان عملیات ورودی/خروجی با ذخیرساز را افزایش میدهد و در عین حال نیاز به استفاده از هستههای متعدد پردازنده برای مدیریت خواندن و نوشتن را از میان برمیدارد.
البته نیاز است که بازیها برای استفاده از قابلیت DirectStorage بهینه شوند. با توجه به اینکه این API اکنون هم در کنسول ایکس باکس سری ایکس پیاده سازی شده، بازیهایی که برای این کنسول عرضه شده و به پیسی پورت شوند، احتمالا از این فناوری برخوردار خواهند بود. همچنین پشتیبانی RTX IO باید به صورت مجزا برای هر بازی در درایور گرافیک انویدیا تعبیه شود.
این فناوری روی تمام کارتهای گرافیکی RTX از نسل تورینگ و آمپر کار خواهد کرد و با بروز رسانی API مربوطه در نسخهی سال ۲۰۲۱ ویندوز 10، میتوان انتظار داشت که استفاده از این قابلیت از نیمهی دوم سال آینده عملیاتی شود. در ضمن مایکروسافت میگوید این قابلیت به ملزوماتی نیاز دارد که باعث میشود تمامِ درایوهای M.2 و NVMe برای بهره بردن از آن مناسب نباشند و احتمالا فقط مدلهای پرسرعتتر برای این قابلیت چراغ سبز خواهند گرفت.
NVIDIA DLSS 2.0
فناوری DLSS در نسخهی ابتدایی چیزی بیش از یک تکنیک Image Sharpening معمولی به نظر نمیرسید، اما تحول بینظیر ایجاد شده در DLSS 2.0 و اجرا روی هستههای Tensor تراشههای RTX باعث شد که یکی از بینقصترین تکنیکهای ارتقای تصویری و upscaling را در بازیهای ویدیوئی شاهد باشیم. در واقع DLSS 2.0 بسیار از جزئیاتی را که با اِعمال تکنیک TAA روی صحنه محو میشوند یا از بین میروند را دوباره به تصاویر برمیگرداند و در بسیاری موارد کیفیتی حتی بالاتر از اجرای بازی در رزولوشن Native را ارائه میکند.
بازی Death Stranding یکی از بهترین نمونههای پیادهسازی تکنیک DLSS 2.0 بعد از بازی Control ساختهی رمدی است که میتواند الگوی بیمانندی برای مایکروسافت و سونی برای پیادهسازی قابلیتهای مشابه بر مبنای هوش مصنوعی در کنسولهایشان باشد.
Nvidia Reflex
فناوری دیگری که همزمان با معرفی کارتهای گرافیک جدید معرفی شد، به گیمرهای آنلاین وعدهی بهرهمندی از کاهش تاخیر و افزایش سرعت پاسخگویی سیستم در هنگام بازی را میدهد. به گفتهی انویدیا این قابلیت خود مشتمل بر برخی نوآوریها در تراشهی گرافیکی، تکنیک G-Sync و برخی دیگر قابلیتهای نرمافزاری است که سنجش و کاهش تاخیر سیستم در هنگام اجرای بازیهای رقابتی را ممکن میسازند. کاهش تاخیر سیستم برای گیمرهای آنلاین امری حیاتی است که به پیسی و نمایشگر اجازهی واکنش سریعتر در برابر دستورات ورودیِ کاربر از طریق ماوس و صفحه کلید را میدهد و دقت در عکسالعملها و شلیکها را افزایش میدهد.
شتابدهنده سختافزاری ویدیو
معماری جدید آمپر از نسل پنجم دیکودرِ انویدیا هم برای فرمتهای زیر در پلتفرمهای ویندوز و لینوکس بهرهمند شده است:
● MPEG-2, VC-1, H.264 (AVCHD),H.265 (HEVC), VP8, VP9, and AV1.
کدکها و فرمتهای رنگی که که به صورت سختافزاری پشتیبانی میشوند:
● HEVC 4:2:0 and 4:4:4 color modes with 8/10/12 bit.
● VP9 4:2:0 color mode with 8/10/12 bit.
● H.264 4:2:0 color mode with 8 bit.
مشخصات فنی AORUS RTX 3080 MASTER و ابعاد
پس از تشریح قابلیتهای فنی معماری آمپر و GeForce RTX 3080 نوبت به کارت گرافیکی که در اختیار داریم میرسد تا مشخصات آن را با مدل مرجع (در اینجا Founders Edition) مقایسه کنیم:
نام کارت گرافیکی | NVIDIA GeForce RTX 3090 | AORUS GeForce RTX 3080 MASTER | NVIDIA GeForce RTX 3080 | NVIDIA GeForce RTX 3070 | NVIDIA GeForce RTX 2080 Ti |
---|---|---|---|---|---|
معماری تراشه | Ampere | Ampere | Ampere | Ampere | Turing |
مدل تراشه | GA102-300 | GA102-200 | GA102-200 | GA104-300 | TU102 |
پروسهی ساخت | 8nm | 8nm | 8nm | 8nm | 12nm FNN |
تعداد ترانزیستورها | 28Billion | 28Billion | 28Billion | 17.4Billion | 18.6Billion |
هستههای CUDA | 10496 | 8704 | 8704 | 5888 | 4352 |
توان رهگیری پرتو | 69TFLOPs | 58TFLOPs | 58TFLOPs | 40TFLOPs | 10Giga Rays/s |
فرکانس پایه | 1395MHz | 1440MHz | 1440MHz | 1500MHz | 1350MHz |
فرکانس بوست | 1725MHz | 1845MHz | 1710MHz | 1725MHz | 1545MHz |
توان محاسباتی | 35.7TFLOPs | 32.1TFLOPs | 29.7TFLOPs | 20.45TFLOPs | 13.4TFLOPs |
ظرفیت حافظه | 24GB GDDR6X | 10GB GDDR6X | 10GB GDDR6X | 8GB GDDR6 | 11GB GDDR6 |
سرعت حافظه | 19.50Gbps | 19.00Gbps | 19.00Gbps | 16.00Gbps | 14.00Gbps |
رابط حافظه | 384bit | 320bit | 320bit | 256bit | 352bit |
پهنای باندِ حافظه | 936GB/s | 760GB/s | 760GB/s | 512GB/s | 616GB/s |
اتصالات برق | 12Pin | 8+8Pin | 12Pin | 8Pin | 8+8Pin |
توان حرارتی | 350W | 350W | 320W | 220W | 260W |
شروع قیمت | $1499US | $850US~ | $699US | $499US | $999US |
مشاهده میکنید که سرعت ساعت کاری GPU از ۱۷۱۰ مگاهرتز برای مدل مرجع انویدیا، به ۱۸۴۵ مگاهرتز در این مدل افزایش پیدا کرده و اصطلاحا اورکلاک کارخانهایِ قابل توجهی روی تراشهی گرافیکی اعمال شده است. در نتیجهی افزایش راندمان، طبعا توان محاسباتی هم افزایش پیدا میکند که در موردِ این مدل از ۲۹.۷ ترافلاپس در مدل مرجع، به ۳۲.۱ ترافلاپس رسیده است. اما فرکانس کاری حافظهی گرافیکی به مانند تمام کارتهای سفارشیِ دیگر از برندهای مختلف دستنخورده باقی مانده و کماکان ۱۹ گیگاهرتز است. همچنین کانکتورهای تامینِ توان ۱۲ ولتی PCIe هم مانند تمام کارتهای سفارشی ۸ پینی باقی مانده و از مدل ۱۲ پینی استاندارد جدید انویدیا اجتناب شده است. در نظر داشته باشید که طراحی مدار توان و رابطهای برق در ویرایش نسخهی دوم از کارت Aorus RTX 3080 Master تغییر کرده و به ۳ کانکتور ۸ پینی افزایش یافته است.
از جنبهی ابعاد هم طول این کارت ۳۱۹ میلیمتر، عرض آن ۱۴۰ میلیمتر و ارتفاع آن ۷ سانتیمتر است که احتمالا برای بررسی جایگیریِ مناسب آن در داخلِ کیس خود به این اطلاعات نیاز خواهید داشت.
امکانات اختصاصی AORUS RTX 3080 MASTER
Max-Covered Cooling: این ویژگی در سیستم خنککنندهی کارت گرافیک، دو فن ۱۱۵ میلیمتری و یک فن ۱۰۰ میلیمتری از سری فنهای unique blade stack با موتور Ball bearing را در برمیگیرد که جریان هوا را با لبههای مثلثی تیغههای فن به تمام سطح خنک کننده هدایت میکنند و طراحی Wind Claw در زیر فنها هم جریان هوا را تقویت و کانالیزه میکند تا بتواند کاملا سطح خنککننده را پوشش دهد. چرخش معکوس فن میانی هم تلاطم ناشی از چرخش فنهای مجاور را کاهش داده و فشار هوا را افزایش میدهد.
Screen Cooling: این طراحی شامل هیتسینک گسترش یافته در انتهای کارت گرافیک میشود که مشابه با طراحی کارت انویدیا، باعث عبور جریان هوای گرم و دفع بهتر حرارت از بخش انتهای کارت گرافیکی شود.
Vapor Chamber: خنک کننده با دارا بودن صفحهی مسی بزرگ و تماس مستقیم با GPU و تراشههای حافظهی GDDR6X، میتواند به کمک لولههای ناقل حرارتِ کامپوزیتی با فناوری vapor chamber،انتقال حرارت را با سرعت و بهرهوری بالا انجام داده و به هیتسینک منتقل کند.
طراحی زاویهدار: طراحی پرههای زاویهدار و نابرابر برای هیتسینک میتواند جریان هوا را از طریق بالهها هدایت کرده و سطح تماس را بزرگتر کند.
LCD Edge View: یک نمایشگر LCD در لبهی کارت گرافیکی تعبیه شده که نه تنها میتواند اطلاعات کارت گرافیک را نمایش دهد، بلکه قادر است متنهای اختصاصی، عکس و گیف انتخابیِ کاربر را نیز بنا به سلیقه نمایش دهد. حتی افکتهای نورپردازی آن از طریق نرمافزار RGB Fusion 2.0 قابل تغییر است.
Metal Back Plate: صفحهی فلزی نصب شده در پشت کارت گرافیکی نه تنها با طراحی کارت گرافیکی یکدست است، بله ساختار کارت گرافیکی را مستحکمتر کرده و از ایجاد اثرِ خمیدگی در طول زمان به دلیل وزن خنککننده محافظت میکند.
Dual Bios: بایوس در حالت Silent یا ساکت تجربهی کم صداتری را مهیا میکند، در حالی که حالت OC خنککنندگی بیشتر و راندمان بالاتر را نتیجه میدهد.
۶ خروجی گرافیکی: میتوانید از بین سه پورت خروجی HDMI و سه پورت خروجی DP برای نمایشگر یا نمایشگرهای خود ترکیب مناسب را بدون نیاز به آداپتور مبدل انتخاب کنید.
سیستم تست
• پردازنده: Intel Core i7 – 10700K OC to 5.0 GHz
• مادربرد/ حافظه: ASUS Z490-F STRIX/ GSKILL Trident RGB DDR4 3200Mhz 32GB
• سیستمعامل: ویندوز 10 نسخهی November Update با آخرین آپدیتها (19042.685-20H2)
• درایورها: انویدیا GeForce 460.89 WHQL و AMDRadeon Software Adrenalin Edition 20.12.1
نظرات