بررسی کارت گرافیکی ای ام دی رادئون R9 Fury X
معماری تراشههای گرافیکی شباهتِ زیادی به اتوبوسهای لندن دارد، به ندرت دستگاهِ جدیدی در آنها خواهید دید و از طرفِ دیگر، گاهی اوقات به طورِ غیرمنتظره ناپدید میشوند یا دو مدل از آنها همزمان پدیدار میشوند. جالبی ماجرا این است که اِیاِمدی و اِنویدیا هر دو تراشههای گرافیکی درجه یکشان را به فاصلهی یک ماه از هم ارائه کردند.
بگذارید در همین ابتدای بررسی مطلبی را روشن کنیم. دو غولِ تراشههای گرافیکی مسیرهای متفاوتی را برای رفعِ موانعِ گیمینگ در رزولوشنهای بالا انتخاب کردهاند. البته این تصمیماتِ کلیدی در واقع قبلتر از اینها اتخاذ میشود، معمولا سالها قبل، بنابراین چیزی که امروز میبینید مشخصاتِ اصلی طراحی شده توسطِ تیمِ مهندسی آنها است که در سالِ ۲۰۱۲ یا حوالی آن تعیین شده است.
اِنویدیا قدرتِ زیادی را از معماری کم مصرفِ Maxwell بدست آورده و به توانِ عملیاتی قابلِ توجهِ آن در طراحی ۲۵۰ واتی GM200 متکی بوده است. از طرفِ دیگر، اِیاِمدی معماری GCN خود را بهینه سازی کرده و در عوض تمرکزِ خود را روی بخشِ حافظهی محصولِ خود معطوف کرده است. ما همه چیز را دربارهی نتیجهی کوشِش اِنویدیا با بررسی آمارخارق العادهی GeForce GTX Titan X و همین طور جدیدا هم GTX 980 Ti میدانیم، پس اجازه دهید بررسی کنیم که اِیاِمدی در مقابل چه چیزی در چنته دارد و مستقیم به محصولِ برگرفته شده از معماری Fiji، یعنی رادِئون R9 Fury X بپردازیم.
همانگونه که قبلا خواندید، اِیاِمدی سرگذشتِ Fiji را در مراسمِ متعدد و زمانهای مختلف، مرحله به مرحله اعلام کرده است. ابتدا جزییاتِ یک ابداع و فناوری هوشمندانهی جدید که HBM خوانده میشد فاش شد. سپس در مراسم E3 2015 بخشی از رونمایی آن انجام شد که نمایندگانِ ارشدِ اِیاِمدی، اشارههایی اِجمالی به راندمانِ این کارتِ گرافیکی داشتند و مشخصاتِ سطحِ بالای تراشهی Fury X هم رسما معرفی شد.
اما Fury X پیاده سازی کاملی از معماری Fiji را به خدمت گرفته است و بر اساسِ همان روشِ ۲۸ نانومتری که از دِسامبر سال ۲۰۱۱ مورد استفاده قرار میگرفته، ساخته شده است. اِیاِمدی با این معماری پایه امتیازِ بزرگی را به نام خود ثبت نمیکند. در واقع Fury X از همان معماری GCN 1.2 یا به زبان خود اِیاِمدی مشتق نسل سومی استفاده میکند، مشابهی همانی که در تراشههای گرافیکی Tonga یا Antigua و در کارتهای گرافیکی R9 285 و R9 380 بکار گرفته شده است. راه حل Fury X برای تقابل با موانعِ پردازش در رزولوشنهای بالا، بیش از آنکه ظریف و مبتکرانه باشد، خَشن و بی محابا است: اِیاِمدی طراحی خود را در مقیاس بزرگتری پیاده سازی کرده تا بتواند هستههای پردازشی و واحدهای بافتِ بیشتری را در خود جای دهد.
در حالی که کارتهای تازه متولد شدهی R9 390X و R9 380 به ترتیب ۲۸۱۶ و ۱۷۹۲ هستهی پردازشی دارند که در ۱۱ و ۷ واحد بزرگتر (CU(Compute Units تقسیم شدهاند، تراشهی Fiji واحدها را به تعدادِ عظیمِ ۱۶ CU افزایش داده است. با توجه به دیاگرامِ بالا، Fiji دارای ۴ واحدِ Shader Engine است که هر یک به تنهایی دارای ۱۶ compute unite هستند و هر CU هم ۶۴ هسته را در دلِ خود دارد، با این حساب در کل تعدادِ ۴۰۹۶ واحدِ پردازشِ منطقی را در اختیار خواهیم داشت. با در نظر گرفتنِ ۱۶ واحدِ پردازشِ بافت در هر CU، در کلِ تراشه ۲۵۶ واحد TMU خواهیم داشت. با علمِ قبلی به اینکه سَقفِ فرکانسِ کاری تراشه ۱۰۵۰ مگاهرتز است، توانِ بالقوهی پردازشی ۸/۶ تِرافِلاپس را تنها در یک تراشه خواهیم داشت، چیزی که به آسانی هر آنچه را که در گذشته دیده شده، حَقیر جلوه میدهد.
تراشهی اِیاِمدی بر بستری ۵۹۶ میلی متر مربعی بنا شده، که مقداری کوچکتر از تراشهی GM200 ماکسوِل انویدیا است، اما اگر چیزی در مورد طراحی این تراشه گرافیکی بدانید، مهم نیست که این تراشه چقدر بزرگ باشد، چرا که این طراحی از نظر کارشناسان همچنان یک چالش باقی میماند. تمرکزِ این شرکت روی توانِ Compute یا پردازشِ چند منظوره در این معماری ( که در برخی کاربردها مثل Mining بکار گرفته میشد)، نگرشِ متفاوتی را در استراتژی سخت افزاری اِیاِمدی رقم زده است و بخشِ اعظمِ این تراشه هم به واحدهای پردازشی CU اختصاص داده شده است.
چیزی که در ازای پیاده سازی این روش از دست میدهیم، عدمِ مقیاس پذیری تعدادِ واحدهای خروجی رندر است که هنوز در تعدادِ ۶۴ واحد باقی مانده است و در کنار آن، عدم افزایشِ مشخصِ ۴ واحد پردازشِ ترسیم یا geometry و سخت افزارِ مربوطه است که هم اکنون هم در تراشهی Hawaii وجود دارد. مورد دیگری که از جنبهی یک کارتِ گرافیکِ بازی محور مهم است، عدمِ وجودِ بخشی است که برای اجرای سریعتر محاسباتِ اعشاری در Fiji لازم است و سرعتِ اجرای این محاسبات را تنها به ۱/۱۶ (یک شانزدهم) سرعتِ پردازشِ مُحاسباتِ عددِ صحیح که رقمی کمتر از توان R9 390X است ، محدود کرده است. چالشِ واقعی برای هر معماری سخت افزاری این است که گلوگاههایی را که در دورهی زمانی ۲ یا ۳ سال بعد ایجاد خواهد شد، پیش بینی کند. اِیاِمدی و انویدیا در این زمینه دیدگاههای متفاوتی را بروز دادهاند، مثلا کارتِ GTX 980 Ti در خروجیهای رندر یا ROP قویتر است، در حالی که Fiji در بخش سایهزنها قدرتِ بالاتری دارد.
جای دادن واحدهای بیشتر بدون افزایش مصرف
اِیاِمدی به هدف ارزندهای برای جای دادنِ حدود ۵۰ درصد واحدهای سایه زن و پردازشِ بافتِ بیشتر، بدونِ افزایشِ توانِ مصرفی کارتِ گرافیکی دست یافته است، اگر بخواهیم آن را با آخرین نسلِ بهینه شدهی پردازندههای Granada که در R9 390X وجود دارد مقایسه کنیم. پُرسشِ اساسی که باید پاسخ داده شود این است که اِیاِمدی این مهم را چگونه محقق کرده است؟ پاسخ در ۳ قسمت خلاصه است.
هر اِشتقاقِ و بازسازی جدید از تراشههای گرافیکی قدیمیتر از آخرین پیشرفتهای فناوری بهرهمند میشوند، چیزی که در نسلِ اول آنها قابل پیاده سازی نبود و Fiji یک نمونهی آن است. اِیاِمدی آخرین دستاوردهای بهینه سازی مصرفِ توان را از تجربیاتِ خود با APU های Carrizo به Fiji منتقل کرده است.
روشی که هر کارت فرکانسِ خود را به سطحِ مشخصی در حالتِ Boost افزایش میدهد، به ترکیبِ مشخصی از ولتاژ و نقاطِ فرکانسی خاص بستگی دارد که با چیزی بیشتر از یک منحنی خطی تعیین میگردد. اکنون هر یک از این نقاط بر اساس فاکتورهای دیگری مثلِ دما و کیفیتِ سیلیکون مشخص میشوند و این کنترلِ دست چین شده، به Fury X امکان میدهد که بدونِ اتلافِ بی دلیلِ ولتاژ به حداکثر سرعتِ خود دسترسی پیدا کند.
مدیریتِ توانِ هوشمندانه هم شما را فراتر از مواردِ گفته شده به پیش خواهد برد. بخشِ دومِ بهینه سازی توان، نظارت بر کنترلِ مصرف با کاستن از دما تا جای ممکن است. یک اصلِ ابتدایی فیزیک این است که اگر دما افزایش یابد، مصرفِ توان هم بیشتر میشود، حتی اگر ولتاژ بیشتری به پردازنده اعمال نشود که این رخداد به اثر Poole-Frenkel مشهور است. به بیانِ ساده، با خُنک نگه داشتنِ کارت توسطِ خنک کنندهی مایع و در دمای پایین، اِیاِمدی توانسته است به میزان مطمئنی از توانِ مصرفی کارت بِکاهد.
و البته HBM
همانگونه که قبلا در مورد HBM به جُزییات پرداختهایم، مصرفِ توانِ HBM به میزان قابل توجهی پایینتر از GDDR5 است و پهنای باندِ بالاتر را با استفاده از یک عرضِ باندِ فوِق عریض، اما کندتر که مستقیما با کمک یک رابط به تراشهی گرافیکی متصل میشود، فرآهم میسازد. همچنین HBM دسترسی با تاخیرِ کمتر و سادهتر بودنِ یکپارچگی با هستهی تراشهی گرافیکی را هم ارائه میکند. اِیاِمدی میگوید که بخش قابل توجهی از بسترِ تراشه را به کمکِ عدم نیاز به ساختِ رابطِ حافظهی ۵۱۲ بیتی GDDR5 ( مانند همان بخشی که در R9 390X پیاده سازی شده است) صَرفه جویی کرده است.
با اینکه HBM سرشار از مزیتهای متعدد مثلِ پهنای باندِ بسیار بالا با تاخیرِ پایین و نیاز به فضای بسیار کمتر روی برد است، اما یک ایرادِ ابتدایی هم دارد. اولین نسلِ HBM به ۴ پشتهی ۱ گیگابایتی حافظه محدود است که دسترسی تراشهی گرافیکی را تنها به مقدارِ کلِ ۴ گیگابایت ممکن میسازد. این در حالی است که اِنویدیا کارتهای رده بالای خود را به ۶ و ۱۲ گیگابایت حافظه مجهز کرده و خودِ اِیاِمدی هم ۸ گیگابایت رم گرافیکی را در آخرین محصولات R9 390 و 390X بکار گرفته است. از اِیاِمدی در موردِ نگرانی از ایجادِ مشکلِ حافظهی ۴ گیگابایتی HBM برای Fiji پرسیده شد که شرکت در پاسخ این مساله را کاملا رد کرد و از ما خواست که تاثیرِ بافرِ ۴ گیگابایتی را خودمان در تستها و بنچمارکها بررسی کنیم و ببینیم که مَساله ساز میشود یا خیر. البته پاسخ به این پرسش سوای انجامِ تستهای مذکور، بدون دسترسی داشتن به کارتِ مشابهای که از ۸ گیگابایت رم HBM استفاده کند کمی مُشکل است.
بهرهوری به راندمان منتهی میشود
اِیاِمدی توانسته یک تراشهی بزرگ را با توانِ مصرفی نسبتا مناسبِ ۲۷۵ وات تولید کند، زیرا از سه فناوری کلیدی را در آن بهره گیری کرده است: کُنترل توانِ بهینه شده، خُنک کنندهی مایع و حافظهی HBM. اگر اینها تاکنون مُعرفی نشده یا قابل استفاده نبودند، کارت Fury X میتوانست مصرفی برابر با ۳۷۵ وات یا حتی بالاتر داشته باشد، چیزی که نه قابل بهره برداری بود و نه به راحتی خنک میشد.
حال که به مشخصاتِ تکنیکی و ویژگیهای معماری Fury X پرداختیم، بهتر است به سراغِ خودِ محصول برویم و نگاهی به آن داشته باشیم.
صرفه جویی در فضای اشغالی کارت که به مَدَدِ بهره گیری از HBM مُیسر شده، طولِ کارت را به ۷/۵ اینچ یا ۱۹ سانتیمتر رسانده است. همچنین این کارت دو اسلات را اشغال میکند. کارتِ گرافیکِ R9 Nano حتی از این هم کوچکتر است و تنها ۶ اینچ یا حدود ۱۵ سانتیمتر طول دارد.
با نگاه به خروجیها مشخص میشود که اِیاِمدی از بکارگیری خروجیهای تصویری قدیمیتر مثل DVI صرفنظر کرده است و به جای آن از سه اتصالِ DisplayPort 1.2a و یک اتصال HDMI 1.4 استفاده کرده است. این انتخابِ آخری تعجب برانگیز بوده است چرا که خروجی آن حداکثر به رزولوشنِ 4K در فرکانسِ نوسازی تصویرِ ۳۰ هرتز ختم میشود و استانداردِ جدیدتر، یعنی نسخهی ۲ میتواند گرفتنِ ۶۰ هرتز را هم مُیسر سازد. این مسالهی مهمی است، چرا که ابعادِ کوچکِ کارت و کم صدایی آن، استفاده از آن را در پیسی های اتاق نشینمن مناسب کرده است. اما اگر تلویزیونِ 4K داشته باشید که عموما هم روی HDMI 2.0 کار میکنند. برای گرفتنِ رزولوشن و فرکانسِ مناسب با مُشکل مواجه خواهید شد.
بنا بر ادعای اِیاِمدی، خُنک کنندهی مایعِ استفاده شده در اینجا برای دفعِ توانِ حرارتی ۵۰۰ وات کفایت میکند و تراشهی اصلی، حافظههای HBM و قطعات VRM را در یک چرخهی کامل در بر گرفته است. به بیان دقیقتر، این خُنک کننده توسطِ شرکتِ Cooler Master برای اِیاِمدی ساخته شده و پُمپِ چند کارهی آن در تماسِ مُستقیم با صفحهی مسی پوشش دهندهی GPU و حافظهی HBM است. مسیر گردشِ مایع با یک لولهی مسی و سینک حرارتی بسط داده شده تا اجزای VRM یا مدار تغذیهی ولتاژ را هم در بر بگیرد.
خودِ کارت هم یک پوششِ زیبا و شیک دارد، با جنسی از آلیاژِ نیکل آلومنیومِ سیاه رنگ که روی قاب خنک کننده کار شده است. کیفیتِ ساخت و ظرافتِ طراحی آن بهتر از کارتهای مرجع R9 290X است. اِیاِمدی قرار است به زودی مدل سه بعدی قاب خنک کننده را در بلاگی منتشر کند تا طراحان بتوانند طرحهای مورد نظر خود راطراحی کرده و بسازند.
البته ما طراحی چشم نواز و مدرنِ کارتهای مرجعِ اِنویدیا با قابِ آلومنیومی را بیشتر ترجیح میدهیم. موردِ دیگر اینکه طراحی قابِ کارت به گونهای است که لولههای خنک کننده از پشتِ کارت خارج میشوند و این خود جبرانِ کوچک بودن کارت را تا حدی میکند و برای نصب در کیسهای جمع و جور کمی دردسر ایجاد میکند. حتی در کیسهای بزرگتر که خنک کنندهی پردازندهی بزرگی داشته باشند هم نصبِ کارت مُستلزمِ باز کردن و بستنِ مجددِ سینکِ خنک کننده است. ما هم مجبور شدیم فنِ غول پیکرِ Noctua NH-D15 را ابتدا باز کنیم و پس از نصبِ رادیاتورِ کارتِ Fury X در پشتِ کیس، مجددا آن را در جای خود روی مادربورد نصب کنیم.
در اینجا ۹ عدد نشانگرِ LED دقیقا بالای کانکتورهای برق ۸ پینی داریم که هدف از تعبیهی آنها نمایشِ میزانِ لود تراشهی گرافیکی در هر لحظه است. این نشانگرها قابلِ خاموش شدن هستند، رنگ آنها توسط تعدادی سوییچِ کوچک در پشتِ کارت از حالتِ پیش فرضِ قرمز به آبی خالص یا ترکیبی از آبی و قرمز قابلِ تغییر است. یک LED اضافهی دیگر در انتهای سمتِ چپِ آنها هم ، قرار گرفتنِ کارت در وضعیت ZeroCore یا حالتِ بیکار را با نورِ سبز رنگ نشان خواهد داد.
همانگونه که در کارتهای مُدرن اِیاِمدی مرسوم بوده است، یک سوییچِ بایوسِ کوچک روی کارت تعبیه شده که حالتِ دومی را برای بوتِ کارت در اختیار حرفهایها قرار میدهد که در صورت خطای تنظیماتِ بایوس اول بتوانند از تنظیماتِ کارخانهای بایوسِ دوم سیستم را بوت کنند.
در رزولوشنِ 2K فاصلهی Fury X با کارتِ رقیبِ قابل چشم پوشی است. کارتِ Fury X در اینجا حدودِ ۵۰ درصد سریعتر از R9 290X عمل میکند.
و این کارتی است که برای 4K ساخته شده است. کارتِ ما در اینجا اندکی بالاتر از GTX 980 Ti مُدلِ مرجع قرار میگیرد. آیا این رفتار در تستهای بعدی هم تکرار خواهد شد؟ اجازه دهید با هم بررسی کنیم.
در رزولوشنِ 2K اختلافِ بینِ دو رقیب کمتر میشود و Fury X تنها ۳ درصد از GTX 980 Ti عقبتر است. هر چند که کمینهی فریم در این دو مدل فاصلهی بیشتری دارد.
این بازی نمادی از تحمیلِ پردازشِ سنگین بر روی پردازندهی اصلی در عینِ فشار بر روی تراشهی گرافیکی است، در اینجا هم Fury X میانگینِ نرخِ فریمِ ۱۳ درصد پایینتر از GeForce GTX 980 Ti دارد.
بسیاری از کاربران داشتنِ راندمان بالا در این بازی را ملاک قدرت و توانمندی سیستم خود در اجرای بازیها قرار دادهاند. کارتهای پرچمدار اِنویدیا دوباره در صدرِ نمودار قرار دارند، اما کارتِ Fury X هم با فاصلهی تنها ۱۱ فریم در حال تعقیبِ رقیب است.
بازی زیبا و مشهوری که بر اساسِ موتورِ گرافیکی آنریل و با راندمانِ بالا ساخته شده است و در آن تمامی کارتهای گرافیکی ما متوسطِ راندمانی بالاتر از ۵۰ فریم را تولید میکنند. در اینجا Fury X حدودِ ۱۰ درصد از GTX 980 Ti کم قدرتتر ظاهر میشود.
در این بازی یک بنچمارکِ ۴۵ ثانیهای را با تنظیماتِ Ultra اجرا کردیم. کارتِ گرافیکیِ گران قیمتِ تایتان ایکس به GeForce GTX 980 Ti نزدیکتر است تا Fury X به آن. هر چند که Fury X تنها ۷ فریم کمتر تولید کرده است.
اعتبارِ توانِ مصرفی Fury X حقیقتا قابلِ رقابت با طیفِ وسیعی از کارتهای گرافیکی رده بالا است. کارت GTX 980 Ti باز هم اندکی بهینهتر عمل میکند .
خنک کنندهی مایع یکی از نقاطِ قوتِ دو گرافیک رده بالای اِیاِمدی است. ( در کنار R9 295X2) مشاهدهی دمای ۶۵ درجهی سانتیگراد پس از بازی سنگین بدونِ اغراق ستودنی است.