بررسی کارت گرافیک GTX 1080 انویدیا - قسمت اول
پس از انتشار اخبار و گمانهزنیهای فراوان در مورد نسل جدید معماری گرافیکی انویدیا و بالا گرفتن بحث بر سر مشخصات اولین کارتهای در نظر گرفته شده برای عرضه بر اساس آن، انتظارات به پایان رسید و انویدیا طی مراسمی رسمی اولین محصولات گیمینگ معماری پاسکال (همچون نسلهای گذشته بر گرفته شده از نام ریاصیدانان مشهوری مانند مَکسول و کپلر) با نامهای GTX 1080 و GTX 1070 را رونمایی کرد و مشخصات کلی و قیمت آنها را هم اعلام نمود.
در این مقاله سعی میکنیم ضمن معرفی مشخصات و قابلیتهای فنی تراشهی جدید، به تکنیکهای جدید معرفی شده با این معماری نیز بپردازیم و کارکرد و استفادهی هر یک را بیان کنیم. برخی از این قابلیتها فقط در معماری پاسکال قابل استفاده خواهند بود و برخی نیز ممکن است از طریق بروز رسانی درایور گرافیکی با کارتهای نسل قبلی جیفورس کار کنند. به خاطر داشته باشید این مشخصات بر اساس مدل مرجع انویدیا یا همان مدلی که Founders Edition نام گرفته بیان میشود و برخی مشخصههای فنی مانند فرکانس کاری GPU و همین طور فرکانس کاری تراشههای حافظه در مدلهای اختصاصی متفاوت از این ارقام خواهد بود.
شاید به خاطر داشته باشید که اولین محصول معماری پاسکالِ انویدیا نه یک کارت گرافیک بازی، بلکه یک کارت محاسباتی قدرتمند با نام Tesla P100 بود که بر اساس تراشهی پاسکال بزرگ یا همان GP100 ساخته شده است و شامل تمام هستههای پردازشی در نظر گرفته شده با قابلیت (single precision (FP32 و (Double precision (FP64 در این تراشه است که در مجموع شامل ۳۸۴۰+۱۹۲۰ واحد CUDA و ۲۴۰ واحد ترسیم بافت یا TU میشود. البته Tesla P100 از فناوری حافظهی HBM2 هم پشتیبانی میکند که با این تفسیر اگر قرار باشد انویدیا یک محصول گیمینگ را هم بر پایهی تراشهی GP100 عرضه کند قاعدتا باید حافظهی HBM2 داشته باشد و نه حافظههای GDDR5 معمولی یا GDDR5X، چرا که به کنترلر حافظهی متفاوتی در خودِ GPU نیاز خواهد داشت.
فناوری ساخت ۱۶ نانومتری
انویدیا با وجود در دست داشتن معماری جدید با واحدهای بیشتر و راندمان بهینهتر، یک چالش کاملا جدی و بزرگ را نیز پشت سر گذاشت که اثبات موفقیتش همین عرضهی کارت GTX 1080 بود و این چالش چیزی نبود جز فناوری ساخت جدیدِ ۱۶ نانومتری. اگر مقالهی قبلی ما در مورد معرفی محصولات تجاری پاسکال را خوانده باشید، در آنجا اهمیت این موضوع را به تفضیل شرح دادیم. هم انویدیا و هم ایامدی از سال ۲۰۱۱ میلادی از معماری ۲۸ نانومتری در تراشههای خود استفاده کردهاند و تلاش برای دستیابی به فناوری ۲۰ نانومتری در دو سال گذشته هم ناکام ماند، اما امسال و در میانهی سال ۲۰۱۶ میلادی، ظرفیت و کیفیت تولید کارخانهی TSMC (سازندهی نیمه هادیها و تراشههای مبتنی بر آن که ساخت سفارشات Nvidia و AMD را بر عهده دارد) در پروسهی ساخت ۱۶ نانومتری به حدی بالغ شده که میتوان محصولات تجاری جدید را به صورت انبوه و کیفیت مناسب تولید و عرضه کرد. فناوری جدید ۱۶ نانومتری با نام FinFET نوعی روش بهینهی تولید برای کاهشِمصرف توان، کاهش ولتاژ و همینطور کاهش نشتی ترانزیستورها در این ابعاد است. انویدیا پس از مدتها به کمک این فناوری توانسته به طرز چشمگیری فرکانس کاری تراشههای پاسکال را نسبت به مکسول و کپلر افزایش و در عین حال ابعاد تراشه و میزان مصرف آنها را کاهش دهد.
استفاده از GDDR5X
علاوه بر پروسهی ساخت جدید و افزایش فرکانس کاری، انویدیا برای اولین بار در این محصول از تراشههای حافظهی GDDR5X استفاده کرده است. این تراشههای حافظه با استاندارد جدید به تازگی توسط شرکت میکرون (یکی از بزرگترین سازندگان تراشههای حافظه در دنیا) به تولید انبوه رسیدهاند و بر خلاف حافظههای HBM، بدون تغییرات اساسی در نحوهی ارتباط با GPU و تغییر در کنترلر حافظهی آن میتوانند سرعت و پهنای باند بیشتری را برای کارت گرافیک فرآهم کنند. کارت GTX 1080 با این که مانند GTX 980 از گذرگاه حافظهی ۲۵۶ بیتی استفاده میکند، با کمک تراشههای GDDR5X توانسته پهنای باند حافظهای نزدیک به کارت ۳۸۴ بیتی GTX 980Ti فرآهم کند و این به تنهایی پیشرفت قابل توجهی محسوب میشود. این روزها با افزایش کاربرد نمایشگرهای بزرگتر و یا ترکیب چند گانهی آنها، پهنای باند حافظهی بیشتر اهمیت بالاتری هم پیدا میکند. در مقام مقایسه، GTX 1080 با استفاده از GDDR5X با سرعت انتقال دادهای ۱۰ گیگابیت بر ثانیه توانسته ۴۳ درصد پهنای باند بیشتری نسبت به GTX 980 فرآهم کند و با احتساب برخی بهبودهای صورت گرفته در الگوریتمهای فشرده سازی حافظه، در مجموع شاهد افزایش ۱.۷ برابری نسبت به GTX 980 هستیم.
مشخصات فنی GTX 1080
در تراشهی ردهی جیفورسِ معماری پاسکال، انویدیا تصمیم گرفته با حذف واحدهای Double Precision از واحدهای CUDA که برای بازیها مد نظر نیست و بیشتر در محاسبات علمی پیچیده کاربرد دارد، تعداد آنها را هم از مجموع ۳۸۴۰ واحد FP32 در تراشهی پاسکال بکار رفته در Tesla P100، به ۲۵۶۰ واحد کاهش داده و از پیچیدگی بی دلیل تراشه بکاهد و ضمنا هزینههای ساخت را هم کاهش دهد. تراشهی بدست آمده GP104-400-A1 نامیده میشود.
کارت مرجع یا اگر دقیقتر بگوییم مدل Founders Edition انویدیا از GTX 1080 با سرعت ساعتهای کاری پیش فرض میتواند راندمان ۹ ترافلاپس را برای محاسبات single precision مهیا کند، در حالی که این میزان در مدل مرجع همرده در نسل پیشین یعنی GTX 980 برابر با ۴.۶۱ ترافلاپس بود و حتی از توان ۶.۴ ترافلاپسی کارت رده بالاتر GTX 980Ti هم بسیار بیشتر است. طبیعی است که این کارت با استاندارد PCI-Express 3.0 کار میکند و حداکثر توان ۱۸۰ وات را در بدترین سناریو و حداقل بین ۵ تا ۱۰ وات را در حالت بیکار مصرف میکند.
GeForce | GTX 1080 | GTX 1070 | GTX Titan X | GTX 980 Ti | GTX 980 |
---|---|---|---|---|---|
تراشهی گرافیکی | GP104-400-A1 | GP104-200-A1 | GM200 | GM200 | GM204 |
معماری | Pascal | Pascal | Maxwell | Maxwell | Maxwell |
تعداد ترانزیستور | 7.2 Billion | 7.2 Billion | 8 Billion | 8 Billion | 5.2 Billion |
پروسهی ساخت | TSMC 16 nm | TSMC 16 nm | TSMC 28 nm | TSMC 28 nm | TSMC 28 nm |
تعدادهستههای CUDA | 2560 | 1920 | 3072 | 2816 | 2048 |
تعداد واحدهای SMX | 20 | 15 | 24 | 22 | 16 |
تعداد واحدهای ROPs | 64 | 64 | 96 | 96 | 64 |
فرکانس پایهی تراشه | 1,607 MHz | 1,506 MHz | 1,002 MHz | 1,002 MHz | 1,127 MHz |
فرکانس توربوی تراشه | 1,733 MHz | 1,683 MHz | 1,076 MHz | 1,076 MHz | 1,216 MHz |
فرکانس حافظه | 1,250 MHz | 2,000 MHz | 1,753 MHz | 1,753 MHz | 1,753 MHz |
اندازهی حافظه | 8 GB | 8 GB | 12 GB | 6 GB | 4 GB |
عرض باند گذرگاه حافظه | 256-bit | 256-bit | 384-bit | 384-bit | 256-bit |
پهنای باند حافظه | 320 GB/s | 256 GB/s | 337 GB/s | 337 GB/s | 224 GB/s |
راندمان محاسبات اعشاری | 9.0 TFLOPS | 6.45 TFLOPS | 7.0 TFLOPS | 6.4 TFLOPS | 4.61 TFLOPS |
سقف حرارتی تراشه | 94 C | 94 C | 91C | 91C | 95 C |
توان مصرفی | 180 Watts | 150 Watts | 250 Watts | 250 Watts | 165 Watts |
قیمت | 599/699$ | 379/449$ | 999$ | 699$ | 549$ |
پشتیبانی از نمایشگرهای HDR
انویدیا اکنون به طور کامل از قابلیت High Dynamic Rang یا به اختصار HDR پشتیبانی میکند. با این قابلیت میتوان طیف رنگی گستردهتر و رنگهای طبیعیتر، کنتراست بیشتر، روشنایی بالاتر و محتوای زندهتری را در فیلمها و بازیها انتظار داشت. نمایشگرهای دارای این قابلیت از امسال در مرحلهی تولید انبوه قرار خواهند گرفت و ابتدا تلویزیونها و سپس مانیتورها با این قابلیت در دسترس خواهند بود. پنلهای HDR قادر به نمایش رنگهای سیاه با عمق رنگ OLEDها و روشناییهای درخشان با کیفیت نمایش LCD های رایج خواهند بود و کنتراست به مراتب بالاتری نسبت به نمایشگرهای فعلی و نزدیک به حد تشخیص چشمان انسان خواهند داشت. انویدیا خواسته تا پیشاپیش این امکان را در محصولش آمادهی استفاده داشته باشد. در همین راستا هم پاسکال از استاندارد رمزگشایی و رمزگذاری یا Codec جدید 10bit-HEVC برای استریم و پخش محتوای HDR پشتیبانی میکند.
فشرده سازی رنگ بهبود یافته
پیش از این از بهبودهای صورت گرفته در الگوریتمهای فشرده سازی حافظه سخن به میان آمد. اما این تکنیکها چیستند و چه کارکردی دارند؟ در واقع این تکنیکها را میتوان روشهایی برای صرفه جویی بیشتر در پهنای باند حافظه محسوب کرد که فشرده سازی رنگها یکی از این روشها است. بخش فشرده سازی در تراشهی گرافیکی به صورت پویا بهترین راه را از بین الگوریتمهای مختلف برای فشرده سازی انتخاب میکند. مهمترین الگوریتم Delta Color Compression نام دارد که تفاوت میان پیکسلها را در قالب بلاکهایی محاسبه کرده و آنها را به عنوان مجموعههای مرجع پیکسلی در نظر میگیرد و در مورد پیکسلهای غیر مرجع، تنها اطلاعات دلتای آنها را با بلاک مرجع ذخیره میکند. به این ترتیب دیتای حاصل شده به نصف تقلیل پیدا میکند و اصطلاحا 2:1 Compression خوانده میشود.
حالا در پاسکال نه تنها الگوریتم فشرده سازی ۲ به ۱ بهبود یافته، بلکه الگوریتمهای جدیدتر ۴ به ۱ و همین طور ۸ به ۱ هم برای فشرده سازی رنگها معرفی شدهاند که تا حد بسیار بیشتر و با تلفیق روشهای قبلی فضای ذخیره سازی مورد نیاز را کاهش میدهند.
Asynchronous Compute
برای بهینه سازی استفاده از توان پردازشی تراشههای گرافیکی و توزیع بار کاری پردازش دربازیهای سنگین امروزی روش موثری وجود دارد که حالا در دایرکت ایکس 12 به استاندارد تبدیل شده و احتمالا با نام آن هم آشنا هستید. پردازش نامتقارن یا Asynchronous Compute از نسل قبلی مکسول در انویدیا و از خیلی قبلتر و با معماری GCN توسط ایامدی بکار گرفته شده است. سناریوی محتمل برای استفاده از چنین روشی میتواند پردازش همزمان محاسبات فیزیک و بخش گرافیک موتور بازی روی GPU و اعمال برخی افکتها مثل افکتهای Postprocessing روی تصاویر رندر شده و قبل از نمایش باشد.
در معماری مکسول برای دو نوع متفاوت از بارِ کاری مثل پردازش گرافیکی و پردازش فیزیک امکان تخصیص دو پارتیشن مجزا و ثابت از ابتدای شروع همزمان این دو عملیات وجود داشت و اگر یکی از آنها زودتر به پایان میرسید، بخشی از توان GPU بدون استفاده باقی میماند، اما در معماری پاسکال این عملکرد بهبود یافته و پس از اتمام یک پردازش کاری، پردازش دیگر میتواند به صورت پویا تمام منابع تراشه را در اختیار خود بگیرد و حداکثر استفاده را از تخصیص منابع ببرد. این مزیت جدید، پردازش نامتقارن و بهبود یافته در نسل پاسکال است و باعث افزایش راندمان در حالتهای پشتیبانی شده میشود. حتما به یاد دارید که این مورد یکی از نقطه ضعفهای انویدیا در نسل قبلی بود و حواشی زیادی را در مورد بهینه نبودن راندمان آن ایجاد کرده بود. حالا انویدیا وعدهی بهبود راندمان در این قسمت را داده است.
امکانات جانبی معرفی شده با پاسکال
Ansel
راه جدیدی برای گرفتن اسکرین شاتهای دلخواه در داخل بازی است که بجای یک تصویر معمولی، یک نمای ۳۶۰ درجهی کامل از محیطی را که در بازی انتخاب کردهاید ثبت میکند. این نمای ۳ بعدی بعدا از طریق ابزار واقعیت مجازی یا VR مثل Oculus Rift و HTC Vive قابل دیدن خواهد بود و میتوان از آنها در ابزارهای ویرایش حرفهای هم تصاویری را با تنظیمات اختصاصی و رزولوشن خیلی بالا ایجاد کرد. این امکان نیاز به پشتیبانی در بازیها دارد.
Nvidia FAST SYNC
یک حالت جدید در بین انواع گوناگون Sync یا همگام سازی در بازیها است. رایجترین حالتی که گیمرهای پیسی آن را میشناسند V-Sync است که با همگامسازی نرخ فریم خروجی کارت گرافیک با نرخ بازسازی مانیتورتان، از ایجاد بریدگی در تصاویر جلوگیری میکند. اما ایرادش این است که با گرفتن ترمز موتور گرافیکی بازی تا سقف قابل پشتیبانی در مانیتور شما (مثلا ۶۰ هرتز) ممکن است باعث ایجاد تاخیر در ورودی یا اصطلاحا Input Lag بشود. خاموش کردن V-Sync هم با این که تاخیر در ورودی را از بین میبرد اما بریدگی در تصاویر را باز میگرداند. راه حل جدید انویدیا با نام Fast Sync هیچ کنترلی بر نرخ فریم کارت گرافیک ایجاد نمیکند و مانند حالت خاموش بودن V-Sync رفتار میکند، اما همزمان فریمهای خروجی کارت گرافیکی را که باید نمایش داده شوند از بین فریمهای مختلف انتخاب و به مانیتور ارسال میکند و نتیجه هم نمایش تصاویری با کیفیت زمانی است که V-Sync فعال است و کار میکند. با این تفاسیر تاخیر در ورودی هم حذف خواهد شد.
VR Audio
فناوری دیگر معرفی شده با کارتهای گرافیکی GTX 1080/1070 هم مشابهی چیزی است که قبلا ایامدی معرفی کرده بود و AMD True Audio نام داشت. این فناوری هم شبیه سازی صدای ۳ بعدی و بیشتر مناسب استفاده در هدستهای واقعیت مجازی است. با کمک این قابلیت GPU میتواند میزان انعکاس و جذب صدا را با توجه به محیط محاسبه و تولید کند. این گزینه هم به امکانات VRworks اضافه شده است.
Simultaneous Multi-Projection
در اینجا با قابلیت جالبی روبرو هستیم. اگر چند نمایشگر را پهلو به پهلو در کنار هم چیده باشید تا تصویری محیطی یا Surround را در بازیها ایجاد کنید، این قابلیت بسیار کمک کننده خواهد بود. در حالت عادی وقتی ۳ مانیتور در کنار هم باشند زاویهی دید تنها یک دوربین در تمام آنها شبیه سازی خواهد شد که اگر مانیتورها در یک خط باشند هیچ مشکلی نیست، اما اگر با زاویهی خاصی در پیرامونِ شما قرار داشته باشند این زاویه باعث کشیده شدن غیر طبیعی تصاویر در نمایشگرهای کناری خواهد شد. قابلیت Simultaneous Multi-Projection یا به اختصار SMP به پاسکال اجازه میدهد که تا ۱۶ زاویهی مجزا برای دوربین را به صورت سخت افزاری و تقریبا بدون تاثیر در راندمان شبیه سازی کند و در نتیجه برای مانیتورهای کناری با توجه به زاویهی قرار گرفتنشان تصاویر سه بعدی را تولید کند. این قابلیت برای تولید تصاویر در هدستهای VR هم نیاز به پردازش دو فریم مجزا برای دو چشم را از بین میبرد و باعث افزایش کاملا محسوس راندمان میشود.
GPU Boost 3.0
نسخهی جدید این فناوری در تراشههای پاسکال تعبیه شده و انعطاف عمل بیشتری را در تعیین فرکانس و ولتاژ متناسب با آن در اختیار قرار میدهد. این الگوریتم جدید میتواند به فرکانس پایدار بالاتر و راندمان بیشتر منتهی شود اگر محدودیتهای حرارت و بار کاری تراشه همزمان رعایت شده باشند. در واقع در هر مقدار ولتاژی میتوان آفست مجزایی را برای فرکانس تعیین کرد. این امکان در مکسول و نسلهای قبلی روی نموداری ثابت و همسان افزایش پیدا میکرد. نرم افزارهای اختصاصی اورکلاک باید برای بهره گیری از این حالت بروز رسانی شوند.
بروز رسانی حالت SLI
در این نسل پس از مدتها قابلیت ارتباط کارتهای گرافیکی در حالت SLI یا چند گانه تغییر کرده و تنها دو کارت برای این نسل به طور رسمی پشتیبانی میشود (استفاده از سه یا چهار کارت گرافیکی دیگر توصیه نمیشود) و همزمان از دو لینک برای ارتباط کارتها استفاده خواهد شد. به این طریق پهنای باند ارتباطی کارتها دو برابر خواهد شد.
بررسی راندمان...
در این مقاله سعی کردیم به معماری پاسکال و مشخصات آن تحت تراشهی GP104-400 بپرداریم و امکانات و قابلیتهای جدید معرفی شده با آن را شرح دهیم. روشن است که تمام اینها بدون داشتن تصوری در مورد راندمان این محصول خیلی امیدوار کننده و مثمر ثمر نخواهد بود. در اینجا این وعده را میدهیم که در بخش دوم مقاله بررسی اختصاصی و ویژه از راندمان GTX 1080 در زومجی داشته باشیم و این کارت را درعمل و در بنچمارکها و بازیهای واقعی محک بزنیم. پس منتظر بخش دوم مقالهی ما باشید، چون محصول ویژهی ما در راه است!
مشخصات فنی کامل، بهترین قیمت کارت گرافیک جدید در فروشگاههای اینترنتی و مقایسهی کامل انواع کارت گرافیک را در بخش محصولات مشاهده کنید؛ انواع کارت گرافیک جی فورس و کارت گرافیک رادئون برای مقایسه و خرید در دسترس کاربران است.
تهیه شده در زومجی
نظرات