GTX-1080- 1200

بررسی کارت گرافیک GTX 1080 انویدیا - قسمت اول

دوشنبه ۱۷ خرداد ۱۳۹۵ - ۱۸:۰۳
مطالعه 11 دقیقه
معرفی کارت گرافیک جدید انویدیا، GTX1080 یکی از مهمترین رویدادهای صنعت گیمینگ در روزهای گذشته بوده و تمام کارشناسان و البته خوره‌های بازی منتظر دسترسی به نمونه‌ای از این محصول برای بررسی آن بوده‌اند. برای بررسی قدم به قدم این پرچمدار قدرتمند با زومجی همراه باشید.
تبلیغات

پس از انتشار اخبار و گمانه‌زنی‌های فراوان در مورد نسل جدید معماری گرافیکی انویدیا و بالا گرفتن بحث بر سر مشخصات اولین کارت‌های در نظر گرفته شده برای عرضه بر اساس آن، انتظارات به پایان رسید و انویدیا طی مراسمی رسمی اولین محصولات گیمینگ معماری پاسکال (همچون نسل‌های گذشته بر گرفته شده از نام ریاصیدانان مشهوری مانند مَکسول و کپلر) با نام‌های GTX 1080 و GTX 1070 را رونمایی کرد و مشخصات کلی و قیمت آنها را هم اعلام نمود.

در این مقاله سعی می‌کنیم ضمن معرفی مشخصات و قابلیت‌های فنی تراشه‌ی جدید، به تکنیک‌های جدید معرفی شده با این معماری نیز بپردازیم و کارکرد و استفاده‌ی هر یک را بیان کنیم. برخی از این قابلیت‌ها فقط در معماری پاسکال قابل استفاده خواهند بود و برخی نیز ممکن است از طریق بروز رسانی درایور گرافیکی با کارت‌های نسل قبلی جیفورس کار کنند. به خاطر داشته باشید این مشخصات بر اساس مدل مرجع انویدیا یا همان مدلی که Founders Edition نام گرفته بیان می‌شود و برخی مشخصه‌های فنی مانند فرکانس کاری GPU و همین طور فرکانس کاری تراشه‌های حافظه در مدل‌های اختصاصی متفاوت از این ارقام خواهد بود.

GTX1080notes_MG_3864

شاید به خاطر داشته باشید که اولین محصول معماری پاسکالِ انویدیا نه یک کارت گرافیک بازی، بلکه یک کارت محاسباتی قدرتمند با نام Tesla P100 بود که بر اساس تراشه‌ی پاسکال بزرگ یا همان GP100 ساخته شده است و شامل تمام هسته‌های پردازشی در نظر گرفته شده با قابلیت (single precision (FP32 و (Double precision (FP64 در این تراشه است که در مجموع شامل ۳۸۴۰+۱۹۲۰ واحد CUDA و ۲۴۰ واحد ترسیم بافت یا TU می‌شود. البته Tesla P100 از فناوری حافظه‌ی HBM2 هم پشتیبانی می‌کند که با این تفسیر اگر قرار باشد انویدیا یک محصول گیمینگ را هم بر پایه‌ی تراشه‌ی GP100 عرضه کند قاعدتا باید حافظه‌ی HBM2 داشته باشد و نه حافظه‌های GDDR5 معمولی یا GDDR5X، چرا که به کنترلر حافظه‌ی متفاوتی در خودِ GPU نیاز خواهد داشت.

کپی لینک

فناوری ساخت ۱۶ نانومتری

انویدیا با وجود در دست داشتن معماری جدید با واحدهای بیشتر و راندمان بهینه‌تر، یک چالش کاملا جدی و بزرگ را نیز پشت سر گذاشت که اثبات موفقیتش همین عرضه‌ی کارت‌ GTX 1080 بود و این چالش چیزی نبود جز فناوری ساخت جدیدِ ۱۶ نانومتری. اگر مقاله‌ی قبلی ما در مورد معرفی محصولات تجاری پاسکال را خوانده باشید، در آنجا اهمیت این موضوع را به تفضیل شرح دادیم. هم انویدیا و هم ای‌ام‌دی از سال ۲۰۱۱ میلادی از معماری ۲۸ نانومتری در تراشه‌های خود استفاده کرده‌اند و تلاش برای دستیابی به فناوری ۲۰ نانومتری در دو سال گذشته هم ناکام ماند، اما امسال و در میانه‌ی سال ۲۰۱۶ میلادی، ظرفیت و کیفیت تولید کارخانه‌ی TSMC (سازنده‌ی نیمه هادی‌ها و تراشه‌های مبتنی بر آن که ساخت سفارشات Nvidia و AMD را بر عهده دارد) در پروسه‌ی ساخت ۱۶ نانومتری به حدی بالغ شده که می‌توان محصولات تجاری جدید را به صورت انبوه و کیفیت مناسب تولید و عرضه کرد. فناوری جدید ۱۶ نانومتری با نام FinFET نوعی روش بهینه‌ی تولید برای کاهشِمصرف توان، کاهش ولتاژ و همین‌طور کاهش نشتی ترانزیستورها در این ابعاد است. انویدیا پس از مدت‌ها به کمک این فناوری توانسته به طرز چشمگیری فرکانس کاری تراشه‌های پاسکال را نسبت به مکسول و کپلر افزایش و در عین حال ابعاد تراشه و میزان مصرف آنها را کاهش دهد.

NVIDIA 16nm
کپی لینک

استفاده از GDDR5X

علاوه بر پروسه‌ی ساخت جدید و افزایش فرکانس کاری، انویدیا برای اولین بار در این محصول از تراشه‌های حافظه‌ی GDDR5X استفاده کرده است. این تراشه‌های حافظه با استاندارد جدید به تازگی توسط شرکت میکرون (یکی از بزرگ‌ترین سازندگان تراشه‌های حافظه در دنیا) به تولید انبوه رسیده‌اند و بر خلاف حافظه‌های HBM، بدون تغییرات اساسی در نحوه‌ی ارتباط با GPU و تغییر در کنترلر حافظه‌ی آن می‌توانند سرعت و پهنای باند بیشتری را برای کارت گرافیک فرآهم کنند. کارت GTX 1080 با این‌ که مانند GTX 980 از گذرگاه حافظه‌ی ۲۵۶ بیتی استفاده می‌کند، با کمک تراشه‌های GDDR5X توانسته پهنای باند حافظه‌ای نزدیک به کارت ۳۸۴ بیتی GTX 980Ti فرآهم کند و این به تنهایی پیشرفت قابل توجهی محسوب می‌شود. این روزها با افزایش کاربرد نمایشگرهای بزرگتر و یا ترکیب چند گانه‌ی آنها، پهنای باند حافظه‌ی بیشتر اهمیت بالاتری هم پیدا می‌کند. در مقام مقایسه، GTX 1080 با استفاده از GDDR5X با سرعت انتقال داده‌ای ۱۰ گیگابیت بر ثانیه توانسته ۴۳ درصد پهنای باند بیشتری نسبت به GTX 980 فرآهم کند و با احتساب برخی بهبودهای صورت گرفته در الگوریتم‌های فشرده سازی حافظه، در مجموع شاهد افزایش ۱.۷ برابری نسبت به GTX 980 هستیم.

GDDR5X ZoomG
کپی لینک

مشخصات فنی GTX 1080

در تراشه‌ی رده‌ی جیفورسِ معماری پاسکال، انویدیا تصمیم گرفته با حذف واحدهای Double Precision از واحدهای CUDA که برای بازی‌ها مد نظر نیست و بیشتر در محاسبات علمی پیچیده کاربرد دارد، تعداد آنها را هم از مجموع ۳۸۴۰ واحد FP32 در تراشه‌ی پاسکال بکار رفته در Tesla P100، به ۲۵۶۰ واحد کاهش داده و از پیچیدگی بی دلیل تراشه بکاهد و ضمنا هزینه‌های ساخت را هم کاهش دهد. تراشه‌ی بدست آمده GP104-400-A1 نامیده می‌شود.

کارت مرجع یا اگر دقیق‌تر بگوییم مدل Founders Edition انویدیا از GTX 1080 با سرعت ساعت‌های کاری پیش فرض می‌تواند راندمان ۹ ترافلاپس را برای محاسبات single precision مهیا کند، در حالی که این میزان در مدل مرجع همرده در نسل پیشین یعنی GTX 980 برابر با ۴.۶۱ ترافلاپس بود و حتی از توان ۶.۴ ترافلاپسی کارت رده بالاتر GTX 980Ti هم بسیار بیشتر است. طبیعی است که این کارت با استاندارد PCI-Express 3.0 کار می‌کند و حداکثر توان ۱۸۰ وات را در بدترین سناریو و حداقل بین ۵ تا ۱۰ وات را در حالت بیکار مصرف می‌کند.

GeForce

GTX 1080

GTX 1070

GTX Titan X

GTX 980 Ti

GTX 980

تراشه‌ی گرافیکی

GP104-400-A1

GP104-200-A1

GM200

GM200

GM204

معماری

Pascal

Pascal

Maxwell

Maxwell

Maxwell

تعداد ترانزیستور

7.2 Billion

7.2 Billion

8 Billion

8 Billion

5.2 Billion

پروسه‌ی ساخت

TSMC 16 nm

TSMC 16 nm

TSMC 28 nm

TSMC 28 nm

TSMC 28 nm

تعدادهسته‌های CUDA

2560

1920

3072

2816

2048

تعداد واحدهای SMX

20

15

24

22

16

تعداد واحدهای ROPs

64

64

96

96

64

فرکانس پایه‌ی تراشه

1,607 MHz

1,506 MHz

1,002 MHz

1,002 MHz

1,127 MHz

فرکانس توربوی تراشه

1,733 MHz

1,683 MHz

1,076 MHz

1,076 MHz

1,216 MHz

فرکانس حافظه

1,250 MHz

2,000 MHz

1,753 MHz

1,753 MHz

1,753 MHz

اندازه‌ی حافظه

8 GB

8 GB

12 GB

6 GB

4 GB

عرض باند گذرگاه حافظه

256-bit

256-bit

384-bit

384-bit

256-bit

پهنای باند حافظه

320 GB/s

256 GB/s

337 GB/s

337 GB/s

224 GB/s

راندمان محاسبات اعشاری

9.0 TFLOPS

6.45 TFLOPS

7.0 TFLOPS

6.4 TFLOPS

4.61 TFLOPS

سقف حرارتی تراشه

94 C

94 C

91C

91C

95 C

توان مصرفی

180 Watts

150 Watts

250 Watts

250 Watts

165 Watts

قیمت

599/699$

379/449$

999$

699$

549$

کپی لینک

پشتیبانی از نمایشگرهای HDR

انویدیا اکنون به طور کامل از قابلیت High Dynamic Rang یا به اختصار HDR پشتیبانی می‌کند. با این قابلیت می‌توان طیف رنگی گسترده‌تر و رنگ‌های طبیعی‌تر، کنتراست بیشتر، روشنایی بالاتر و محتوای زنده‌تری را در فیلم‌ها و بازی‌ها انتظار داشت. نمایشگرهای دارای این قابلیت از امسال در مرحله‌ی تولید انبوه قرار خواهند گرفت و ابتدا تلویزیون‌ها و سپس مانیتورها با این قابلیت در دسترس خواهند بود. پنل‌های HDR قادر به نمایش رنگ‌های سیاه با عمق رنگ OLEDها و روشنایی‌های درخشان با کیفیت نمایش LCD های رایج خواهند بود و کنتراست به مراتب بالاتری نسبت به نمایشگرهای فعلی و نزدیک به حد تشخیص چشمان انسان خواهند داشت. انویدیا خواسته تا پیشاپیش این امکان را در محصولش آماده‌ی استفاده داشته باشد. در همین راستا هم پاسکال از استاندارد رمزگشایی و رمزگذاری یا Codec جدید 10bit-HEVC برای استریم و پخش محتوای HDR پشتیبانی می‌کند.

HDR ZoomG
کپی لینک

فشرده سازی رنگ بهبود یافته

پیش از این از بهبودهای صورت گرفته در الگوریتم‌های فشرده سازی حافظه سخن به میان آمد. اما این تکنیک‌ها چیستند و چه کارکردی دارند؟ در واقع این تکنیک‌ها را می‌توان روش‌هایی برای صرفه جویی بیشتر در پهنای باند حافظه محسوب کرد که فشرده سازی رنگ‌ها یکی از این روش‌ها است. بخش فشرده سازی در تراشه‌ی گرافیکی به صورت پویا بهترین راه را از بین الگوریتم‌های مختلف برای فشرده سازی انتخاب می‌کند. مهمترین الگوریتم Delta Color Compression نام دارد که تفاوت میان پیکسل‌ها را در قالب بلاک‌هایی محاسبه کرده و آنها را به عنوان مجموعه‌های مرجع پیکسلی در نظر می‌گیرد و در مورد پیکسل‌های غیر مرجع، تنها اطلاعات دلتای آنها را با بلاک مرجع ذخیره می‌کند. به این ترتیب دیتای حاصل شده به نصف تقلیل پیدا می‌کند و اصطلاحا 2:1 Compression خوانده می‌شود.

Delta Color Copression

حالا در پاسکال نه تنها الگوریتم فشرده سازی ۲ به ۱ بهبود یافته، بلکه الگوریتم‌های جدیدتر ۴ به ۱ و همین طور ۸ به ۱ هم برای فشرده سازی رنگ‌ها معرفی شده‌اند که تا حد بسیار بیشتر و با تلفیق روش‌های قبلی فضای ذخیره سازی مورد نیاز را کاهش می‌دهند.

کپی لینک

Asynchronous Compute

برای بهینه سازی استفاده از توان پردازشی تراشه‌های گرافیکی و توزیع بار کاری پردازش دربازی‌های سنگین امروزی روش موثری وجود دارد که حالا در دایرکت ایکس 12 به استاندارد تبدیل شده و احتمالا با نام آن هم آشنا هستید. پردازش نامتقارن یا Asynchronous Compute از نسل قبلی مکسول در انویدیا و از خیلی قبل‌تر و با معماری GCN توسط ای‌ام‌دی بکار گرفته شده است. سناریوی محتمل برای استفاده از چنین روشی می‌تواند پردازش همزمان محاسبات فیزیک و بخش گرافیک موتور بازی روی GPU و اعمال برخی افکت‌ها مثل افکت‌های Postprocessing روی تصاویر رندر شده و قبل از نمایش باشد.

pascal-dynamic-load-balancing

در معماری مکسول برای دو نوع متفاوت از بارِ کاری مثل پردازش گرافیکی و پردازش فیزیک امکان تخصیص دو پارتیشن مجزا و ثابت از ابتدای شروع همزمان این دو عملیات وجود داشت و اگر یکی از آنها زودتر به پایان می‌رسید، بخشی از توان GPU بدون استفاده باقی می‌ماند، اما در معماری پاسکال این عملکرد بهبود یافته و پس از اتمام یک پردازش کاری، پردازش دیگر می‌تواند به صورت پویا تمام منابع تراشه را در اختیار خود بگیرد و حداکثر استفاده را از تخصیص منابع ببرد. این مزیت جدید، پردازش نامتقارن و بهبود یافته در نسل پاسکال است و باعث افزایش راندمان در حالت‌های پشتیبانی شده می‌شود. حتما به یاد دارید که این مورد یکی از نقطه ضعف‌های انویدیا در نسل قبلی بود و حواشی زیادی را در مورد بهینه نبودن راندمان آن ایجاد کرده بود. حالا انویدیا وعده‌ی بهبود راندمان در این قسمت را داده است.

کپی لینک

امکانات جانبی معرفی شده با پاسکال

Ansel

راه جدیدی برای گرفتن اسکرین شات‌های دلخواه در داخل بازی است که بجای یک تصویر معمولی، یک نمای ۳۶۰ درجه‌ی کامل از محیطی را که در بازی انتخاب کرده‌اید ثبت می‌کند. این نمای ۳ بعدی بعدا از طریق ابزار واقعیت مجازی یا VR مثل Oculus Rift و HTC Vive قابل دیدن خواهد بود و می‌توان از آنها در ابزارهای ویرایش حرفه‌ای هم تصاویری را با تنظیمات اختصاصی و رزولوشن خیلی بالا ایجاد کرد. این امکان نیاز به پشتیبانی در بازی‌ها دارد.

Ansel ZoomG

Nvidia FAST SYNC

یک حالت جدید در بین انواع گوناگون Sync یا همگام سازی در بازی‌ها است. رایج‌ترین حالتی که گیمرهای پی‌سی آن را می‌شناسند V-Sync است که با همگام‌سازی نرخ فریم خروجی کارت گرافیک با نرخ بازسازی مانیتورتان، از ایجاد بریدگی در تصاویر جلوگیری می‌کند. اما ایرادش این است که با گرفتن ترمز موتور گرافیکی بازی تا سقف قابل پشتیبانی در مانیتور شما (مثلا ۶۰ هرتز) ممکن است باعث ایجاد تاخیر در ورودی یا اصطلاحا Input Lag بشود. خاموش کردن V-Sync هم با این که تاخیر در ورودی را از بین می‌برد اما بریدگی در تصاویر را باز می‌گرداند. راه حل جدید انویدیا با نام Fast Sync هیچ کنترلی بر نرخ فریم کارت گرافیک ایجاد نمی‌کند و مانند حالت خاموش بودن V-Sync رفتار می‌کند، اما همزمان فریم‌های خروجی کارت گرافیکی را که باید نمایش داده شوند از بین فریم‌های مختلف انتخاب و به مانیتور ارسال می‌کند و نتیجه هم نمایش تصاویری با کیفیت زمانی است که V-Sync فعال است و کار می‌کند. با این تفاسیر تاخیر در ورودی هم حذف خواهد شد.

Fast Sync ZoomG

VR Audio

فناوری دیگر معرفی شده با کارت‌های گرافیکی GTX 1080/1070 هم مشابه‌ی چیزی است که قبلا ای‌ام‌دی معرفی کرده بود و AMD True Audio نام داشت. این فناوری هم شبیه سازی صدای ۳ بعدی و بیشتر مناسب استفاده در هدست‌های واقعیت مجازی است. با کمک این قابلیت GPU می‌تواند میزان انعکاس و جذب صدا را با توجه به محیط محاسبه و تولید کند. این گزینه هم به امکانات VRworks اضافه شده است.

Simultaneous Multi-Projection

در اینجا با قابلیت جالبی روبرو هستیم. اگر چند نمایشگر را پهلو به پهلو در کنار هم چیده باشید تا تصویری محیطی یا Surround را در بازی‌ها ایجاد کنید، این قابلیت بسیار کمک کننده خواهد بود. در حالت عادی وقتی ۳ مانیتور در کنار هم باشند زاویه‌ی دید تنها یک دوربین در تمام آنها شبیه سازی خواهد شد که اگر مانیتورها در یک خط باشند هیچ مشکلی نیست، اما اگر با زاویه‌ی خاصی در پیرامونِ شما قرار داشته باشند این زاویه باعث کشیده شدن غیر طبیعی تصاویر در نمایشگرهای کناری خواهد شد. قابلیت Simultaneous Multi-Projection یا به اختصار SMP به پاسکال اجازه می‌دهد که تا ۱۶ زاویه‌ی مجزا برای دوربین را به صورت سخت افزاری و تقریبا بدون تاثیر در راندمان شبیه سازی کند و در نتیجه برای مانیتورهای کناری با توجه به زاویه‌ی قرار گرفتنشان تصاویر سه بعدی را تولید کند. این قابلیت برای تولید تصاویر در هدست‌های VR هم نیاز به پردازش دو فریم مجزا برای دو چشم را از بین می‌برد و باعث افزایش کاملا محسوس راندمان می‌شود.

NVIDIA_Pascal_SMP

GPU Boost 3.0

نسخه‌ی جدید این فناوری در تراشه‌های پاسکال تعبیه شده و انعطاف عمل بیشتری را در تعیین فرکانس و ولتاژ متناسب با آن در اختیار قرار می‌دهد. این الگوریتم جدید می‌تواند به فرکانس پایدار بالاتر و راندمان بیشتر منتهی شود اگر محدودیت‌های حرارت و بار کاری تراشه همزمان رعایت شده باشند. در واقع در هر مقدار ولتاژی می‌توان آفست مجزایی را برای فرکانس تعیین کرد. این امکان در مکسول و نسل‌های قبلی روی نموداری ثابت و همسان افزایش پیدا می‌کرد. نرم افزارهای اختصاصی اورکلاک باید برای بهره گیری از این حالت بروز رسانی شوند.

GPU Boost 3.0

بروز رسانی حالت SLI

در این نسل پس از مدت‌ها قابلیت ارتباط کارت‌های گرافیکی در حالت SLI یا چند گانه تغییر کرده و تنها دو کارت برای این نسل به طور رسمی پشتیبانی می‌شود (استفاده از سه یا چهار کارت گرافیکی دیگر توصیه نمی‌شود) و همزمان از دو لینک برای ارتباط کارت‌‌ها استفاده خواهد شد. به این طریق پهنای باند ارتباطی کارت‌ها دو برابر خواهد شد.

بررسی راندمان...

در این مقاله سعی کردیم به معماری پاسکال و مشخصات آن تحت تراشه‌ی GP104-400 بپرداریم و امکانات و قابلیت‌های جدید معرفی شده با آن را شرح دهیم. روشن است که تمام اینها بدون داشتن تصوری در مورد راندمان این محصول خیلی امیدوار کننده و مثمر ثمر نخواهد بود. در اینجا این وعده را می‌دهیم که در بخش دوم مقاله بررسی اختصاصی و ویژه از راندمان GTX 1080 در زومجی داشته باشیم و این کارت را درعمل و در بنچمارک‌ها و بازی‌های واقعی محک بزنیم. پس منتظر بخش دوم مقاله‌ی ما باشید، چون محصول ویژه‌ی ما در راه است!

2016-05-geforce-gtx1080-nvidia

مشخصات فنی کامل، بهترین قیمت کارت گرافیک جدید در فروشگاه‌های اینترنتی و مقایسه‌ی کامل انواع کارت گرافیک را در بخش محصولات مشاهده کنید؛ انواع کارت گرافیک جی فورس و کارت گرافیک‌ رادئون برای مقایسه و خرید در دسترس کاربران است.

تهیه شده در زومجی

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات