بررسی کارت گرافیک GTX 1080 انویدیا - قسمت اول

دوشنبه ۱۷ خرداد ۱۳۹۵ - ۱۸:۰۳

مطالعه 11 دقیقه

معرفی کارت گرافیک جدید انویدیا، GTX1080 یکی از مهمترین رویدادهای صنعت گیمینگ در روزهای گذشته بوده و تمام کارشناسان و البته خوره‌های بازی منتظر دسترسی به نمونه‌ای از این محصول برای بررسی آن بوده‌اند. برای بررسی قدم به قدم این پرچمدار قدرتمند با زومجی همراه باشید.

تبلیغات

بررسی کارت گرافیک TITAN X انویدیا

بررسی کارت گرافیک GeForce GTX 980 Ti انویدیا

بررسی کارت گرافیکی ای ام دی رادئون R9 Fury X

بررسی کارت گرافیک گیگابایت R9 Fury Nano

پس از انتشار اخبار و گمانه‌زنی‌های فراوان در مورد نسل جدید معماری گرافیکی انویدیا و بالا گرفتن بحث بر سر مشخصات اولین کارت‌های در نظر گرفته شده برای عرضه بر اساس آن، انتظارات به پایان رسید و انویدیا طی مراسمی رسمی اولین محصولات گیمینگ معماری پاسکال (همچون نسل‌های گذشته بر گرفته شده از نام ریاصیدانان مشهوری مانند مَکسول و کپلر) با نام‌های GTX 1080 و GTX 1070 را رونمایی کرد و مشخصات کلی و قیمت آنها را هم اعلام نمود.

در این مقاله سعی می‌کنیم ضمن معرفی مشخصات و قابلیت‌های فنی تراشه‌ی جدید، به تکنیک‌های جدید معرفی شده با این معماری نیز بپردازیم و کارکرد و استفاده‌ی هر یک را بیان کنیم. برخی از این قابلیت‌ها فقط در معماری پاسکال قابل استفاده خواهند بود و برخی نیز ممکن است از طریق بروز رسانی درایور گرافیکی با کارت‌های نسل قبلی جیفورس کار کنند. به خاطر داشته باشید این مشخصات بر اساس مدل مرجع انویدیا یا همان مدلی که Founders Edition نام گرفته بیان می‌شود و برخی مشخصه‌های فنی مانند فرکانس کاری GPU و همین طور فرکانس کاری تراشه‌های حافظه در مدل‌های اختصاصی متفاوت از این ارقام خواهد بود.

شاید به خاطر داشته باشید که اولین محصول معماری پاسکالِ انویدیا نه یک کارت گرافیک بازی، بلکه یک کارت محاسباتی قدرتمند با نام Tesla P100 بود که بر اساس تراشه‌ی پاسکال بزرگ یا همان GP100 ساخته شده است و شامل تمام هسته‌های پردازشی در نظر گرفته شده با قابلیت (single precision (FP32 و (Double precision (FP64 در این تراشه است که در مجموع شامل ۳۸۴۰+۱۹۲۰ واحد CUDA و ۲۴۰ واحد ترسیم بافت یا TU می‌شود. البته Tesla P100 از فناوری حافظه‌ی HBM2 هم پشتیبانی می‌کند که با این تفسیر اگر قرار باشد انویدیا یک محصول گیمینگ را هم بر پایه‌ی تراشه‌ی GP100 عرضه کند قاعدتا باید حافظه‌ی HBM2 داشته باشد و نه حافظه‌های GDDR5 معمولی یا GDDR5X، چرا که به کنترلر حافظه‌ی متفاوتی در خودِ GPU نیاز خواهد داشت.

کپی لینک

فناوری ساخت ۱۶ نانومتری

معرفی محصولات تجاری پاسکال و آغاز فصلی نوین در صنعت کارت های گرافیکی

انویدیا با وجود در دست داشتن معماری جدید با واحدهای بیشتر و راندمان بهینه‌تر، یک چالش کاملا جدی و بزرگ را نیز پشت سر گذاشت که اثبات موفقیتش همین عرضه‌ی کارت‌ GTX 1080 بود و این چالش چیزی نبود جز فناوری ساخت جدیدِ ۱۶ نانومتری. اگر مقاله‌ی قبلی ما در مورد معرفی محصولات تجاری پاسکال را خوانده باشید، در آنجا اهمیت این موضوع را به تفضیل شرح دادیم. هم انویدیا و هم ای‌ام‌دی از سال ۲۰۱۱ میلادی از معماری ۲۸ نانومتری در تراشه‌های خود استفاده کرده‌اند و تلاش برای دستیابی به فناوری ۲۰ نانومتری در دو سال گذشته هم ناکام ماند، اما امسال و در میانه‌ی سال ۲۰۱۶ میلادی، ظرفیت و کیفیت تولید کارخانه‌ی TSMC (سازنده‌ی نیمه هادی‌ها و تراشه‌های مبتنی بر آن که ساخت سفارشات Nvidia و AMD را بر عهده دارد) در پروسه‌ی ساخت ۱۶ نانومتری به حدی بالغ شده که می‌توان محصولات تجاری جدید را به صورت انبوه و کیفیت مناسب تولید و عرضه کرد. فناوری جدید ۱۶ نانومتری با نام FinFET نوعی روش بهینه‌ی تولید برای کاهشِمصرف توان، کاهش ولتاژ و همین‌طور کاهش نشتی ترانزیستورها در این ابعاد است. انویدیا پس از مدت‌ها به کمک این فناوری توانسته به طرز چشمگیری فرکانس کاری تراشه‌های پاسکال را نسبت به مکسول و کپلر افزایش و در عین حال ابعاد تراشه و میزان مصرف آنها را کاهش دهد.

کپی لینک

استفاده از GDDR5X

علاوه بر پروسه‌ی ساخت جدید و افزایش فرکانس کاری، انویدیا برای اولین بار در این محصول از تراشه‌های حافظه‌ی GDDR5X استفاده کرده است. این تراشه‌های حافظه با استاندارد جدید به تازگی توسط شرکت میکرون (یکی از بزرگ‌ترین سازندگان تراشه‌های حافظه در دنیا) به تولید انبوه رسیده‌اند و بر خلاف حافظه‌های HBM، بدون تغییرات اساسی در نحوه‌ی ارتباط با GPU و تغییر در کنترلر حافظه‌ی آن می‌توانند سرعت و پهنای باند بیشتری را برای کارت گرافیک فرآهم کنند. کارت GTX 1080 با این‌ که مانند GTX 980 از گذرگاه حافظه‌ی ۲۵۶ بیتی استفاده می‌کند، با کمک تراشه‌های GDDR5X توانسته پهنای باند حافظه‌ای نزدیک به کارت ۳۸۴ بیتی GTX 980Ti فرآهم کند و این به تنهایی پیشرفت قابل توجهی محسوب می‌شود. این روزها با افزایش کاربرد نمایشگرهای بزرگتر و یا ترکیب چند گانه‌ی آنها، پهنای باند حافظه‌ی بیشتر اهمیت بالاتری هم پیدا می‌کند. در مقام مقایسه، GTX 1080 با استفاده از GDDR5X با سرعت انتقال داده‌ای ۱۰ گیگابیت بر ثانیه توانسته ۴۳ درصد پهنای باند بیشتری نسبت به GTX 980 فرآهم کند و با احتساب برخی بهبودهای صورت گرفته در الگوریتم‌های فشرده سازی حافظه، در مجموع شاهد افزایش ۱.۷ برابری نسبت به GTX 980 هستیم.

کپی لینک

مشخصات فنی GTX 1080

در تراشه‌ی رده‌ی جیفورسِ معماری پاسکال، انویدیا تصمیم گرفته با حذف واحدهای Double Precision از واحدهای CUDA که برای بازی‌ها مد نظر نیست و بیشتر در محاسبات علمی پیچیده کاربرد دارد، تعداد آنها را هم از مجموع ۳۸۴۰ واحد FP32 در تراشه‌ی پاسکال بکار رفته در Tesla P100، به ۲۵۶۰ واحد کاهش داده و از پیچیدگی بی دلیل تراشه بکاهد و ضمنا هزینه‌های ساخت را هم کاهش دهد. تراشه‌ی بدست آمده GP104-400-A1 نامیده می‌شود.

کارت مرجع یا اگر دقیق‌تر بگوییم مدل Founders Edition انویدیا از GTX 1080 با سرعت ساعت‌های کاری پیش فرض می‌تواند راندمان ۹ ترافلاپس را برای محاسبات single precision مهیا کند، در حالی که این میزان در مدل مرجع همرده در نسل پیشین یعنی GTX 980 برابر با ۴.۶۱ ترافلاپس بود و حتی از توان ۶.۴ ترافلاپسی کارت رده بالاتر GTX 980Ti هم بسیار بیشتر است. طبیعی است که این کارت با استاندارد PCI-Express 3.0 کار می‌کند و حداکثر توان ۱۸۰ وات را در بدترین سناریو و حداقل بین ۵ تا ۱۰ وات را در حالت بیکار مصرف می‌کند.

GeForce	GTX 1080	GTX 1070	GTX Titan X	GTX 980 Ti	GTX 980
تراشه‌ی گرافیکی	GP104-400-A1	GP104-200-A1	GM200	GM200	GM204
معماری	Pascal	Pascal	Maxwell	Maxwell	Maxwell
تعداد ترانزیستور	7.2 Billion	7.2 Billion	8 Billion	8 Billion	5.2 Billion
پروسه‌ی ساخت	TSMC 16 nm	TSMC 16 nm	TSMC 28 nm	TSMC 28 nm	TSMC 28 nm
تعدادهسته‌های CUDA	2560	1920	3072	2816	2048
تعداد واحدهای SMX	20	15	24	22	16
تعداد واحدهای ROPs	64	64	96	96	64
فرکانس پایه‌ی تراشه	1,607 MHz	1,506 MHz	1,002 MHz	1,002 MHz	1,127 MHz
فرکانس توربوی تراشه	1,733 MHz	1,683 MHz	1,076 MHz	1,076 MHz	1,216 MHz
فرکانس حافظه	1,250 MHz	2,000 MHz	1,753 MHz	1,753 MHz	1,753 MHz
اندازه‌ی حافظه	8 GB	8 GB	12 GB	6 GB	4 GB
عرض باند گذرگاه حافظه	256-bit	256-bit	384-bit	384-bit	256-bit
پهنای باند حافظه	320 GB/s	256 GB/s	337 GB/s	337 GB/s	224 GB/s
راندمان محاسبات اعشاری	9.0 TFLOPS	6.45 TFLOPS	7.0 TFLOPS	6.4 TFLOPS	4.61 TFLOPS
سقف حرارتی تراشه	94 C	94 C	91C	91C	95 C
توان مصرفی	180 Watts	150 Watts	250 Watts	250 Watts	165 Watts
قیمت	599/699$	379/449$	999$	699$	549$

کپی لینک

پشتیبانی از نمایشگرهای HDR

انویدیا اکنون به طور کامل از قابلیت High Dynamic Rang یا به اختصار HDR پشتیبانی می‌کند. با این قابلیت می‌توان طیف رنگی گسترده‌تر و رنگ‌های طبیعی‌تر، کنتراست بیشتر، روشنایی بالاتر و محتوای زنده‌تری را در فیلم‌ها و بازی‌ها انتظار داشت. نمایشگرهای دارای این قابلیت از امسال در مرحله‌ی تولید انبوه قرار خواهند گرفت و ابتدا تلویزیون‌ها و سپس مانیتورها با این قابلیت در دسترس خواهند بود. پنل‌های HDR قادر به نمایش رنگ‌های سیاه با عمق رنگ OLEDها و روشنایی‌های درخشان با کیفیت نمایش LCD های رایج خواهند بود و کنتراست به مراتب بالاتری نسبت به نمایشگرهای فعلی و نزدیک به حد تشخیص چشمان انسان خواهند داشت. انویدیا خواسته تا پیشاپیش این امکان را در محصولش آماده‌ی استفاده داشته باشد. در همین راستا هم پاسکال از استاندارد رمزگشایی و رمزگذاری یا Codec جدید 10bit-HEVC برای استریم و پخش محتوای HDR پشتیبانی می‌کند.

کپی لینک

فشرده سازی رنگ بهبود یافته

پیش از این از بهبودهای صورت گرفته در الگوریتم‌های فشرده سازی حافظه سخن به میان آمد. اما این تکنیک‌ها چیستند و چه کارکردی دارند؟ در واقع این تکنیک‌ها را می‌توان روش‌هایی برای صرفه جویی بیشتر در پهنای باند حافظه محسوب کرد که فشرده سازی رنگ‌ها یکی از این روش‌ها است. بخش فشرده سازی در تراشه‌ی گرافیکی به صورت پویا بهترین راه را از بین الگوریتم‌های مختلف برای فشرده سازی انتخاب می‌کند. مهمترین الگوریتم Delta Color Compression نام دارد که تفاوت میان پیکسل‌ها را در قالب بلاک‌هایی محاسبه کرده و آنها را به عنوان مجموعه‌های مرجع پیکسلی در نظر می‌گیرد و در مورد پیکسل‌های غیر مرجع، تنها اطلاعات دلتای آنها را با بلاک مرجع ذخیره می‌کند. به این ترتیب دیتای حاصل شده به نصف تقلیل پیدا می‌کند و اصطلاحا 2:1 Compression خوانده می‌شود.

حالا در پاسکال نه تنها الگوریتم فشرده سازی ۲ به ۱ بهبود یافته، بلکه الگوریتم‌های جدیدتر ۴ به ۱ و همین طور ۸ به ۱ هم برای فشرده سازی رنگ‌ها معرفی شده‌اند که تا حد بسیار بیشتر و با تلفیق روش‌های قبلی فضای ذخیره سازی مورد نیاز را کاهش می‌دهند.

کپی لینک

Asynchronous Compute

برای بهینه سازی استفاده از توان پردازشی تراشه‌های گرافیکی و توزیع بار کاری پردازش دربازی‌های سنگین امروزی روش موثری وجود دارد که حالا در دایرکت ایکس 12 به استاندارد تبدیل شده و احتمالا با نام آن هم آشنا هستید. پردازش نامتقارن یا Asynchronous Compute از نسل قبلی مکسول در انویدیا و از خیلی قبل‌تر و با معماری GCN توسط ای‌ام‌دی بکار گرفته شده است. سناریوی محتمل برای استفاده از چنین روشی می‌تواند پردازش همزمان محاسبات فیزیک و بخش گرافیک موتور بازی روی GPU و اعمال برخی افکت‌ها مثل افکت‌های Postprocessing روی تصاویر رندر شده و قبل از نمایش باشد.

در معماری مکسول برای دو نوع متفاوت از بارِ کاری مثل پردازش گرافیکی و پردازش فیزیک امکان تخصیص دو پارتیشن مجزا و ثابت از ابتدای شروع همزمان این دو عملیات وجود داشت و اگر یکی از آنها زودتر به پایان می‌رسید، بخشی از توان GPU بدون استفاده باقی می‌ماند، اما در معماری پاسکال این عملکرد بهبود یافته و پس از اتمام یک پردازش کاری، پردازش دیگر می‌تواند به صورت پویا تمام منابع تراشه را در اختیار خود بگیرد و حداکثر استفاده را از تخصیص منابع ببرد. این مزیت جدید، پردازش نامتقارن و بهبود یافته در نسل پاسکال است و باعث افزایش راندمان در حالت‌های پشتیبانی شده می‌شود. حتما به یاد دارید که این مورد یکی از نقطه ضعف‌های انویدیا در نسل قبلی بود و حواشی زیادی را در مورد بهینه نبودن راندمان آن ایجاد کرده بود. حالا انویدیا وعده‌ی بهبود راندمان در این قسمت را داده است.

کپی لینک

امکانات جانبی معرفی شده با پاسکال

Ansel

راه جدیدی برای گرفتن اسکرین شات‌های دلخواه در داخل بازی است که بجای یک تصویر معمولی، یک نمای ۳۶۰ درجه‌ی کامل از محیطی را که در بازی انتخاب کرده‌اید ثبت می‌کند. این نمای ۳ بعدی بعدا از طریق ابزار واقعیت مجازی یا VR مثل Oculus Rift و HTC Vive قابل دیدن خواهد بود و می‌توان از آنها در ابزارهای ویرایش حرفه‌ای هم تصاویری را با تنظیمات اختصاصی و رزولوشن خیلی بالا ایجاد کرد. این امکان نیاز به پشتیبانی در بازی‌ها دارد.

Nvidia FAST SYNC

یک حالت جدید در بین انواع گوناگون Sync یا همگام سازی در بازی‌ها است. رایج‌ترین حالتی که گیمرهای پی‌سی آن را می‌شناسند V-Sync است که با همگام‌سازی نرخ فریم خروجی کارت گرافیک با نرخ بازسازی مانیتورتان، از ایجاد بریدگی در تصاویر جلوگیری می‌کند. اما ایرادش این است که با گرفتن ترمز موتور گرافیکی بازی تا سقف قابل پشتیبانی در مانیتور شما (مثلا ۶۰ هرتز) ممکن است باعث ایجاد تاخیر در ورودی یا اصطلاحا Input Lag بشود. خاموش کردن V-Sync هم با این که تاخیر در ورودی را از بین می‌برد اما بریدگی در تصاویر را باز می‌گرداند. راه حل جدید انویدیا با نام Fast Sync هیچ کنترلی بر نرخ فریم کارت گرافیک ایجاد نمی‌کند و مانند حالت خاموش بودن V-Sync رفتار می‌کند، اما همزمان فریم‌های خروجی کارت گرافیکی را که باید نمایش داده شوند از بین فریم‌های مختلف انتخاب و به مانیتور ارسال می‌کند و نتیجه هم نمایش تصاویری با کیفیت زمانی است که V-Sync فعال است و کار می‌کند. با این تفاسیر تاخیر در ورودی هم حذف خواهد شد.

VR Audio

فناوری دیگر معرفی شده با کارت‌های گرافیکی GTX 1080/1070 هم مشابه‌ی چیزی است که قبلا ای‌ام‌دی معرفی کرده بود و AMD True Audio نام داشت. این فناوری هم شبیه سازی صدای ۳ بعدی و بیشتر مناسب استفاده در هدست‌های واقعیت مجازی است. با کمک این قابلیت GPU می‌تواند میزان انعکاس و جذب صدا را با توجه به محیط محاسبه و تولید کند. این گزینه هم به امکانات VRworks اضافه شده است.

Simultaneous Multi-Projection

در اینجا با قابلیت جالبی روبرو هستیم. اگر چند نمایشگر را پهلو به پهلو در کنار هم چیده باشید تا تصویری محیطی یا Surround را در بازی‌ها ایجاد کنید، این قابلیت بسیار کمک کننده خواهد بود. در حالت عادی وقتی ۳ مانیتور در کنار هم باشند زاویه‌ی دید تنها یک دوربین در تمام آنها شبیه سازی خواهد شد که اگر مانیتورها در یک خط باشند هیچ مشکلی نیست، اما اگر با زاویه‌ی خاصی در پیرامونِ شما قرار داشته باشند این زاویه باعث کشیده شدن غیر طبیعی تصاویر در نمایشگرهای کناری خواهد شد. قابلیت Simultaneous Multi-Projection یا به اختصار SMP به پاسکال اجازه می‌دهد که تا ۱۶ زاویه‌ی مجزا برای دوربین را به صورت سخت افزاری و تقریبا بدون تاثیر در راندمان شبیه سازی کند و در نتیجه برای مانیتورهای کناری با توجه به زاویه‌ی قرار گرفتنشان تصاویر سه بعدی را تولید کند. این قابلیت برای تولید تصاویر در هدست‌های VR هم نیاز به پردازش دو فریم مجزا برای دو چشم را از بین می‌برد و باعث افزایش کاملا محسوس راندمان می‌شود.

GPU Boost 3.0

نسخه‌ی جدید این فناوری در تراشه‌های پاسکال تعبیه شده و انعطاف عمل بیشتری را در تعیین فرکانس و ولتاژ متناسب با آن در اختیار قرار می‌دهد. این الگوریتم جدید می‌تواند به فرکانس پایدار بالاتر و راندمان بیشتر منتهی شود اگر محدودیت‌های حرارت و بار کاری تراشه همزمان رعایت شده باشند. در واقع در هر مقدار ولتاژی می‌توان آفست مجزایی را برای فرکانس تعیین کرد. این امکان در مکسول و نسل‌های قبلی روی نموداری ثابت و همسان افزایش پیدا می‌کرد. نرم افزارهای اختصاصی اورکلاک باید برای بهره گیری از این حالت بروز رسانی شوند.

بروز رسانی حالت SLI

در این نسل پس از مدت‌ها قابلیت ارتباط کارت‌های گرافیکی در حالت SLI یا چند گانه تغییر کرده و تنها دو کارت برای این نسل به طور رسمی پشتیبانی می‌شود (استفاده از سه یا چهار کارت گرافیکی دیگر توصیه نمی‌شود) و همزمان از دو لینک برای ارتباط کارت‌‌ها استفاده خواهد شد. به این طریق پهنای باند ارتباطی کارت‌ها دو برابر خواهد شد.

بررسی راندمان...

در این مقاله سعی کردیم به معماری پاسکال و مشخصات آن تحت تراشه‌ی GP104-400 بپرداریم و امکانات و قابلیت‌های جدید معرفی شده با آن را شرح دهیم. روشن است که تمام اینها بدون داشتن تصوری در مورد راندمان این محصول خیلی امیدوار کننده و مثمر ثمر نخواهد بود. در اینجا این وعده را می‌دهیم که در بخش دوم مقاله بررسی اختصاصی و ویژه از راندمان GTX 1080 در زومجی داشته باشیم و این کارت را درعمل و در بنچمارک‌ها و بازی‌های واقعی محک بزنیم. پس منتظر بخش دوم مقاله‌ی ما باشید، چون محصول ویژه‌ی ما در راه است!

مشخصات فنی کامل، بهترین قیمت کارت گرافیک جدید در فروشگاه‌های اینترنتی و مقایسه‌ی کامل انواع کارت گرافیک را در بخش محصولات مشاهده کنید؛ انواع کارت گرافیک جی فورس و کارت گرافیک‌ رادئون برای مقایسه و خرید در دسترس کاربران است.

تهیه شده در زومجی

مقاله رو دوست داشتی؟

نظرت چیه؟

فرشید معتمد

داغ‌ترین مطالب روز

بررسی کارت گرافیک GTX 1080 انویدیا - قسمت اول

فناوری ساخت ۱۶ نانومتری

استفاده از GDDR5X

مشخصات فنی GTX 1080

پشتیبانی از نمایشگرهای HDR

فشرده سازی رنگ بهبود یافته

Asynchronous Compute

امکانات جانبی معرفی شده با پاسکال

Ansel

Nvidia FAST SYNC

VR Audio

Simultaneous Multi-Projection

GPU Boost 3.0

بروز رسانی حالت SLI

بررسی راندمان...

نظرات