بررسی بنچمارک کارت های گرافیک RTX 3080 Ti و RTX 3070 Ti انویدیا
حدود ۸ ماه پیش بود که شرکت انویدیا از کارتهای گرافیک رده بالای سری RTX 3000 از نسل آمپر با مدلهای RTX 3080 و RTX 3090 رونمایی کرد و بهتازگی مدلهای جدیدتری از این سری نیز معرفی شدهاند. کارت GeForce RTX 3080 Ti تازه واردِ کارتهای گیمینگ انویدیا است که نشان پرچمداری را بهجای RTX 3080 بهدست خواهد گرفت و RTX 3070 Ti هم کارتِ رده بالای جدیدی برای معرفی در رقابت بهجای RTX 3070 خواهد بود. با اینکه RTX 3090 مشخصا جایگاهی برتر از سایر مدلها دارد، اما انویدیا این محصول را مانند یک کارت از سری Titan به جز استفادهی گیمینگ، برای کاربردهای نیمه حرفهای و تولید محتوا توصیه کرده است. در عوض وظیفهی در نظر گرفته شده برای RTX 3080 Ti مانند RTX 3080 تعریف شده و قرار است این مدل راندمان پیشرویی را در بازیها، همزمان با اجرای ray tracing یا همان تکنیک رهگیری پرتو در رزولوشن 4K ارائه کند.
اما جایگاه RTX 3070 Ti کمی متفاوت است و برای بازی در دقت 2K در نظر گرفته شده که راهی برای ارتقا به دقت 4K با کیفیت متوسط در برخی بازیها را هم باز نگه میدارد. درواقع کارتهای ردهی RTX 3070 تا حدی برای 4K هم مناسب هستند، اما با کمی بهینهسازی بهتر عمل خواهند کرد. اما فلسفهی عرضهی RTX 3070 Ti از هنگامی قدرت گرفت که کارت گرافیک RX 6800 AMD، بازگشتی قدرتمند به بازارِ کارتهای رده بالا داشت و توانست در بیشتر موارد RTX 3070 را در حالتِ بدون اجرای رهگیری پرتو از میدان بهدر کند. حتی کارت گرافیک ضعیفتری مثل RX 6700 XT هم به رقابت فشرده در این رده اضافه شد و با قیمت بسیار کمتر توانست در برخی عناوین همپایه یا کمی عقبتر از RTX 3070 عمل کند.
بلاک دیاگرام تراشه گرافیکی GA104 بکار رفته در RTX 3070 Ti با هستههای کامل
مشخصات فنی
GeForce RTX 3080 Ti هم درست مثل RTX 3080، برپایهی سیلیکون ۸ نانومتری GA102 ساخت سامسونگ تولید میشود، اما تعداد هستههای بیشتری دارد و گذرگاهِ حافظهی گرافیکیِ GDDR6X را هم به عرض ۳۸۴ بیتی ارتقا میدهد. این عرضِ باند برابر با همان عرض باند استفاده شده در RTX 3090 است، اما بهجای ۲۴ عدد تراشه، تنها به ۱۲ عدد تراشهی GDDR6X متصل شده است. تفاوت دیگر این است که فرکانسِ کاری تراشههای حافظه در RTX 3080 Ti پایینتر است و بهجای ۱۲۱۹ مگاهرتز، روی فرکانس ۱۱۸۸ مگاهرتز و مشابه با RTX 3080 تنظیم شده است.
با این اوصاف کارت گرافیک RTX 3080 Ti در مجموع ۱۰۲۴۰ هستهی CUDA که در ۸۰ واحد SM (مخفف Streaming Multiprocessors) گسترده شدهاند را در اختیار دارد و از ۳۲۰ واحد Tensor برای شتابدهی AI (هوش مصنوعی و پردازشهایی مانند ارتقای تصویریِ DLSS) و تعداد ۸۰ واحد هستهی شتابدهندهی نسلِ دوم RT برخوردار است.
در سوی دیگر RTX 3070 Tiتمامِ هستههای فیزیکیِ قابل دستیابی در سیلیکون ۸ نانومتری GA104 را بهطور کامل در اختیار دارد و پهنای باند گرافیکیش هم با ارتقای عمدهای همراه شده است. در اینجا برخلافِ RTX 3070، شاهد استفاده از تراشههای سریعترِ GDDR6X هستیم که با عرض باندِ یکسان میتواند تا ۳۵ درصد سرعت دسترسی به حافظه را افزایش دهد. طراحی نسخهی Founders Edition این کارت هم جدید است و از لحاظ ابعاد آن را بین RTX 3080 FE و RTX 3070 FE قرار میدهد.
ویژگی خاص RTX 3070 Ti این است که افزایش تعداد هستههای سایهزن در آن نسبت به RTX 3070 تنها ۲۵۶ واحد CUDA بوده، درحالیکه تفاوت واحدهای CUDA در RTX 3080 با RTX 3080 Ti دقیقا ۱۵۳۶ واحد است. تنها با علم به همین اختلاف میتوان پیشبینی کرد که افزایش راندمان در RTX 3070 Ti آنچنان چشمگیر نخواهد بود، درحالیکه راندمان RTX 3080 Ti به RTX 3090 بسیار نزدیک خواهد شد.
با وجود بحرانهای کنونی و کمبود عرضهی کارت گرافیک، قیمت MSRP مدتی است که دیگر محلی از اِعراب ندارد، اما حداقل میتوان برای تخمینِ قیمتِ واقعی آن در بازار، قیمتِ رسمی سازنده را دو برابر کرد و قیمت واسطهها را رقمی نزدیک به آن در نظر گرفت. کارت GeForce RTX 3080 Ti رسما ۱۲۰۰ دلار اعلام شده و برای GeForce RTX 3070 Ti هم برچسب قیمتیِ ۶۰۰ دلاری در نظر گرفته شده است که اولی اکنون در بازار جهانی حدود ۲۲۰۰ دلار و دومی حدود ۱۳۰۰ دلار به فروش گذاشته شدهاند.
تراشه گرافیکی | RTX 3090 | RTX 3080 Ti | RTX 3080 | RTX 3070 Ti | RTX 3070 |
---|---|---|---|---|---|
واحدهای پردازشی SM | 82 | 80 | 68 | 48 | 46 |
هستههای CUDA | 10496 | 10240 | 8704 | 6144 | 5888 |
هستههای Tensor | 328 | 320 | 272 | 192 | 184 |
هستههای RT | 82 | 80 | 68 | 46 | 46 |
واحدهای بافت | 328 | 320 | 272 | 192 | 184 |
واحدهای ROP | 112 | 112 | 96 | 96 | 96 |
توان محاسباتی | 35.7TFLOPs | 34.10TFLOPs | 29.7TFLOPs | 21.75TFLOPs | 20.45TFLOPs |
فرکانس بوست | 1695MHz | 1665MHz | 1710MHz | 1770MHz | 1725MHz |
سرعت حافظه | 19.5Gbps | 19Gbps | 19Gbps | 19Gbps | 14Gbps |
ظرفیت حافظه | 24GB GDDR6X | 12GB GDDR6X | 10GB GDDR6X | 8GB GDDR6X | 8GB GDDR6 |
گذرگاه حافظه | 384bit | 384bit | 320bit | 256bit | 256bit |
پهنای باند حافظه | 936GB/Sec | 912.4GB/Sec | 760GB/Sec | 608.3GB/Sec | 448GB/sec |
توان مصرفی | 350W | 350W | 320W | 290W | 220W |
مقایسه مشخصاتِ فنی کارتهای گرافیک رده بالای نسل آمپر که تاکنون عرضه شدهاند
معماری آمپر
بیرون از هستههای CUDA برای پردازشهای مبتنی بر ترسیمهای سنتیِ Rasterization، هر واحد SM هم از هستههای Tensor برای عملیات هوش مصنوعی مثل DLSS، و هم از واحدهای اختصاصیِ RT برای شتابدهی تکنیک رهگیری پرتو بهرهمند است. در معماری آمپر هر SMبه یک هستهی RT و ۴ هستهی Tensorمجهز است. تعداد هستههای Tensorبه ازای هر SMنسبت به معماری تورینگ نصف شده است که دلیل موجهی دارد و آن هم افزایش راندمان هستههای Tensor نسل جدید به میزان بیش از دو برابر نسبت به نسل قبلی عنوان شده است.
حتما میدانید که اطلاعات مربوطبه پرتوهای نوری بکار گرفته شده در بازی برای پردازش با تکنیکِ ray tracing، به واحدهای RT ارسال میشوند تا محل تقاطع و انعکاس آنها در محیط محاسبه و گزارش آن به SM بازگردانده شود تا بتواند تصویر را به شکل کامل پردازش کند. البته بکارگیریِ این روش پردازشهای رهگیریِ پرتو را بدون هزینه نمیکند و استفاده از این تکنیک حتی در معماری نسل جدید هم با افت راندمان قابل توجهی در بازیها همراه خواهد بود. بااینحال، افت راندمان ناشی از عدم استفاده از شتابدهندهی اختصاصی RT هم بازی را به یک اسلایدشو تبدیل خواهد کرد.
کارت گرافیک GeForce RTX 3080 Ti ساخت ایسوس
خوشبختانه نوع دیگری از هستههای اختصاصی یعنی هستههای Tensor، بخش دیگری از معادله هستند که استفاده از ray tracing در بازیهای درجهی یکِ پیسی را معقول میکنند. با استفاده از این هستهها، توسعهدهندگان میتوانند DLSS را در بازیهای خود تعبیه کنند که لزوما یک فناوری ارتقای وضوح تصویر با بکارگیری هوش مصنوعی یا همان AI محسوب میشود. این روش با وادار کردن SM به پردازشِ صحنه در رزولوشن پایینتر و سپس ارتقای کیفیت تصویر به رزولوشن ذاتی نمایشگر با استفاده از هستههای Tensor، به افزایش قابلتوجه نرخِ فریم در بازی منجر خواهد شد. در این روند دادههای پردازش شده در سوپرکامپیوترهای انویدیا برای ارتقای هوشمندانهی سطح کیفی و جزئیات تصاویر به سطح رزولوشن کامل مورد استفاده قرار میگیرند.
درواقع با استفاده از DLSSقادر خواهید بود که بیشترِ راندمان از دست رفته توسط واحد پردازش RTرا مجددا بهدست آورید و در عین بهرهمندی از کیفیت بصری پردازشهای رهگیری پرتو در بازی، تا حد زیادی راندمان را هم فدای استفاده از آن نکنید. در یک کلام بدون DLSS، استفاده از ray tracing در بسیاری بازیها و کارتهای گرافیکی ارزشش را نخواهد داشت.
بنچمارک بازیها
Assassin’s Creed Valhalla
1440p
RTX 3080 Ti در بازی اسپانسر شدهی AMD عملکرد بهتری نسبت به RTX 3070 Ti دارد و در دقت 2K با ۸۲ فریم در ثانیه بین RTX 3080 و RTX 3090قرار میگیرد. راندمان کارتهای گرافیک رادئون مثل همیشه در این بازی در سطحی بالاتر از جیفورس قرار دارند و مثلا RX 6900 XT توانسته در اینجا ۲۸ درصد سریعتر از RTX 3080 Ti عمل کند.
2160p
طراحیِ خاص معماری آمپر با واحدهای FP32 دو برابر شده نسبت به تورینگ، در تراکمِ پیکسلی 4K راندمان بهینهتری دارد و در نتیجهی بهدست آمده مشخص است که RTX 3070 Ti به میزانِ ۱۵ درصد از RX 6800 و ۲۲ درصد از RX 6800 XTدر رزولوشن 4Kکندتر است. در اینجا پهنای باند افزوده شده به RTX 3070 Ti تنها کمک کرده که ۷ درصد سریعتر از RTX 3070 معمولی عمل کند، درحالیکه قیمتِ رسمیِ آن ۲۰ درصد بیشتر از RTX 3070 است. همچنین RTX 3080 Ti هم به میانگینِ ۵۹ فریم بر ثانیه رسیده است که آن را همردهی RTX 3090 و RX 6800 XT کرده است. بااینحال هنوز ۱۱ درصد کندتر از RX 6900 XT است، اما ۷ درصد هم سریعتر از RTX 3080 عمل کرده است.
Cyberpunk 2077
1440p
کارت RTX 3080 Ti در اینجا ۸ درصد سریعتر از RTX 3080 معمولی و ۵ درصد کندتر از RTX 3090 ظاهر شده است. همچنین در مقایسه با مدلهای پرچمدار Radeon هم شاهد راندمانی مشابه هستیم. در سمت دیگر RTX 3070 Ti با ۷۳ فریم بر ثانیه توانسته تنها ۷ درصد سریعتر از RTX 3070 عمل کند که تفاوت محسوسی نیست و ۸ درصد هم کندتر از RX 6800 محسوب میشود.
2160p
در دقتِ 4K مدل RTX 3080 Ti فقط ۴ درصد کندتر از RTX 3090 عمل کرده که در عین حال ۱۱ درصد سریعتر از RTX 3080 و ۶ درصد هم سریعتر از RX 6900 XT محسوب میشود. کارت RTX 3070 Ti هم با میانگینِ ۳۷ فریم بر ثانیه، آن هم در تنظیماتِ High و نه Ultra، توانسته بازی را ۹ درصد سریعتر از RTX 3070 و ۵ درصد کندتر از RX 6800به اجرا درآورد.
Watch Dogs: Legion
1440p
در این بازی نیز RTX 3080 Ti با وجود حافظهی نصف شده نسبت به RTX 3090، راندمانی نزدیک به آن دارد، اما همزمان ۱۲ درصد سریعتر از RTX 3080 عمل کرده است. RTX 3070 Ti هم در نمودار به فاصلهی ۵ درصد کارت RX 6800 را تعقیب میکند و تنها با اختلافِ راندمان ۴ درصد بالاتر از RTX 3070 قرار گرفته است.
2160p
با پردازش سنگینی که دقت 4K تحمیل کرده، RTX 3080 Tiفقط ۳ درصد کندتر از RTX 3090، ولی ۱۳ درصد بهتر از RTX 3080 ظاهر میشود. همچنین این نتیجه نسبت به Radeon RX 6900 XT هم ۵ درصد بهتر است. اگر بخواهید در بازاری که شرایط طبیعی داشته باشد بر مبنای معیار قیمت به راندمان خرید کنید، حتما یکی از کارتهای گرافیکِ RX 6800 XTیا RTX 3080را خواهید خرید.
میانگین راندمان
در اینجا میانگین راندمان بهدست آمده از ۱۲ بنچمارک انجام شده روی بازیهای مختلف را شاهد هستید.
1440p
نتایج نهایی نشان میدهد که RTX 3070 Ti بهطور میانگین ۸ درصد سریعتر از RTX 3070 معمولی ظاهر شده، درحالیکه همزمان ۸ درصد کندتر از RX 6800 و ۱۸ درصد کندتر از RX 6800 XTنمایان میشود. اما نتیجهی RTX 3080 Ti امیدوارکنندهتر است و امتیازِ نهاییِ آن در مجموع تنها ۴ درصد کندتر از RTX 3090محاسبه شده است. این کارت در قیاس با مدلهای AMD هم فقط ۶ درصد کندتر از Radeon 6900 XT عمل کرده که نتیجهای پذیرفتنی و قابلِ انتظار است، اما راندمان پردازشِ سنتی rasterization در تراشههای گرافیکی RDNA 2 در مجموع کمی سریعتر است و VRAM بیشتری هم در اختیار دارند.
2160p
کارت RTX 3070 Tiحداقل در رزولوشن4K توانسته با اختلاف راندمانی دو رقمی RTX 3070را پشت سر بگذارد و ۱۱ درصد سریعتر باشد. اما همچنان حدود ۵ درصد کندتر از RX 6800 و ۱۶ درصد کندتر از 6800 XT ظاهر شده است. در عوض RTX 3080 Tiبا فاصلهی ۳ درصد توانسته RX 6900 XT را شکست دهد و در عین حال هنوز با اندک فاصلهی ۴ درصد پایینتر از RTX 3090 در نمودار رتبهبندی شود. در میانگین نتایج بهدست آمده از این ۱۲ بازی، RTX 3080 Ti نسبت به برادر بزرگترش یعنی RTX 3080 هم ۹ درصد سریعتر است.
مصرف توان
وقتی نوبت به بررسی مصرفِ توان میرسد، کارت گرافیک RTX 3070 Tiبه میزان قابل توجهی مصرف توان بیشتری نسبت به RX 6800 دارد و ۲۰ درصد مصرف توانِ کلِ سیستم را افزایش میدهد. اما مصرف توانِ RTX 3080 Tiبه RTX 3080 و RTX 3090 بسیار شبیه است و بین این دو قرار میگیرد. در این مثال RTX 3080 Ti بهطور متوسط ۶ درصد سریعتر از RX 6900 XT پردازش کرده، اما میزان مصرف کلی سیستم را هم ۹ درصد بالاتر برده است. با این توصیف مصرف توان RDNA 2 به مقدار محسوسی بهینهتر است، اما شاید در عمل برای گیمرها تفاوت آنچنانی محسوب نشود.
جمع بندی
گرافیک جدیدِ GeForce RTX 3080 Ti لزوما یک RTX 3090 با نیمی از حافظهی آن است. طبیعتا میتوان این را خبر خوبی درنظر گرفت، چرا که ارزانتر است. البته فراموش نکنیم که برای بررسیِ ارزش خرید، قیمتِ مدلهای موجود در بازار را باید بعدا زیر ذرهبین گرفت. آنچه که در مورد RTX 3080 Ti همچنان صدق میکند این است که این محصول هم مانند RTX 3080 بسیار سریع است، اما برچسب قیمت ۱۲۰۰ دلاری دارد و ۲ گیگابایت هم به حافظهی آن افزوده شده است. هرچند که در شرایط فعلی زمانبندی عرضهی این محصول را نمیتوان مناسب تفسیر کرد، اما این موضوع هم چیزی را تغییر نمیدهد.
اما RTX 3070 Tiچگونه ردهبندی میشود؟ از نظر ما انتخاب بین RX 6800 و RTX 3070 قبل از این هم سخت بود، چرا که RX 6800 مزیت حافظهی بیشتر را داشت که هنوز هم دو برابر بیشتر از حافظهی RTX 3070 Tiاست. اما کمبودِ جایگزینی کارآمد برای DLSS، انکودر بهتر انویدیا و پشتیبانیِ بهتر از تکنیک رهگیری پرتو از مزیتهای RTX 3070 نسبت به RX 6800 بوده و هستند. رقیبِ جدید یعنی RTX 3070 Tiهم ۸ درصد ارزانتر از RX 6800 و ۸ درصد هم کندتر است. همچنین در مقایسه با RTX 3070 معمولی هم ۲۰ درصد گرانتر و بهطور متوسط ۸ درصد سریعتر است که به نظر نمیتواند موقعیت انویدیا را دربرابر AMD تغییر دهد.
آنچه که باعث میشود از عرضهی این محصولات استقبال نکنیم، این است که فکر میکنیم انویدیا هنوز عرضهی محصولات آمپر از سال گذشته را تکمیل نکرده و موجودی قابل توجهی برای دسترسی گیمرها در قفسهی فروشگاهها ندارد، بنابراین عرضهی محصولات جدید با راندمان بالاتر هم نمیتواند بهتنهایی تغییری در شرایط بازار ایجاد کند. مگر اینکه با بهبود دسترسی به مواد اولیه، تولید تراشههای بیشتر و افزایش مونتاژِ کارتهای گرافیکی در نیمهی دوم امسال بتوان به بهبود موجودی و نزدیک شدنِ قیمتها به قیمت واقعی اندکی امیدوار بود.
برداشت شما در مورد کارتهای گرافیک RTX 3080 Ti و RTX 3070 Ti و ارزش خرید این مدلها چیست؟ نظرات خود را با ما در میان بگذارید.