NVIDIA, yakın tarihte yepisyeni bir grafik mimarisiyle birlikte GeForce RTX 4000 serisi ekran kartlarını tanıtmıştı. Ada Lovelace mimarili kartların hükümdarı GeForce RTX 4090, artık ofisimize konuk oluyor.
İlk bilgisayar programcısı olarak kabul edilen Ada Lovelace’ın ismini taşıyan GeForce “Ada” grafik mimarisi, CUDA çekirdeklerinden RT çekirdeklerine, yapay zeka konusunda değerli bir faktör olan Tensor çekirdeklerinden gölgelendirici performansını artıran Shader Execution Reordering SIMD optimizasyonlarına kadar her alanda yenilikler getiriyor.
“Ada” CUDA çekirdekleri, Ampere mimarisi üzerinde çok büyük frekans ve IPC artışları sağlıyor. Yeni jenerasyon GPU’ların NVIDIA’ya özel olarak optimize edilen TSMC 4nm üretim teknolojisinden faydalandığını biliyoruz. GeForce RTX 4090 ise bu jenerasyon için geliştirilen en büyük GPU olan “AD102” silikonundan gücünü alıyor. AD102 silikonu aslında 18.432 CUDA çekirdeğinin kullanılmasına imkan tanıyor, lakin mevcut amiral gemisi 16.384 CUDA çekirdeğiyle çalışacak biçimde ayarlanmış.
CUDA çekirdeklerinin yanı sıra, 568 Tensor çekirdeğinden 512’si, 142 RT çekirdeğinden 128’i kullanılıyor. Kart ayrıyeten 512 TMU ve 192 ROP ile donatılmış. Tam yapılandırma ise muhtemelen GeForce RTX 4090 Ti için saklanıyor. Mevcuttaki en güçlü kart olan 4090, RTX 3090 Ti ile tıpkı biçimde 21 Gbps süratte çalışan, teorik olarak 1008 GB/sn bant genişliği sunan 24 GB GDDR6X belleklerden yararlanıyor.
NVIDIA, donanımsal ve rasterizasyon açısından jenerasyonlar ortasında büyük performans artışları sağlamış. Tüm bunlara bir de devrimsel DLSS 3 teknolojisi dahil olduğunda işler bambaşka bir noktaya geliyor. Sırf RTX 4000 serisine özel olan DLSS 3 teknolojisi, GPU’nun ana grafik sürece düzeneğinden hariç olarak sırf yapay zeka kullanarak yeni kareler üretebiliyor. Şirket bundan “sinirsel sürece (neural rendering)” olarak bahsediyor ve grafik dünyasına yeni tabir daha getiriyor. Bu nitekim çok kıymetli bir atılım. NVIDIA, yeni teknolojisini rasterizasyon ve ışın izleme tekniklerinin yanında başka bir formda konumlandırıyor.
İncelememize konuk NVIDIA GeForce RTX 4090 Founders Edition, yeşil ekil takımın referans dizaynını temsil ediyor. Yeni jenerasyon kartların genel görünümü RTX 3000 serisiyle tıpkı kalmış, lakin RTX 4090 hakikaten heybetli ve çok büyük. RTX 4000 serisi PCI-Express Gen 4 ilişki arabirimini kullanmaya devam ederken, güç mimarisi için PCIe Gen 5 standardına geçiş yapılmış. 12VHPWR ismi verilen yeni 12+4 pin tasarımı, referans tasarım da dahil olmak üzere üretim ortakları tarafından geliştirilen RTX 4090 modellerinde standart haline geliyor.
Türkiye’de satışa sunulmayan RTX 4090 Founders Edition 1.599 dolarlık fiyatla satışa çıktı. GeForce RTX 4090 ise iki yıl öncesinde 100 dolarlık farkla, 1.499 dolar fiyatla çıkış yapmıştı. Bu ortada, özel soğutmalı RTX 4090 modellerinin 1.999 dolara kadar uzandığını ve hatta kimi modellerin 2.000 dolar üzerine çıktığını belirtelim. Ülkemizde ise özel dizaynlar 40.000-50.000 lira civarında fiyatlarla satılıyor.
Graphics Card | RTX 4090 | RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RX 6950 XT | Arc A770 16GB |
---|---|---|---|---|---|---|
Mimari | AD102 | GA102 | GA102 | GA102 | Navi 21 | ACM-G10 |
Üretim Teknolojisi | TSMC 4N | Samsung 8N | Samsung 8N | Samsung 8N | TSMC N7 | TSMC N6 |
Transistör Sayısı | 76.3 milyar | 28.3 milyar | 28.3 milyar | 28.3 milyar | 26.8 milyar | 21.7 milyar |
Kalıp Boyutu | 608.4 mm^2 | 628.4 mm^2 | 628.4 mm^2 | 628.4 mm^2 | 519 mm^2 | 406 mm^2 |
SM / CU / Xe-Core | 128 | 84 | 82 | 80 | 80 | 32 |
GPU Çekirdeği | 16384 | 10752 | 10496 | 10240 | 5120 | 4096 |
Tensor Çekirdeği/ XMX Motoru |
512 | 336 | 328 | 320 | – | 512 |
Işın İzleme Çekirdeği | 128 | 84 | 82 | 80 | 80 | 32 |
Boost Frekansı | 2520 MHz | 1860 MHz | 1695 MHz | 1665 MHz | 2310 MHz | 2100 MHz |
Bellek Hızı | 21 Gbps | 21 Gbps | 19.5 Gbps | 19 Gbps | 18 Gbps | 17.5 Gbps |
Bellek Kapasitesi | 24 GB | 24 GB | 24 GB | 12 GB | 16 GB | 16 GB |
Bellek Bant Genişliği | 384-bit | 384-bit | 384-bit | 384-bit | 256-bit | 256-bit |
L2 / Infinity Önbellek | 72 | 6 | 6 | 6 | 128 | 16 |
ROP | 176 | 112 | 112 | 112 | 128 | 128 |
TMU | 512 | 336 | 328 | 320 | 320 | 256 |
TFLOPS FP32 | 82.6 | 40 | 35.6 | 34.1 | 23.7 | 17.2 |
TFLOPS FP16 (FP8/INT8) | 661 (1321) | 160 (320) | 142 (285) | 136 (273) | 47.4 | 138 (275) |
Bant Genişliği | 1008 GBps | 1008 GBps | 936 GBps | 912 GBps | 576 GBps | 560 GBps |
TDP | 450W | 450W | 350W | 350W | 335W | 225W |
Liste Fiyatı | 1,599$ | 1,999$ | 1,499$ | 1,199$ | 1,099$ | 349$ |
Yukarıdaki teknik özellikler tablosu aslında birçok şeyin göstergesi; transistör sayıları Ampere mimarisine kıyasla neredeyse üç katına çıktı, RTX 4090’daki çekirdek sayıları RTX 3090 Ti’den %52 daha yüksek, GPU saat suratları %35 daha fazla ve 12 kat daha fazla L2 önbellek mevcut. RTX 4090’ın potansiyelini teorik olarak rahatlıkla görebiliyoruz ve RTX 3090/3090 Ti’ye kıyasla kıymetli farklar var. Lakin GPU’nun içinde fark yaratan diğer değişiklikler de var.
Eğer ekran kartlarını profesyonel maksatla kullanacaksanız, bilhassa de derin öğrenme ve yapay zeka alanında iş yapıyorsanız, GeForce RTX 4000 serisi nitekim parasının hakkını verecek bir eser serisi. Ayrıyeten içerik üreten bireyler için de Ada mimarili kartlar ülkü bir seçenek olabilir. Bu işten para kazananlar için zaman=para demek. RTX 4000 serisi kartlar da hakikaten kıymetli gelişmeler sunuyor.
Peki ya oyuncular? RTX 3090 ve 3090 Ti’nin bilakis NVIDIA, RTX 4090’ın sırf profesyoneller için tasarlandığını söylemiyor Evet, RTX 4090 profesyoneller için kusursuz işler çıkaracak. Lakin bu kart tıpkı vakitte GeForce ailesinin bir kesimi ve şirket oyun performansı konusunda daima grafik kıyaslamaları yapıyor. RTX 4090 ile yaptığımız testlerde gördüğünüz üzere, yeni amiral gemisi DLSS 3 devre dışı olsa bile hakikaten çok güçlü. DLSS 3 devreye girdiğinde ise işler zati değişik bir hal alıyor.
3. Jenerasyon Ray Tracing Çekirdekleri
Işın izleme bir defa daha büyük değer kazanıyor ve üç yeni teknoloji hayatımıza giriyor: Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) ve Displaced Micro-Meshes (DMM). Bu yeniliklerin tümüyle birlikte çeşitli iyileştirmeler sunuluyor, lakin geliştiricilerin yeni teknolojileri oyunlarına uygulaması gerekecek.
OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha yeterli işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha süratli Bounding Volume Hierarchy (BVH) oluşturma mühleti sunarak geometrik olarak karmaşık sahnelerin gerçek vakitli ışın takibini mümkün hale getiriyor.
Ada GPU içinde yer alan ışın izleme üniteleri, Faster Ray-Triangle Intersection Throughput (Işın-Üçgen Kesişme Verimi) açısından iki kat daha gelişmiş ve bu da geliştiricilerin sanal dünyalarına daha fazla detay eklemelerini sağlıyor.
Shader Execution Reordering
Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı objeye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylece çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, evvelce verimsiz olan bu iş yüklerini dinamik olarak yine düzenleyerek çok daha verimli hale getirecek. SER, ışın izleme süreçleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare suratlarını %25’e kadar artırabiliyor.
4. Jenerasyon Tensor Çekirdekleri
Derin öğrenme ve yapay zeka iş yüklerine gelince, yeniden bu alanda büyük gelişmeler kaydedildiğini görüyoruz. Ada’nın dördüncü kuşak Tensor çekirdekleri, birinci olarak Hopper H100 bilgi merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak randımanı 5 kata kadar artırıyor ve 1.4 Tensor-petaFLOPS’luk güç ortaya çıkıyor.
Transformer Engine sayesinde FP16 yerine FP8 kullanabilen algoritmalar için Tensor çekirdeği başına hesaplama mahareti iki katına çıkıyor.
AV1 Kodek Desteği
Önceki kuşak Ampere ekran kartlarında AV1 kod çözme dayanağı sunulsa da AV1 kodlama dayanağı sunulmuyordu. Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama takviyesi sunan sekizinci jenerasyon NVIDIA Encoder’a (NVENC) sahip olacak. Böylece yayıncılar ve görüntü işiyle uğraşanlar için yeni imkanlar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıyeten 1080p’de yayın yapan kullanıcıların tıpkı bit suratı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.
Ada GPU’lar ayrıyeten çift NVENC kodlayıcı ile destekleniyor. Bu gelişim ise profesyonel görüntü düzenleme için 8K/60 yahut dört adet 4K/60 görüntü kodlamasına imkan sağlıyor. DaVinci Resolve, Adobe Premiere Pro için tanınan Voukoder eklentisi ve Çin’in en uygun görüntü düzenleme uygulaması olan Jianying, AV1 dayanağının yanı sıra çift kodlama dayanağıyla kullanıma sunulacak. NVIDIA ayrıyeten tanınan efekt uygulaması Notch’a AV1 dayanağı getirmek ve Topaz yazılımına çift kodlama takviyesi sunmak için çalışıyor.
DLSS 3, Gerçek Vakitli 3D Uygulamalarına da Katkı Sağlıyor
Grafik dünyasında 3D düzenleme yapmak şiddetli bir tecrübedir. 3D içerik üreticileri, çalışma yaptığı sıralarda daima önizleme yapmak zorunda kalırlar. Fakat DLSS 3’ün performans kazanımları sayesinde sanatkarlar, gerçek vakitli render uygulamalarında akıcı ve problemsiz halde içerik üretebilecekler.
DLSS 3 teknolojisi birinci etapta Unreal Engine, Unity ve Omniverse’e geliyor. 3D sanatkarları, daha evvel hiç görülmemiş gerçekçilik düzeyleriyle gerçek vakitli etkileşime imkan tanıyan malzemeler, aydınlatma, objeler, karakterler ve sahneler oluşturabilecekler. Sanatkarlar sahnelerinde değişiklikler yaparken imaj anında işlenecek ve süratli geri bildirim alabilecekler.
24 GB GDDR6X Bellek
Bildiğiniz üzere, birçok iş yükü için GPU bellek boyutu ve suratları çok kıymetli. GeForce RTX 4090, başka iyileştirmelerin yanı sıra 21 Gbps suratında çalışan 24 GB GDDR6X belleğiyle içerik üreticilerin işlerini kolaylaştıracak. Çok sayıda gereç ve doku kullanan, büyük bilgi kümeleriyle çalışan şahıslar, ağır GPU kullanımına gereksinim duyan iş akışlarını rahat yürütebilecek.
DLSS 3, kaliteyi bozmadan FPS oranlarında iki kat ve kimi durumlarda daha yüksek performans artışları getiriyor. Bu hakikaten oyun ve grafik dünyasında ihtilal yaratan bir teknoloji.
DLSS 2’nin tüm özelliklerine ek olarak, bu teknoloji grafik oluşturma süreç sınırını dahil etmeden sırf yapay zeka kullanarak kareleri oluşturma yeteneğine sahip. DLSS 3 ile değişen her kare, evvelki işlenmiş karenin bir kopyası olmaksızın yapay zeka ile üretilmekte.
DLSS 3, imaj kalitesi ve cevap verme özelliğini korurken performansı büyük ölçüde artıran yapay zeka dayanaklı grafiklerde ihtilal niteliğinde bir atılım olarak tanımlanıyor. DLSS Frame Generation otomatik kodlayıcısı 4 temel bilgiyi ele alıyor: mevcut ve evvelki oyun kareleri, Ada mimarisinin Optical Flow Accelerator’ı tarafından oluşturulan bir optik akış alanı, hareket vektörleri ve derinlik üzere oyun motoru dataları.
Optical Flow Accelerator, iki ardışık oyun içi kareyi tahlil ediyor ve bir optik akış alanı hesaplaması yapıyor. Optik akış alanı, piksellerin kare 1’den kare 2’ye hareket ettiği tarafı ve suratı yakalamakta. Optik Akış Hızlandırıcı, oyun motoru hareket vektörü hesaplamalarına dahil edilmeyen parçacıklar, yansımalar, gölgeler ve aydınlatma üzere piksel seviyesinde bilgileri yakalama yeteneğine sahip. Aşağıdaki motosiklet örneğinde, motosikletlinin hareket akışı gölgenin motosiklete nazaran ekranda kabaca tıpkı yerde kaldığını gerçek bir biçimde temsil etmekte.
Optik Akış Hızlandırıcı, yansıma üzere piksel seviyesindeki efektleri yanlışsız bir formda takip ederken, DLSS 3 ayrıyeten sahnedeki geometrinin hareketini tam olarak izlemek için oyun motoru hareket vektörlerini kullanıyor. Aşağıdaki örnekte oyun hareket vektörleri motosikletçinin yanından geçen yolun hareketini hakikat bir halde izlediği (ancak gölgeleri değil) gösterilmiş. Sırf motor hareket vektörlerini kullanarak çerçeveler oluşturmak, gölgede pürüz üzere görsel anormalliklere neden olmakta.
DLSS Frame Generation yapay zeka ağı, her piksel için orta kareler oluşturmak üzere oyun hareket vektörlerinden, optik akış alanından ve sıralı oyun karelerinden gelen bilgilerin nasıl kullanılacağına karar veriyor. Bu ağ, hareketi izlemek için hem motor hareket vektörlerini hem de optik akışı kullanarak (aşağıdaki fotoğrafta görüldüğü gibi) hem geometriyi hem de efektleri hakikat bir halde tekrar oluşturabiliyor.
Yapay zeka, DLSS 3 etkinleştirildiğinde birinci karenin dörtte üçünü ve DLSS Frame Generation kullanarak ikinci karenin tamamını yine yapılandırıyor. Biraz evvel belirttiğimiz üzere, görüntülenen toplam piksellerin sekizde yedisi yine yapılandırılıyor ve performansa büyük katkı sağlanıyor.
DLSS 3’ün Performans Katkısı
NVIDIA’nın argümanlarına bakılırsa makul oyun ve motorlarda klâsik işlemeye kıyasla dört kata kadar performans artışı sağlanabiliyor. Erken yaptığımız DLSS 3 testlerine aşağıdaki videomuzdan ulaşabilirsiniz. Yeni şoförler, oyun güncellemeleri ve gelişmiş DLSS 3 dayanağı ile çok daha güzelini görebiliriz.
Eskiden içerik üretimi büyük stüdyolar tarafından yapılırken, artık ferdi geliştiriciler güçlü sistemleriyle birlikte üstün görseller sunan içerikler üretebiliyor. NVIDIA, bildiğiniz üzere Game Ready şoförünün yanı sıra Studio şoförüyle profesyonel kullanıcılar için yenilikler ve optimizasyonlar sağlıyor. İşte yeşil grubun sunduğu kimi ayrıcalıklar:
- 3D, görüntü ve yapay zeka takviyeli işleri hızlandırmak için özel donanım optimizasyonları.
- Güvenilirliği en üst seviyeye çıkarmak için uygulamalar üzerinde kapsamlı bir formda test edilmiş Studio şoförleri.
- 110’dan fazla tanınan uygulamada RTX donanımı için uygulama optimizasyonları.
- Ayrıca bu uygulamaların daha süratli çalışmasını sağlayan, Optix, DLSS ve Maxine üzere özel özellikler sunan yazılım geliştirme kitleri.
- NVIDIA Omniverse, Broadcast, Canvas ve RTX Remix dahil olmak üzere Studio Suite uygulamaları.
RTX 4000 serisiyle birlikte sunulan yenilikler:
- Canlı yayınlar yapıyorsanız, daha güzel canlı akış kalitesi için AV1 dayanaklı yeni sekizinci jenerasyon kodlayıcıdan yararlanabilir, ayrıyeten NVIDIA Broadcast yapay zeka efektleriyle mikrofon ses kalitenizi ve web kamera imajlarınızı güzelleştirebilirsiniz.
- Video düzenleme işleriyle ilgileniyorsanız, RTX 4000 serisiyle sunulan çift kodlayıcı sayesinde 2 kata kadar daha yüksek yapay zeka performansı ve 2 kata kadar daha yüksek çıktı performansı elde edebilirsiniz.
- 3D sanatkarlar, 3. jenerasyon RT çekirdekleri, gölgelendirici yürütme yine düzenlemesi, DLSS 3 ve NVIDIA Omniverse sayesinde 4K60’ta içerik oluşturabilir.
- Mod yapımcısıysanız klasik oyunları tekrar düzenleyebilir, RTX Remix ile RTX’i faal edebilirsiniz.
AV1 ve Yapay Zeka Dayanaklı Yayıncılık
Canlı yayıncılar çoklukla bant genişliğiyle ilgili problemler (örneğin Twitch yahut Discord’un azamî 8 Mbps bit suratı gibi) yaşar. Bu da yayıncıların sunduğu kaliteyi ve çözünürlüğü olumsuz etkilemekte. AV1 ile canlı yayınlar daha ayrıntılı ve daha yanlışsız görünecek, artık daha yüksek çözünürlükte yayın yapabilecek. AV1 ayrıyeten HDR ve düşük gecikme yetenekleriyle gelişmiş kodlama özelliklerini de destekliyor.
NVIDIA, AV1 için bölümdeki önde gelen şirketlerle birlikte çalıştığını söylüyor. Tanınan uygulamalardan olan OBS Studio, 2022 Ekim ayında yayınlanacak bir güncellemeden sonra NVENC ile AV1 takviyesi sunmaya başlayacak. Bunun yanında, oyuncuların her gün kullandığı Discord, 2022 sonlarında AV1 ile uçtan uca canlı yayın özelliği alıyor.
Video Düzenleme
Adobe Premiere Pro ve Blackmagic Design DaVinci Resolve üzere görüntü düzenleme uygulamaları, CUDA çekirdeklerinin yanı sıra yapay zeka dayanaklı Tensor çekirdekleriyle birlikte GPU gücünden yararlanıyor. Renk düzeltme, görüntü kare boyutu dönüştürme, bulanıklaştırma, sertleştirme, manzara sürece efektleri ve RAW evrak dönüştürme üzere temel fonksiyonların tümü, gelişmiş GPU teknolojileri sayesinde her zamankinden daha kısa müddette tamamlanıyor.
RTX 4090 Performansı
RTX 4090, AI Magic Mask kullanımında RTX 3090 Ti’ye kıyasla 1.7 kat daha süratli:
RTX 4000 serisinde bulunan çift kodlayıcı, yeni algoritma ve mimari performans iyileştirmeleri ile birlikte HEVC/AV1 kodlamasında RTX 3000 serisine nazaran 2 kata kadar daha yeterli performans sağlıyor:
ON1 Resize AI 2022, daha yüksek çözünürlüklü çıktılar oluşturmak için GPU hızlandırmalı AI fonksiyonelliğini kullanıyor. Böylece manzara detaylarından ödün vermeden düşük çözünürlüklü imgelerden yüksek çözünürlüklü manzara çıktıları almamıza imkan veriyor. RTX 4090, ON1 Resize AI 2022’d yapay zeka hızlandırmalı manzara boyutlandırma senaryosunda RTX 3090 Ti’ye kıyasla 1.6 kata kadar daha süratli.
Işın izleme takviyeli sürece, animatörlerin sinemalardaki görsel efektler ve oyunlardaki animasyonlu karakterler üzere fotogerçekçi dijital varlıklar tasarlamasına imkan tanıyor. Bu teknoloji yıllardır Hollywood’da standart olarak kullanılıyor fakat yüksek güçlü sunucular ve iş istasyonları gerektiriyor. RTX 4000 serisi ise bu işi son tüketici bazında öbür bir noktaya taşıyor.
Yeni amiral gemisi, ışın izlemeli sürece konusunda en güçlü GPU oldu. Bu kart Blender Cycles, Chaos VRay ve Luxion Keyshot üzere görüntü sürece uygulamalarında evvelki jenerasyon RTX 3090 Ti’ye kıyasla 1.9 kata kadar daha süratli kare sürece performansı sunuyor. DLSS 3 ve gölgelendirici yürütme tekrar sıralama özelliğiyle birleştirildiğinde ise gerçek vakitli render uygulamalarında 4 kata kadar daha süratli render performansı elde etmek mümkün.
8K Oyunculuğa Hakikat Adım Adım
AD102 GPU, DLSS 3 Frame Generation ile desteklendiğinde ve Ultra Performans moduna oyunlarda 8K HDR oyun tecrübesine hazır. Ayrıyeten RTX 4090’da bulunan çift kodlayıcılar sayesinde GeForce Experience üzerinden 8K görüntü oyun çekimi yapabiliyoruz.
NVIDIA, 8K çözünürlüğe giden yolda DLSS 3 faktörünün çok değerli olduğunu vurguluyor. İşte şirket tarafından paylaşılan bir test çizelgesi: