NVIDIA GeForce GTX 480
După îndelungi așteptări și multe zvonuri, iată că a venit vremea ca GTX 480 să fie întrutotul dezvelită. Fermi este cel de-al doilea mare chip controversat al celor de la NVIDIA, dacă nu chiar cel mai controversat din toată istoria companiei și trebuie să recunoaștem că nu am mai văzut atâtea delay-uri de la NV30 încoace. Inițial, GTX 480 trebuia lansată în noiembrie, dar a venit apoi decembrie, ianuarie, februarie și deja începusem să credem că nu va mai apărea. Într-un final de martie a venit și vestea cea mare cum că GTX 480 va fi disponibilă la începutul lunii aprilie, după ce în prealabil totă mulțimea adunată la CeBIT Hanovra nu a avut nici cea mai mică șansă de a vedea ce se ascunde în spatele cufărului cu surprize al celor de la NVIDIA.
În noiembrie, compania a produs un chip denumit A2, care deși era fabricat așa cum trebuie, nu putea fi tactat la vitezele dorite de companie, așa că s-a decis proiectarea unui alt chip, denumit A3 care să atingă vitezele dorite inițial. Așa se face că avem acum de-a face cu un clock final de 700MHz, shaderele – sau GPU CUDA cores asa cum sunt denumite de NVIDIA funcționează la o frecvență de 1401MHz iar memoria GDDR5 la 1848MHz. Dacă însumăm capacitățile celor 12 chipuri de memorie, căci de atâtea dispune un GTX 480, ne rezultă un total de 1536MB GDDR5 de fabricație Samsung (K4G10325FE-HC04), iar dacă ne uităm mai cu atenție la serie vom descoperi că a fost proiectată să ruleze de fapt la 1250MHz (5000MHz efectiv). Pe lângă cele menționate, un GTX 480 dispune și de un regulator de voltaj CHiL prin intermediul căruia se pot face ajustări de tensiune. Interfața de memorie este pe 384biți, ceva ce am mai văzut. Chipul are 480 de nuclee și este mai mult decât evident faptul că NVIDIA a trunchiat cele 512 nuclee inițiale pentru a obține cât mai multe zone funcționale stabile.

GTX 480 ocupă două sloturi și are 27cm lungime, lucru comun de altfel la toate plăcile high-end. Nu la fel de obișnuită este însă și soluția termică cu heatpipes pentru o placă de referință. Pentru a asigura valori optime de răcire NVIDIA a ales să proiecteze întregul sistem de răcire doar pe baza heatpipe-urilor, carcasa de plastic fiind doar o unealtă dedicată redirecționării aerului cald rezultat prin suflarea aerului rece de către cooler. La o primă vedere, GTX 480 dispune de patru heatpipe-uri, dar în realitate sunt cinci; cea din urmă fiind vizibilă numai după înlăturarea carcasei de plastic.
Elementul frontal are un aspect cromat plăcut, iar pe lângă faptul că arată bine, disipează căldura emanată de chipsetul GF100 într-o manieră destul de bună. Că veni vorba de căldură… La cei 250W TDP ai săi și 55W în mod idle, GTX480 are cel mai mare consum din toată istoria GPU-urilor, dar NVIDIA este recunoscută pentru barierele pe care le depășește. Prima curiozitate pe care am vrut să mi-o lămuresc când am aflat ce consum are placa a fost „cum arată un circuit de alimentare pentru un GPU de 250W?”. Ei bine, este vorba despre un circuit normal în șase faze, trei tranzistori, un condensator de 390uF cu electrolit solid, un condensator MLCC de 330uF și un chip de fabricație CHiL. Placa are nevoie de doi conectori PCIe pentru alimentare, un conector 8pin și unul 6pin, iar NVIDIA recomandă folosirea unor surse de minim 600W într-un sistem ce conține un GTX 480, respectiv 550W pentru un sistem cu GTX 470.
Ventilatorul seamănă surprinzător de mult cu soluția implementată pe Radeon-uri… Pe lângă aspectul „neobișnuit” al acestui Delta alimentat cu un curent de 1.8A, zgomotul poate deveni o problemă atunci când GPU-ul este fierbinte. Toate componentele analogice, în special componentele de putere sunt răcite de ventilator și de un heatsink pasiv amplasat deasupra lor. În urma testelor efectuate, placa a atins temperaturi de 65oC în mod idle și 92oC în 3DMark.
NVIDIA este destul de conservatoare în ceea ce priveste materialele folosite, PCB-ul fiind practic o singură bucată de textolit cu două mari găuri în mijloc. Același procedeu cu două găuri în placa de textolit a fost folosit și în cazul dualei GTX 295 pentru a suplimenta cantitatea de aer necesară în procesul de răcire. Ca spații de evacuare, există o ieșire pe panoul I/O, cât și o gură în carcasa de plastic, în dreptul condensatoarelor de putere.
Conectorii de alimentare sunt plasați pe partea superioară, acolo unde ar fi și trebuit să se afle în mod normal, iar pe panoul I/O regăsim două ieșiri DVI standard și un miniHDMI. Deși placa suportă DisplayPort, NVIDIA a găsit de cuviință că un HDMI este mult mai necesar, așa că implementarea DisplayPort-ului va ține în cele din urmă de preferințele fiecărui producător în parte. Dacă dispuneți de LCD-uri cu diametrul cât casa… nu vă faceți griji, GF100 vine cu HDMI 1.4 și cu tot ceea ce aveți nevoie pentru a viziona inclusiv filme 3D. Totul a fost gândit ca la carte: vrei mai mult… plătești! Dacă vrei să folosești trei display-uri și tehnologie 3D Vision, vei fi obligat să bagi și mai adânc mâna în buzunar pentru a mai achiziționa încă o placă, căci una singură va suporta doar două display-uri.
Spre deosebire de GTX 285, al cărei cooler era foarte greu de demontat, coolerul de pe GTX 480 este foarte ușor de dezmembrat, ceea ce facilitează instalarea unui watercooler. Dacă s-ar dori achiziționarea a trei sau patru astfel de plăci, implicit instalarea unui 3-way SLI, respectiv unui 4-way SLI, atunci watercooling-ul este impetuos necesar având în vedere temperaturile la care vor ajunge plăcile.
Cea mai importantă parte a review-ului de-abia acum începe; analiza arhitecturii: ce este, ce aduce nou, cum se comportă… Așa cum am menționat de atâtea ori, GTX 480 este bazată pe noua arhitectură Fermi. Pe numele său de cod GF100, Fermi este numele ultimei generații de chipseturi NVIDIA care a stat la baza plăcilor GTX 480 și GTX 470. GF100 este fabricat de către cei de la TMSC pe o arhitectură de 40nm care integrează 3.2 miliarde de tranzistori, în timp ce rivalul AMD RV870, chipul folosit în ATI Radeon HD5870 integrează doar 2.15 miliarde de tranzistori.
Comparativ cu GT200, GF100 aduce cu de 1.5 – 3.5 ori mai multă performanță, textură, context switching, procesare mai eficientă a modulelor physics și ray tracing; dacă este să ne raportăm la un GTX 295. Nu mai amintim și de tessellation, cea mai „puternică” caracteristică a chipului; adică procesarea în zig-zag, o parte importantă a DirectX 11 care conform spuselor NVIDIA constituie chiar motivul amânării datei de lansare, asta deoarece compania americană a dorit ca totul să iasă perfect.
Deși termenul „tessellation” tradus în limba română ar putea suna destul de caraghios, consider totuși că este destul de în regulă folosirea unui termen în „romenglă” precum tessellație. Așa cum am mai spus, tessellația este un mod de procesare în zig-zag, toate nucleele procesorului grafic lucrând în paralel pentru un rezultat cât mai fin. Ce se înțelege prin throughput cât mai fin? Înțelegem acea procedură prin care se acoperă o suprafață cu forme geometrice ce se îmbină perfect, în urma căreia sistemul trebuie să stocheze doar forma geometrică și coordonatele unde aceasta trebuie replicată. Dacă e să intrăm și mai mult în detalii, replicarea formei geometrice este realizată de către un PolyMorph Engine. În cazul chipsetului GF100, tessellația se realizează strict hardware, nu prin emulări software așa cum ați crede. Jocurile actuale bazate pe DirectX 11 care utilizează totuși tessellația sunt foarte departe de a atinge potențialul maxim al unui chipset GF100 și în ciuda faptului că tessellația este un lucru foarte bun, personal găsesc că NVIDIA ar trebui să se axeze mai mult pe creșterea performanțelor în jocurile actuale decât în jocurile ce vor urma.
Intern, GF100 este compus din 4 unități GPC (Graphics Processing Clusters), 16 unități SM (Streaming Multiprocessors) cu câte 32 nuclee CUDA fiecare, 4 unități RE (Raster Engine) și 6 controllere de memorie. Primele întrebări care ne vin în minte sunt „de ce are GTX 480 15 unități SM în loc de 16? De ce doar 480 de nuclee CUDA și nu 512? De ce 60 unități ROP în loc de 64?”. Cât se poate de simplu… NVIDIA păstrează resursele neexploatate pentru mai târziu, peste câteva luni urmând a scoate pe piață un produs și mai puternic.
Așa cum puteți observa din diagrama de mai jos, un GPC este un bloc hardware de nivel înalt care încapsulează toate elementele cheie procesării grafice: Raster Engine, PolyMorph Engines și Streaming Multiprocessors; ceea ce permite fiecărui GPC în parte să se comporte ca un GPU. Raster Engine-ul din cadrul GPC-ului este folosit la rasterizare și Z-cull, iar cele 4 unități SM pentru fetching și tessellație.

În configurație maximală, GF100 dispune de 512 nuclee CUDA, câte 32 de nuclee pentru fiecare dintre cele 16 SM-uri. Fiecare SM are propriul PolyMorph Engine, plus 4 unități de textură ROP dedicate, spre deosebire de GT200 acolo unde unitatea SM și unitatea de textură erau grupate amândouă în același bloc hardware denumit TPC (Texture Processing Cluster). Un PolyMorph Engine deservește mai multe funcții și are cinci etape: Vertex Fetch, tessellație, transformări Viewport, Attribute Setup și Stream Output. Rezultatele întoarse în urma fiecărei etape sunt transmise unității SM aferente care execută shading-ul și trimite rezultatele etapei următoare. După ce toate etapele au fost terminate, rezultatele fiecărei etape în parte sunt trimise la Raster Engines. Având câte un tessellator (unitatea care deservește tessellația) pentru fiecare SM și RE al fiecărui GPC, GF100 „eliberează” de 8 ori mai multă geometrie față de GT200. În cele din urmă, tessellatorul decide care va fi numărul de părți din care este compus un obiect.

GF100 dispune de 6 controllere de memorie pe 64biți, adică o interfață totală de 384biți care să faciliteze accesul la framebuffer. În ciuda faptului că GF100 are o interfață de 384biți, iar GT200 o interfață mai lată (512biți), GF100 dispune de memorie GDDR5; memorie net superioară GRDDR-ului 3 de pe GT200.
Pe lângă cele prezentate, GF100 încorporează 48 de unități ROP pentru blending, antialiasing și operații atomice. Unitățile ROP sunt organizate în șase grupuri, fiecare grup conținând opt unități ROP deservite de către un controller de memorie pe 64biți.
Cache-urile integrate L1 și L2 permit transportarea mai multor date între SM și tessellator dar la fel de bine și între mai multe SM-uri, iar adăugarea cache-ului L1 ajută acum la retenția cât mai multor date pe GPU, fără a fi necesar accesul la memorie. Fiecare SM dispune de 48/16KB de memorie partajată, de trei ori mai multă față de GT200, memorie care poate fi configurată ori ca 48KB de memorie partajată cu 16KB Cache L1 ori ca 16KB memorie partajată și 48KB Cache L1. Reamintim că pe GT200 nu există memorie cache.

Ei bine, a meritat Fermi așteptarea? Cea mai așteptată placă video din toată istoria GPU-urilor este foarte interesantă și nimeni nu poate contrazice faptul că este cea mai rapidă placă single-GPU de pe piață. Mai mult decât atât, este cea mai complexă piesă hardware care a fost creată vreo dată, iar cei 3.2 miliarde de tranzistori integrați o fac cu siguranță cea mai impresionantă.
GF100 este proiectat pentru viitoarele jocuri DirectX 11 și se bazează îndeosebi pe importanța tessellației hardware și alte câteva creșteri de performanță geometrică, dar astăzi nu poate străluci, timpul ei nu este acum, ci într-un viitor apropiat; piața jocurilor nu este pregătită încă pentru a primi „darurile” oferite de arhitectura Fermi. GTX 480 este mai rapidă decât oricare altă placă single-GPU și se comportă foarte bine în noile teste pentru DirectX 11. Comparativ cu generația precedentă (GT200), noul GPU beneficiază de îmbunătățiri semnificative.
Cu toate astea, testele din viața de zi cu zi și plăcile economice par să lucreze cot la cot împotriva lui GTX 480. În mai toate scenariile GTX 480 este cu 20% – 25% mai rapid decat HD 5870, ceea ce nu e bine. Adică 330 euro, atât cât costa un HD 5870 vs. 450E cât costă un GTX 480 nu se reflectă în performanță! Dacă ar fi să facem un calcul matematic simplu, ar rezulta o variație de 36% a prețului între cele două plăci; și să nu uităm, în acest domeniu al tehnicii, orice dolar în plus al costului de producție ar trebui să se transpună într-o creștere de performanță echivalentă cu un dolar. Asta înseamnă că NVIDIA a pierdut nejustificat undeva pe drum 11%… Oare acest cost suplimentar de 11% comparat cu prețul unui HD 5870 să reprezinte acoperirea golului lăsat de chipul A2 din noiembrie anul trecut? Să fie oare doar calitatea materialelor folosite? Să fie oare tessellația hardware? Sau să fie vorba de 11% profit nejustificat? Rămâne de văzut…
Deci, arhitectura primește felicitări magna cum laude, dar nu și ceea ce poate face în prezent. Este „oarecum” mai rapidă ca un HD 5870, este cu 11% nejustificat mai scumpă, consumă mai mult și este „fierbinte”; iar faptul că un HD 5970 este 515E reprezintă un mare minus pentru compania „verzilor”. Cu toate astea… NVIDIA’s back in business!
Comentarii
Lasă un răspuns
Din aceeasi categorie
- A doua generaţie de procesoare AMD A-series
- Intel 7-Series pregatita pentru Annual Global Tour 2012
- Asus GTX 680 cu o grafică mai fluidă și mai detaliată
- Intel se pregateste pentru cloud
- AMD lanseaza seria Radeon HD 7700
- Placa de baza Sapphire X79
- AMD Radeon HD 7950 a fost lansat
- Intel sarbatoreste 40 de ani de revolutie digitala
- Gigabyte lanseaza seria X79 de placi de baza
- SAPPHIRE anuntă HD 6850 editia Vapor-X