przeglad procesorow graficznych nvidia

15
PUREPC W ARSZAWA 18.10.2009 R . TEMAT: Przegląd procesorów graficznych firmy Nvidia. Autor: Łukasz Sergiusz Michalik

Upload: sergiusz-m

Post on 12-Jan-2016

18 views

Category:

Documents


0 download

DESCRIPTION

Wielkimi krokami zbliża się premiera nowych kart graficznych firmy Nvidia – Fermi, o kodowej nazwie GT300. Układ, który ma być odpowiedzią giganta na premierę kart graficznych konkurenta – ATI/AMD z serii 5800. W Internecie aż huczy od plotek na temat specyfikacji, poprzez nawet sfingowaną, jak uważają poniektórzy, prezentację układów GT300. Każdy zadaje sobie pytanie, co tym razem zaprezentuje gigant z Santa Clara – czy będzie to zupełnie nowy układ pod względem technologicznym, zaprojektowany zupełnie od nowa – czy też kolejny odgrzewany kotlet, jakich niemało w historii firmy… Póki co zapowiedzi samej Nvidii zdają się potwierdzać to pierwsze przypuszczenie, ale jak będzie naprawdę – dowiemy się zapewne wtedy, gdy do naszych rąk trafi w końcu pierwsza karta wyposażona w układ GT300. Tymczasem jest to odpowiedni moment, by podsumować działalność „twórczą” firmy Nvidia i dowiedzieć się, jak przez te 16 lat gigant z Santa Clara zmienił nasze wyobrażenie na temat układów graficznych, które na początku miały służyć jedynie do wyświetlania obrazu na ekranie monitora.

TRANSCRIPT

Page 1: Przeglad procesorow graficznych Nvidia

PUREPCWARSZAWA 18.10.2009 R .

TEMAT: Przegląd procesorów graficznych firmy Nvidia.

Autor:Łukasz Sergiusz Michalik

Page 2: Przeglad procesorow graficznych Nvidia

Spis treści: Wstęp……………………………………………………………..…………………....3 Parę słów o układach graficznych i firmie Nvidia………………………….……....3 Wybrane procesory graficzne: ………………………………………………………4

1. Pre-GeForce……………………………………………………………………42. GeForce 256……………………………………………………………...……53. GeForce 2……………………………………………………………………...64. GeForce 3……………………………………………………………………...75. GeForce 4……………………………………………………………………...76. GeForce FX…………………………………………………………………....87. GeForce 6…………………………………………………………………...…98. GeForce 7……………………………………………………………………..109. GeForce 8……………………………………………………………………..1110. GeForce 9……………………………………………………………………..1211. GeForce 200 GTX…,,,………………………………………………………..13

Podsumowanie………………………………………….……………………………14 Bibliografia…………………………………………………………………………..15

2

Page 3: Przeglad procesorow graficznych Nvidia

Wstęp

Wielkimi krokami zbliża się premiera nowych kart graficznych firmy Nvidia – Fermi,o kodowej nazwie GT300. Układ, który ma być odpowiedzią giganta na premierę kartgraficznych konkurenta – ATI/AMD z serii 5800. W Internecie aż huczy od plotek na tematspecyfikacji, poprzez nawet sfingowaną, jak uważają poniektórzy, prezentację układówGT300. Każdy zadaje sobie pytanie, co tym razem zaprezentuje gigant z Santa Clara – czybędzie to zupełnie nowy układ pod względem technologicznym, zaprojektowany zupełnie odnowa – czy też kolejny odgrzewany kotlet, jakich niemało w historii firmy… Póki cozapowiedzi samej Nvidii zdają się potwierdzać to pierwsze przypuszczenie, ale jak będzienaprawdę – dowiemy się zapewne wtedy, gdy do naszych rąk trafi w końcu pierwsza kartawyposażona w układ GT300.

Tymczasem jest to odpowiedni moment, by podsumować działalność „twórczą” firmyNvidia i dowiedzieć się, jak przez te 16 lat gigant z Santa Clara zmienił nasze wyobrażenie natemat układów graficznych, które na początku miały służyć jedynie do wyświetlania obrazuna ekranie monitora.

Parę słów o układach graficznych i firmie Nvidia

W obecnych czasach układy graficzne to jedne z najbardziej zaawansowanychtechnologicznie oraz najbardziej złożonych układów, które stały się jednym z najważniejszych części ówczesnych komputerów.

Ich pojawienie wiązało się przede wszystkim z coraz większymi potrzebamizwiązanymi z generowaniem grafiki na monitorze komputera. Ponieważ zapotrzebowanie tokilkanaście lat temu rosło z dnia na dzień stworzono specjalną jednostkę która miałaodpowiadać za obliczenia związane z wyświetlaną grafiką, by w ten sposób zwiększyćwydajność prezentowanego obrazu przy jednoczesnym odciążeniu procesora, który mógłby wtym czasie zajmować się innymi obliczeniami.

W efekcie tego powstał GPU (Graphical Procesing Unit) – jest to termin stworzonyprzez firmę Nvidia, która użyła go w stosunku do układu graficznego, który zgodnie z nazewnictwem miał być graficzną jednostką obliczeniową, w skrócie procesoremgraficznym. Pojawienie się określenia GPU wiązało się z premierą karty graficznej GeForce256, która miała miejsce 31 sierpnia 1999. To właśnie przy okazji wprowadzenia na rynek tejkarty firma Nvidia po raz pierwszy użyła tego terminu obowiązującego po dziś dzień i wiążącego się obecnie z bardzo dużą mocą obliczeniową.

Układy graficzne są stosowane na szeroką skalę w kartach graficznych, które już odponad 10 lat odpowiadają za komunikację komputera z monitorem, a co za tym idzie –obsługują wyświetlanie grafiki. W celu jeszcze większego zwiększenia wydajnościnowoczesnych układów graficznych producenci kart opracowali technologie pozwalającełączyć wiele kart graficznych na jednej płycie głównej. Pomysł ten został niejakozaczerpnięty od firmy 3dfx, która w 1998 r. stworzyła technologię SLI (Scan-Line Interleave)pozwalającą na łączenie ze sobą dwóch kart graficznych Vodoo 2. Obecna technologia SLI(Scalable Link Interface ) firmy Nvidia (która w 2000 roku wykupiła firmę 3dfx) ideowoczerpie z tego pomysłu pełnymi garściami.

Nvidia jest międzynarodową korporacją specjalizującą się w projektowaniu i produkcji procesorów graficznych i chipsetów dla stacji roboczych,komputerów PC i urządzeń przenośnych. Została założona w styczniu 1993r. przez Jen-Hsun Huang’a, Curtisa Priem’a i Chrisa Malachowsky’ego.

3

Page 4: Przeglad procesorow graficznych Nvidia

Siedziba firmy mieści się w Santa Clara w stanie California w USA. Korporacja ta jestjednym z czołowych producentów procesorów graficznych, chipsetów wykorzystywanych wkartach graficznych, konsoli do gier jak również chipsetów do płyt głównych. Nvidiaprodukuje obecnie dwa rodzaje układów graficznych. Jej sztandarową serią są układy z seriiGeForce skierowane głównie na rynek dla graczy komputerowych. Drugim typemprocesorów graficznych produkowanych przez Nvidię są układy Quadro przeznaczonegłównie do zaawansowanej obróbki grafiki, projektowania złożonych obiektów 3D i renderingu1.

Wybrane procesory graficzne

1. Pre-GeForce

Jest to seria pierwszych układów graficznych stworzonych przez firmę Nvidia, z czasówprzed pojawieniem się serii GeForce. Układy te pojawiły się na rynku w 1995 roku i byłyprojektowane i wytwarzane do 1999 r.

1.1. STG 2000 / NV1

Nvidia NV1 powstała dzięki współpracy firm Nvidiai SGS-THOMSON Microelectronics. Był to pierwszy w pełni multimedialnyakcelerator PCI dostarczający w czasie rzeczywistym foto-realistycznągrafikę 3D, full-motion video 2 i efekty specjalne. Został wydany w 1995 r. i sprzedawany pod nazwą Diamond Edge 3D na licencjiEDGE Games.

Firma Nvidia wypuściła ten układ pod nazwą NV1 współpracującyz pamięciami VRAM, natomiast firma SGS-THOMSON sprzedawałago pod nazwą STG 2000 w wersji z pamięciami DRAM. Układ tenposiadał rdzeń graficzny obsługujący w pełni tryb 2D/3D bazujący naquadric texture mapping3.

Specyfikacja techniczna układu Nvidia NV1:

Nazwakodowa

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillrate4

max(MT/s5)

Konfiguracjaukładu

Szynapamięci

(bit)

Rodzaj pamięci

NV1 350 2/4 brak danych 75 12 brak danych 64 VRAM/DRAM

1 Rendering lub inaczej renderowanie to w grafice 3D komputerowa analiza modelu danej sceny i utworzenie na jej podstawie dwuwymiarowego obrazu wyjściowego w formie statycznej lub w formie animacji. Podczas renderowania rozpatrywane są m.in. odbicia, cienie, załamania światła, wpływ atmosfery, efekty wolumetryczne.2 Full-motion video – jest to system, który dostarczał poruszające się obrazy wideo razem z dźwiękiem na komputerze. Obrazy wideo i dźwięki były zazwyczaj przechowywane na dysku.3 Quadric texture mapping – jest to technologia wykorzystywana w układach graficznych przyspieszająca mapowanie i ponowne rysowanie tektur redukując w ten sposób nakład pracy CPU. Układy graficzne Nvidii wykorzystują małe wielokąty do renderowania w miarę dobrze wyglądających zaokrąglonych obiektów. Uzupełnianie ekranu przy pomocy tej technologii zabierało mniej czasu i mocy obliczeniowej CPU, który w tymczasie mógł wykonywać inną pracę obliczeniową.4 Fillrate – jest to liczba pixeli jaką GPU jest w stanie zrenderować i przesłać do pamięci karty graficznej.5 MegaTransfers per second – pomiar szybkości szyny i kanału w milionach „efektywnych” cyklów na sekundę.

4

Nvidia NV1

Page 5: Przeglad procesorow graficznych Nvidia

1.2. RIVA 128 / 128 ZX

Układ RIVA 128 został wypuszczony przez firmę Nvidia w marcu 1997 roku jako pierwszy konsumencki akcelerator 2D/3Dwspierający również akcelerację wideo. Nazwa pochodzi odakronimu Real-time Interactive Video and Animation akcelerator.

Układ ten był następstwem sukcesu układu NV1. RIVA 128 majednak zupełnie inną architekturę niż jego poprzednik – układ tenzostał zaprojektowany do renderowania obrazu z wykorzystaniemDirectX 5 i OpenGL 1.0. Procesor graficzny składał się z 3,5 milionatranzystorów wytworzonych w 350 nm procesie technologicznym.Przystosowany został do złącza AGP 1x ale istniała również wersjaze zwykłym interfejsem PCI.

Był to pierwszy układ wspierający bibliotekę DirectX, jak również pełną akceleracjęwideo dla MPEG-2 przy współpracy z zamontowanym na karcie graficznej układemRAMDAC6. Rok po premierze układu Riva 128 Nvidia wypuściła na rynek nieco poprawionąi ulepszoną wersję układu znaną pod nazwą RIVA 128 ZX, która różniła się od wersji bez ZXw nazwie przede wszystkim wsparciem dla AGP 2x, większą ilością obsługiwanej pamięcioraz sprzętowym wsparciem dla antialiasingu7.

Specyfikacja techniczna układu Nvidia RIVA 128, RIVA 128 ZX:

Nazwakodowa

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięci

NV3 350 4 100 100 100 1:1:1 128 SGRAMNV3 350 8 100 100 100 1:1:1 128 SGRAM

*liczba jednostek Pixel8 Shader9 : TMU10 : ROP11

2. GeForce 256Był to pierwszy układ z serii GeForce wyprodukowany przez

firmę Nvidia. Jego premiera miała miejsce 31 sierpnia 1999 r. Zostałzbudowany i zaprojektowany na podstawie swojego poprzednika –układu RIVA TNT2.

W GeForce 256 w porównaniu do jego poprzednika zostałazwiększona dwukrotnie liczba potoków renderujących 12, jednostekTMU oraz ROP, do czterech w każdym przypadku. GPU byłprzystosowany do współpracy z pamięciami SDR i DDR. W układzietym kalkulacje geometryczne zostały przekazane do sprzętowychjednostek transformacji i oświetlenia (T&L).

6 RAMDAC - to jednoukładowa struktura układu scalonego na karcie graficznej, przeznaczona do przetwarzania sygnału obrazu zakodowanego cyfrowo na sygnał analogowy wyświetlany na ekranie monitora.7 Antialiasing – zmniejszanie liczby błędów, które tworzą zniekształcenia obrazu8 Pixel Shader – jest to zbiór instrukcji z rodziny Shader, który wykorzystywany jest w GPU do renderowania światła sceny, oraz obiektów w taki sposób, by jak najlepiej odwzorowywały rzeczywistość, w głównej mierze zajmuje się cieniowaniem. Pixel Shader jest wspierany przez Direct3D oraz OpenGL.9 Shader – jest to zbiór instrukcji wykorzystywany przede wszystkim do przeliczania renderingu efektów z dużym stopniem elastyczności, wykorzystywany do cieniowania i wygładzania krawędzi.10 Texture Mapping Unit – Jednostki TMU – teksturujące – zajmujące się nakładaniem tekstur11 Render Out Pixel – jednostka zajmująca się końcową obróbką piksela oraz zapisaniem do pamięci RAM karty graficznej12 Potok renderujący – jednostka odpowiedzialna za tworzenie znacznej części obrazu

5

Nvidia RIVA 128

Nvidia GeForce 256

Page 6: Przeglad procesorow graficznych Nvidia

Dodatkowo NV 10 w porównaniu do swojego poprzednika wspierał nową wersjębibliotek DirectX 7 i OpenGL 1.2. Wprowadzono również kompensację ruchu dla wideostandardu MPEG-2. Pojawienie się układu Geforce 256 spowodowało bardzo duży wzrostwydajności w grach 3D.

Specyfikacja techniczna układu Nvidia GeForce 256:

Nazwakodowa

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięci

NV10(SDR)

220 32/64 120 166 480 4:4:4 128 SDRAM

NV10(DDR)

220 32/64 120 300 480 4:4:4 128 DDRAM

*liczba jednostek Pixel Shader : TMU : ROP

3. GeForce 2

Był to układ drugiej generacji procesorów graficznych GeForce.Architektura układu GeForce 2 jest w dużej mierze podobna doGeForce 256, jednak posiada kilka ważnych udoskonaleń.

Najważniejszym ulepszeniem było dodanie drugiej jednostkiteksturującej (TMU) przypadającej na 4 potoki renderujące.Zwiększono również o 67% taktowanie układu graficznego (ze 120MHz na 200 MHz). Dzięki tym zmianom układ oznaczony jakoGeForce 2 przekroczył magiczną barierę fillrate 1 MT/s i osiągnął 1,6MT/s, co stanowiło niemal 330 % wzrost porównaniu do jegopoprzednika, zyskując tym samym oznaczenie GeForce 2 GTS (giga-texel shader – związany bezpośrednio z fillrate).

Kolejnym istotnym ulepszeniem układu było zastosowanie w nim HDVP (High DefinitionVideo Processor), który wykonywał część obliczeń związanych z obróbką obrazu z DVD orazobrazu w standardzie HDTV.

Do nowego układu w porównaniu do jego poprzednika wprowadzono również NSR(Nvidia Shading Rasterizer), który umożliwia bardziej zaawansowane obliczenia oświetleniaprezentowanej sceny, z dokładnością do jednego piksela. NSR było notabene prymitywnąjednostką Pixel Shader, która w kolejnych generacjach układów graficznych spełnia bardzoważną rolę związaną z generowaniem obrazu 3D. W GeForce 2 poprawiono równieżantialiasing poprzez wprowadzenie próbkowania FSAA w trybie skalowania: 1,5x, 2x oraz4x. GPU GeForce 2 obsługiwał interfejs AGP 4x.

Specyfikacja techniczna układu Nvidia GeForce 2:

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu

Szynapamięci

(bit)

Rodzaj pamięci

GeForce 2GTS

180 32/64 200 333 1600 4:8:4 128 DDRAM

GeForce 2PRO

180 32/64 200 400 1800 4:8:4 128 DDRAM

GeForce 2Ti

150 64 250 400 2000 4:8:4 128 DDRAM

GeForce 2Ultra

150 64 250 460 2000 4:8:4 128 DDRAM

*liczba jednostek Pixel Shader : TMU : ROP

6

Nvidia GeForce 2 Ti

Page 7: Przeglad procesorow graficznych Nvidia

4. GeForce 3

Trzecia generacja układów graficznych GeForce 3 miała swoją premierę w Marcu 2001 r.W porównaniu do układów Nvidii wcześniejszych generacji: GeForce 256/GeForce 2 noweukłady miały kilka widocznych ulepszeń.

GeForce 3 jako pierwszy układ graficzny posiadałprogramowalne Vertex i Pixel Shadery (które były wymagane przezspecyfikację biblioteki DirectX 8.0). Są to wyspecjalizowanejednostki sprzętowe zaprojektowane do wykonywania małych,zwyczajnych transformacji, programów tzw. per-pixel 13 i generowania oświetlenia co w znaczącym stopniu zwiększyłoelastyczność układów graficznych. Nvidia nazwała tę technologięnFinite FX Engine (GeForce 2 co prawda posiadał prymitywnąjednostkę Pixel Shader zwaną NSR, jednak nie można jej byłoprogramować, a w związku z tych wykorzystywana była tylko przezspecjalnie stworzone demonstracje techniczne).

W porównaniu do swoich poprzedników GeForce 3 posiadał sprzętowy menedżer pamięciznany jako LMA (Lightspeed Memory Architecture), który został zaprojektowany do redukcjiprzekraczania dozwolonej przepustowości pamięci poprzez kompresję Z-buffer 14 i lepszezarządzanie szyną pamięci.

W GeForce 3 został zmieniona implementacja antialiasingu z supersamplingu do multi-samplingu, który był bardziej wydajny i łatwiejszy do eksponowania w OpenGL i Direct3D.

W nowym GPU w porównaniu do poprzednich konstrukcji została zwiększona liczbapróbkowania w filtrowaniu anizotropowym z 2x do 8x.

Specyfikacja techniczna układu Nvidia GeForce 3:

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięci

GeForce3 180 64/128 200 460 1600 1:4:8:4 128 DDRAMGeForce 3

Ti 200150 64/128 175 400 1400 1:4:8:4 128 DDRAM

GeForce 3Ti 500

150 64/128 240 500 1920 1:4:8:4 128 DDRAM

*liczba jednostek Vertex Shader : Pixel Shader : TMU : ROP

5. GeForce 4 (Ti)

Kolejna generacja układów graficznych ze stajni Nvidii nie przyniosła zbyt wielu zmian w architekturze swojego poprzednika GeForce 3. Mimo tego, nowy GPU posiadał paręciekawych udoskonaleń.

GeForce 4 posiadał poprawiony kontroler pamięci LMAII (Lightspeed MemoryArchitecture II).

13 per-pixel – określenie czegoś, co jest wykonywane pixel po pixelu14 Z-Buffer – jest to zarządzanie głębokością koordynatów obrazów w przestrzeni 3D, zazwyczaj zaimplementowane sprzętowo, rzadziej w programach. Jest to rozwiązanie dla widocznego problemu związanego z wyborem elementów renderowanej sceny które powinny być widoczne, a które powinny zostać ukryte.

7

Nvidia GeForce 3 Ti200

Page 8: Przeglad procesorow graficznych Nvidia

Nowy GPU obsługiwał również DirectX w wersji 8.1 cobezpośrednio wiązało się z nowymi wersjami jednostek PixelShader i Vertex Shader (odpowiednio w wersji 1.3 i 1.1 -

w porównaniu do swojego poprzednika, jednostki te zostały niecopoprawione, stąd nowe wersje). Jednostki te zostały określoneprzez Nvidię jako nFinite FX Engine II. Kolejną nowością była obsługa OpenGL w wersji 1.4 (jegopoprzednik obsługiwał OpenGL w wersji 1.3).Jedną z ważniejszych nowości nowego układu graficznego była

obsługa AGP 8x, co pozwoliło w pełni wykorzystać potencjał nowych GPU.

Specyfikacja techniczna układu Nvidia GeForce 4:

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięci

GeForce4 Ti4200

150 64/128 250 444/500 2000 2:4:8:4 128 DDRAM

GeForce4 Ti4200 8x

150 128 250 513 2000 2:4:8:4 128 DDRAM

GeForce4 Ti4400

150 128 275 550 2200 2:4:8:4 128 DDRAM

GeForce4 Ti4800 SE

150 128 275 550 2200 2:4:8:4 128 DDRAM

GeForce4 Ti4600

150 128 300 650 2400 2:4:8:4 128 DDRAM

GeForce4 Ti4800

150 128 300 650 2400 2:4:8:4 128 DDRAM

*liczba jednostek Vertex Shader : Pixel Shader : TMU : ROP

6. GeForce FX (5900)

Piąta generacja układów graficznych z serii GeForce w pełniwspierała nowe biblioteki DirectX 9.0, które wprowadzały dalszeulepszenia poprzez nową technologię Shader Model 2.0. GeForceFX był pierwszym układem który wspierał sprzętowo ShaderModel 2.

W porównaniu do swojego poprzednika nowy układwspółpracował z pamięciami DDR, DDR2 i GDDR-3 (podczasgdy GeForce 4 wspierał tylko SDR i DDR) oraz posiadał nową256 bitową szynę danych do komunikacji z nowymi typami pamięci (128 szyna danych byławąskim gardłem jeżeli chodzi o przepustowość nowych pamięci).

W porównaniu do swojego poprzednika układ GeForce FX (w najmocniejszej wersji)posiadał aż 3 jednostki VS, 8 jednostek PS, 8 jednostek TMU i 8 jednostek ROP, podczas gdyGeForce 4 posiadał tylko 2 jednostki VS, 4 jednostki PS, 8 jednostek TMU i 4 jednostki ROP.Miało to bezpośrednie przełożenie na wydajność układu GeForce FX, która była prawiedwukrotnie większa niż wydajność GeForce 4.

GeForce FX był również pierwszym układem, który współpracował z nową szyną danych– PCI-Express, jednak firma Nvidia wypuściła tylko dwie wersje takiego układu (GeForcePCX 5900 oraz GeForce PCX 5950), ze względu na brak przełożenia na wydajność pomiędzyAGP 8x a PCI-E.

Układ został wykonany w nowym procesie technologicznym 130 nm.Specyfikacja techniczna układu Nvidia GeForce FX:

8

Nvidia GeForce 4 Ti 4200

Nvidia GeForce FX 5900 XT

Page 9: Przeglad procesorow graficznych Nvidia

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu

Szynapamięci

(bit)

Rodzaj pamięci

GeForce FX 5800 130 256 400 800 3200 3:4:8:8 128 GDDR2GeForce FX 5800

Ultra130 256 500 1000 4000 3:4:8:8 128 GDDR2

GeForce FX 5900XT

130 256 400 700 3200 3:4:8:8 256 DDR

GeForce FX 5900 130 256 400 850 3200 3:4:8:8 256 DDRGeForce FX 5900

Ultra130 256 450 850 3600 3:4:8:8 256 DDR

GeForce PCX5900

130 256 425 550 3400 3:4:8:8 256 DDR

GeForce FX 5950Ultra

130 256 475 950 3800 3:4:8:8 256 DDR

GeForce PCX5950

130 256 350 950 3800 3:4:8:8 256 DDR

*liczba jednostek Vertex Shader : Pixel Shader : TMU : ROP

7. GeForce 6 (6800)

Szósta już generacja układów serii GeForce wspierała Vertex i Pixel shadery w wersji 3.0,uwzględniając w ten sposób wymagania biblioteki DirectX 9.0c. Posiadała również pełnewsparcie dla OpenGL 2.0, w porównaniu do GeForce FX gdzie tylko wybrane modelewspierały tę wersję OpenGL.

Ważną nowością w nowym GPU było PureVideo, technologia związana z przetwarzaniemwideo, która obsługiwała nowe formaty obrazu, min. wysokiej jakości H.264, VC-1, WMV i MPEG-2 redukując jednocześnie udział CPU oraz zmniejszając zużycie energii.Subpixelowy proces umożliwiał skalowanie obrazu wideo do możliwie największegorozmiaru przy uzyskaniu najwyższej jakości za pomocą specjalnego oprogramowania.

Nvidia jako pierwsza wprowadziła do nowego układu obsługę Shader Model 3.0, którybył rozszerzeniem Shader Model 2.0 min. o nowy standard 32 bitowy zmienno-przecinkowejprecyzji (FP32) oraz dynamiczne rozgałęzianie zwiększające efektywność i długość trwaniacieni (shaderów). Dzięki temu GeForce 6 odczuwalnie zyskał na wydajności.

Najważniejszą innowacją nowego układu było wsparcie dlatechnologii SLI, która umożliwiała łączenie dwóch takichsamych kart graficznych GeForce 6. Sterowniki do układówbalansowały równomierny wykorzystanie dwóch układówjednocześnie. Technologia SLI jest dostępna wyłącznie dlaplatformy ze złączami PCI-Express.

Kolejną nowością była technologia IntelliSample 4.0, któraumożliwiała 16 krotne filtrowanie anizotropowe, rotacyjnąsiatkę antialiasingową oraz antialiasing przezroczystychpowierzchni.

GPU GeForce 6 obsługiwał również nowy typ pamięciGDDR3 oraz posiadał 2 razy więcej jednostek VS, PS, TMU i ROP niż jego poprzednik (odpowiednio 6,16,16,16).

9

Nvidia GeForce 6800

Page 10: Przeglad procesorow graficznych Nvidia

Specyfikacja techniczna układu Nvidia GeForce 6 (8600):

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu

Szynapamięci

(bit)

Rodzaj pamięci

GeForce 6800 130 128/256

325 600 3900 5:12:12:12 256 DDR

GeForce 6800 GTO 130 256 350 900 4200 5:12:12:12 256 GDDR3GeForce 6800 GS 130 256 350 1000 4200 5:12:12:12 256 GDDR3GeForce 6800 GS 130 256 425 1000 3400 5:12:12:8 256 GDDR3GeForce 6800 GT 130 256 350 1000 5600 6:16:16:16 256 GDDR3

GeForce 6800 Ultra 130 256 400 1100 6400 6:16:16:16 256 GDDR3GeForce 6800 Ultra

EXTREME130 256 450 1200 7200 6:16:16:16 256 GDDR3

*liczba jednostek Vertex Shader : Pixel Shader : TMU : ROP

8. GeForce 7 (7800 & 7900)

GeForce 7 był jednym z najbardziej złożonych układów na świecie. Posiadał 302 milionytranzystorów, 8 jednostek VS i 24 jednostki PS – dla porównania jego poprzednik posiadał„zaledwie” 220 milionów tranzystorów, 6 jednostek VS i 16 jednostek PS.

W nowym układzie w dużej mierze poprawiono obsługę SLI, zwiększając dzięki temuwydajność dwóch kart pracujących w tym trybie.

Do ważniejszych nowości można również zaliczyć HDRlighting15, radiosity 16 oraz subsurface scattering 17 oraz technologięExtreme HD.

GeForce 7 był wyposażony w silnik CineFX 4 którego głównymzadaniem było jeszcze większe urzeczywistnienie generowanychscen 3D.

Przy okazji układu GeForce 7 warto wspomnieć, że inżynierowieNvidii stworzyli kartę graficzną na której były zamontowane 2 GPU(najwydajniejsze) tej serii układów, co po połączeniu dwóch takichkart w SLI dawało ogromny skok wydajności, prawie czterokrotny w porównaniu do najmocniejszego układu GeForce 6.

15HDR – High dynamic range rendering – jest to rendering używany w scenach grafiki komputerowej gdzie używane są obliczenia oświetlenia w bardziej dynamicznej skali w celu stworzenia bardziej realistycznych efektów specjalnych.16Radiosity jest algorytmem związanym z renderowaniem oświetlenia w grafice 3D. Efekt działania tego algorytmu to bardziej rzeczywiste oświetlenie, przez co sceny stają się bardziej realne i zbliżone do rzeczywistości.17Subsurface scattering – technologia związan z oświetleniem materiałów w grafice 3D poprawiająca efekt „rzeczywistości”

10

Nvidia GeForce 7900 GS

Page 11: Przeglad procesorow graficznych Nvidia

Specyfikacja techniczna układu Nvidia GeForce 7 (7800 & 7900):

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(max)MiB

Taktowanieukładu(MHz)

Taktowaniepamięci(MHz)

Fillratemax

(MT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięci

GeForce 7800 GT 110 256 400 1000 8000 7:20:20:16 256 GDDR3GeForce 7800 GTX 110 256 430 1200 10320 8:24:24:16 256 GDDR3GeForce 7800 GTX

512110 512 550 1700 13200 8:24:24:16 256 GDDR3

GeForce 7900 GS 90 256 450 1320 9000 7:20:20:16 256 GDDR3GeForce 7900 GT 90 256 450 1320 10800 8:24:24:16 256 GDDR3

GeForce 7900 GTO 90 512 650 1320 15600 8:24:24:16 256 GDDR3GeForce 7900 GTX 90 512 650 1600 15600 8:24:24:16 256 GDDR3GeForce 7900 GX2 90 2 x 512 500 1200 24000 2 x 8:24:24:16 2 x 256 GDDR3GeForce 7950 GT 90 256/

512550 1400 13200 8:24:24:16 256 GDDR3

GeForce 7950 GX2 90 2 x 512 500 1200 24000 8:24:24:16 2 x 256 GDDR3*liczba jednostek Vertex Shader : Pixel Shader : TMU : ROP

9. GeForce 8 (8800)

GeForce 8 jest ósmą generacją układów z serii GeForce i jednocześnie reprezentuje trzecifundamentalnie nowy design GPU zaprojektowany przez Nvidię.

Innowacją w nowym GPU są po raz pierwszy wprowadzone jednostki unified shader przyokazji implementacji sprzętowego wsparcia dla DirectX 10 i Shader Model 4.0. Nowością wporównaniu do układu wcześniejszej generacji jest przeniesienie osobnych jednostekfunkcjonalnych (pixel shaders, vertex shaders) do jednorodnego zbioru uniwersalnychzmienno przecinkowych procesorów (zwanych „stream processors”) które mogą wykonywaćbardziej uniwersalne zadania. Jednostki unified shader składają się ze stream processors.Rozwiązanie to wydaje się być logiczne, ponieważ w przypadku starych jednostek byłamarnowana moc obliczeniowa, ponieważ dane jednostki mogły zajmować się tylko jednymzadaniem w danym czasie. Nowe jednostki unified shader zostały zaprojektowane tak, byoptymalnie wykorzystać zapotrzebowanie na jednostki obliczeniowe i by móc wykonywaćwiele zadań w danej chwili poprzez przydzielanie wolnych jednostek obliczeniowych doinnych zadań. GeForce 8 posiadał aż 128 jednostek unified shader, na które prócz jednostekpixel i vertex shaders składały się również jednostki geometry shaders 18, poza tym posiadałrównież 64 jednostki TMU i 24 jednostki ROP (w najwyższej dostępnej wersji).

Nowością było również wsparcie dla nowej wersji bibliotek OpenGL w wersji 3.0.Nowy układ posiadał lepsze filtrowanie tekstur niż jego

poprzednik co było owocem wielu optymalizacji jak równieżwizualnych „tricków”, co w efekcie przyspieszało renderowanieobrazów przy jednoczesnym uzyskiwaniu ich wysokiej jakości.GeForce 8 posiadał również poprawne renderowanie z wykorzystaniem kątowo-niezależnego algorytmu filtrowaniaanizotropowego w połączeniu z trilinear'nym filtrem tekstur. Nowyukład był wyposażony w większe możliwości arytmetycznegofiltrowania tekstur niż GeForce 7. To pozwalało na filtrowaniewysokojakościowe filtrowanie przy znacznie mniejszym spaduwydajności niż w przypadku kart wcześniejszej generacji.

Bardzo ważną nowością w GeForce 8 było po raz pierwszy w historii układówgraficznych zastosowanie technologii CUDA. Jest to jedyne na świecie środowisko języka C,

18Geometry shader służyły do generowania prymitywów graficznych które były wstępem do bazującego na grafice rastrowej renderingu obrazów 3D.

11

Nvidia GeForce 8800 GTX

Page 12: Przeglad procesorow graficznych Nvidia

które pozwala programistom i twórcom oprogramowania na tworzenie aplikacji dorozwiązywania najbardziej złożonych obliczeniowo zadań w krótkim czasie poprzezwykorzystanie mocy przetwarzania równoległego wielu rdzeni procesora graficznego.Technologia CUDA pozwalała na dodatkowe wykorzystanie rdzeni układu graficznego doakceleracji wymagających zadań systemowych takich jak transkodowanie wideo, dostarczającprzy tym znacznie większą wydajność w porównaniu do tradycyjnych CPU.

GPU wspierał nową szynę systemową PCI Express 2.0, która oferowała wyższąszybkość transferu danych w najbardziej wymagających grach i aplikacjach 3D, będącjednocześnie kompatybilnym wstecznie z wcześniejszą wersją PCI Express.

GeForce 8 posiadał w najwyższej dostępnej wersji obsługę również 384 bitowej szynydanych do komunikacji z pamięciami GDDR3.

Układ był produkowany najpierw w 90 nm procesie technologicznym, a po poprawkach w odświeżonej wersji w 65 nm, posiadał 754 miliony tranzystorów, więcej niż ówczesnynajwydajniejszy i najbardziej złożony CPU.

Specyfikacja techniczna układu Nvidia GeForce 8 (8800):

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(min)MiB

Taktowanie (MHz) Fillratemax

(MT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięciukładu shader'ów pamięci

GeForce 8800GS

65 384 550 1375 1600 26400 96:48:`1 192 GDDR3

GeForce 8800GTS

90 320/640

513 1188 1584 24000 96:48:20 320 GDDR3

GeForce 8800GT

65 256/512/1024

600 1500 1400(256)1800

33600 112:56:16 256 GDDR3

GeForce 8800GTS

65 512 650 1625 1940 41600 128:64:16 256 GDDR3

GeForce 8800GTX

90 768 575 1350 1625 36800 128:64:24 384 GDDR3

GeForce 8800Ultra

90 768 612 1500 2160 39168 128:64:24 384 GDDR3

*liczba jednostek Unified Shaders : TMU : ROP

10. GeForce 9 (9800)

Kolejna generacja procesorów graficznych z serii GeForce to poprawiona wersja układuwcześniejszej generacji, różniąca się od GeForce 8 kilkoma ważnymi innowacjami.

Nowy GPU posiadał sprzętową implementację technologii PhysX,która wprowadzała zupełnie nową klasę interakcji fizycznych w grachsprawiając, że stają się one coraz bardziej dynamiczne i realistycznedzięki układom GeForce 9.

Nvidia w nowej serii układu GeForce wprowadziła obsługętechnologii 3-way SLI. Pozwalało to na łączenie trzech kart graficznychna jednej płycie głównej w efekcie czego zwiększało to wydajnośćskalowania grafiki poprzez zaimplementowane w sterownikach podWindows Vista, AFR19 (Alrenate Frame Rendering).

GeForce 9 posiadał wsparcie dla technologii HybridPower,której działanie polegało na przełączaniu pracy komputera międzyukładem GeForce 9 karty graficznej a układem zintegrowanym z płytą główną, co pozwalało

19 AFR jest równoległą graficzną architekturą renderującą, która wykorzystuje do pracy dwa lub więcej procesorów graficznych na jednym monitorze w celu zwiększenia jakości obrazu i przyspieszenia renderingu.

12

Nvidia GeForce 9800 GTX

Page 13: Przeglad procesorow graficznych Nvidia

na dużą oszczędność energii oraz zmniejszenie hałasu dochodzącego z PC podczas gdy wsystemie były uruchomione aplikacje nie potrzebujące dużej mocy obliczeniowej GPU.

Specyfikacja techniczna układu Nvidia GeForce 9 (9800):

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(min)MiB

Taktowanie (MHz) Fillratemax

(MT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięciukładu shader'ów pamięci

GeForce 9800GT

55/65 512/1024

600 1500 1800 33600 112:56:16 256 GDDR3

GeForce 9800GTX

65 512 675 1688 2200 43200 128:64:16 256 GDDR3

GeForce 9800GTX+

55 512 738 1836 2200 47200 128:64:16 256 GDDR3

GeForce 9800GX2

65 2 x 512 600 1500 2000 2 x 38400 2 x 128:64:16 256 GDDR3

*liczba jednostek Unified Shaders : TMU : ROP

11. GeForce 200 GTX

Najnowsza, dziesiąta generacja układów graficznych firmy Nvidia, będąca kontynuacjąarchitektury układów GeForce 8 i 9.

GeForce 200 GTX posiada drugą generację UnifiedArchitecture (na którą składają się jednostki unified shader).Zwiększa ona o ponad 50% wydajność w grach oraz po razpierwszy wprowadza 240 jednostek unified shader, co jestdwukrotnie większą liczbą niż miało to miejsce w GeForce 8 i 9,dając jednocześnie ogromną wydajność wszystkich jednostekshader.

W porównaniu do swoich poprzedników układ zyskał wsparciedla biblioteki OpenGL w wersji 3.1.

Nowy GPU jest obecnie najbardziej złożonym układem naświecie, posiadając aż 1,4 miliarda tranzystorów oraz 240 streamprocessors.

Specyfikacja techniczna układu Nvidia GeForce 200:

Nazwaukładu

Procesprodukcyjny

(nm)

Pamięć(min)MiB

Taktowanie (MHz) Fillratemax

(GT/s)

Konfiguracjaukładu*

Szynapamięci

(bit)

Rodzaj pamięciukładu shader'ów pamięci

GeForce GTX275

55 896 633 1404 2268 50.6 240:80:28 448 GDDR3

GeForce GTX280

55 1024 602 1296 2214 48.16 240:80:32 512 GDDR3

GeForce GTX285

55 1024/2048

648 1476 2484 51.84 240:80:32 512 GDDR3

GeForce GTX295

55 2 x 896

576 1242 1998 46.08 2 x 240:80:28 2 x 448 GDDR3

*liczba jednostek Unified Shaders : TMU : ROP

13

Nvidia GeForce GTX 295

Page 14: Przeglad procesorow graficznych Nvidia

Podsumowanie

Układy graficzne w obecnej fazie rozwoju przewyższają złożonością najlepszedostępne obecnie na rynku procesory. Z premiery na premierę pojawiają się nowetechnologie, które implementowane w nowych GPU jeszcze bardziej zwiększają wydajnośćukładów graficznych, a co za tym idzie wrażenia wizualne czerpane z gier komputerowych i zaawansowanych animacji 3D, którym coraz bliżej do rzeczywistości. Układy graficzne odserii GeForce 8 stały się również nowym narzędziem w rękach programistów, którzy mogąwykorzystać dodatkową moc wielu procesorów zawartych w układzie graficznym dorównoległych obliczeń dzięki technologii CUDA.

Pierwsze układy graficzne Nvidii miały zaledwie 3,5 miliona tranzystorów i po jednejjednostce Pixel Shader, TMU oraz ROP. Najlepszy obecnie układ graficzny firmy Nvidiamoże pochwalić się aż 1,4 miliardami tranzystorów oraz 240 jednostkami Unified Shader, 80jednostkami TMU i 28 jednostkami ROP. Technologia i postęp układów graficznych w ciąguzaledwie 10 lat zwiększyła się niewyobrażalnie i nic nie zapowiada tego, by miało się tozmienić w przeciągu kolejnych lat. Czekamy zatem na to, co zaprezentuje sobą układ NvidiaGT300…

14

Page 15: Przeglad procesorow graficznych Nvidia

Bibliografia

1. www.guru3d.com2. www.beyound3d.com3. www.pclab.pl4. www.strefaPC.pl5. http://en.wikipedia.org6. www.benchmarkreviews.com7. www.tomshardware.com8. www.reviewcentre.com9. www.nvision.pl10. www.frazpc.pl11. www.egielda.com.pl12. http://ixbtlabs.com13. www.technic3d.com14. www.tweaknews.net

15