Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
A G80 az ami túl jó Vec2-es és skalár kódokban, de amint valami bonyolultabb kódot kap (pl.: Vec4 MAD párhuzamosan) összeomlik. Az R600-at nem az aktiálisan domináló kódokra tervezték, hanem arra, hogy akármilyen kód futtatása mellett ne legyen komoly teljesítmény eltérés (ne omoljon össze).
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Ha egy chipet masszív párhuzamosságra terveznek, akkor néhol kompromisszumokat kell kötni. Világos ha egy Superscalár blokk Vec2-es típust kap és nem képes mellé a fordító más kódot berakni akkor lényegében a blokk-on belül kihasználatlan lesz az egységek száma. Ezt még az is tetézi, hogy a VLIW szavak jelenleg nem biztos, hogy megfelelően vannak optimalizálva, a párhuzamos végrehajtáshoz. Ez a kártya még csak most jött ki, az FX is akkor kapott egy jókora teljesítmény löketett amikor kikerült hozzá a Unified Complier. Nyilván a párhuzamosítást a G80-nal ellentétben nem az R600 végzi, a chip hardveresen csak a függőségeket tudja kezelni. A fordítóprogramnak kell arra ügyelni, hogy az R600 már eleve megfelelő kódott kapjon, a G80-nál a végrehajtás sorrendjéről a hardver dönt. Az R600 felépítése meglehetősen bonyolult, de a VLIW mintákat a Superscalár tömb kapja, ezek a tömbök tulajdonképpen azonos képességű ALU-kal (igaz az 5-ből az egyik okosabb a többinél) operálnak, így nem lesz olyan pokolian nehéz programozni a rendszert, mint anno az FX-et.
Pixel számolásnál elég ritka a Vec4-es típus, de nem elképzelhetetlen, hogy ezért, mert eddig nem volt olyan hardver ami megfelelő sebességet pordukál. Vertex Shader esetében ugye főleg ezt a típust használják, hiszen már az eddigi D3D9-es hardverek többsége is Vec5-ös feldolgozokkal menetelt. A G80-on meg is látszik az ehhez hasonló feldolgozók hiánya. Az R580 hozza a chip sebességének a harmadát finoman szólva is jelentősen szerényebb számítási teljesítménnyel.
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
A G80-ban az egy blokk 8+8 processzora gyakorlatilag minden erőforráson osztozik (kapcsolódó egységek, regiszterek, etc.), csak annyi a speciális, hogy két különböző szálat tudnak futtatni. Az tény, hogy ez a felépítés a float2 típusnak ideális.
Az R600-ban a 2 szál / SIMD tömb nem párhuzamosan értendő, hanem felváltva - ha jól emlékszem, minden ciklus után cseréli őket, adatra várakozások további minimalizálása miatt.
Amúgy ha a két float2 szál egymás mellett futna, akkor a HD2900XT az esetek többségében elverné a 8800GTX-et (ha a komplex egységet egyáltalán nem használja, akkor is átlagosan 10%-kal, legalábbis pixelben - vertex-ben meg ugye jobb).Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...
-
dezz
nagyúr
''Szerintem emiatt van a 16-os SIMD jelleg.''
Igen, de én is ezt írtam.
''Érdekes az a megjegyzés, hogy egy ilyen tömb egyszerre 2 szálat tud vinni.''
Ezt viszont nem egészen értem, hogy ez honnan jön, és mi szükség rá.
Szerintem azért vannak kettesével párban az 5-way blokkok (amikhez így kapcsolódik egy textúrázó blokk is), mert könnyebb 2x5=10 számoló között kevesebb ''maradékkal'' (kihasználatlan egységgel) szétosztani egy vegyes (scalar + vec2..5) kódot, mint 1x5 között.
(szerk: de ha tényleg két szál fut 1-1 ilyen pároson, akkor nem kell osztozni a spec. funct. számolón, mert ugye a két blokkra jut 1-1 ilyen.)
Még egy érdekes különbség ugyebár a két arch. között, hogy - mint írtad is - G80-nál több, azonos szálat futtató blokk osztozik a textúrázókon, R600-nál viszont a SIMD tömb egyes ''sorai'', elemei teszik ezt -- miközben ugyancsak osztoznak ugyanazon a textútázó blokkon a többi SIMD tömb megegyező soraival. Hát, nem tudom, mit gondolja, ez jó vagy rossz. Ezt figyelembe véve talán lehet olyan kódot írni, ami nagyon nem fekszik az R600-nak...
[Szerkesztve] -
rocket
nagyúr
''A cikk finoman utal arra is hogy a DX10-nek sokkal nagyobb a füstje mint a lángja.''
Ezt suggalta Tiw Sweeney is meg regebben egy interjujaban
Ebben a cikkben is idezik ot:
''Unreal Engine 3 will make full use of DirectX 10, and many of our and our partners' games will ship in 2007 with full support for DirectX 10 and Windows Vista. But, despite the marketing hype, DirectX 10 isn't all that different from DirectX 9, so you'll mainly see performance benefits on DirectX 10 rather than striking visual differences.”
[Szerkesztve]"A lower resolution generally means that there can be more quality per pixel."
-
Anandtech:
AMD implements their R600 shader core using four SIMD arrays. These SIMD arrays are issued 5-wide (6 with a branch) VLIW instructions. These VLIW instructions operate on 16 threads (vertices, primitives or pixels) at a time. In addition to all this, AMD interleaves two different VLIW instructions from different shaders in order to maximize pipeline utilization on the SIMD units. Our understanding is that this is in order to ensure that all the data from one VLIW instruction is available to a following dependent VLIW instruction in the same shader.
Van benne ráció, de nekem is furcsa.Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...
-
dezz
nagyúr
Hát igen. (Így már értem, mire gondolt gbors.) Viszont az ilyetén, NV-féle stratégia egyben némileg vissza is tartja a fejlődést, mivel ugye választhatnak a fejlesztők, egyszerűbb kódot írnak, ami mindkét oldalon viszonylag jól megy (vagy R6xx-nál adott esetben kicsivel gyengébben), vagy összetettebbet, ami a G8x számára túlzottan megerőltető lenne. És persze nyilván inkább az elsőt választják.
-
R.Zoli
őstag
Mért lenne a veszte? A kártya most is GTS felett teljesít jobb áron és a jövőben ha optimalizáltabb/jobban fekvő kodot kap illetve a driverek is javulnak akkor csak javul a helyzet...Azt se felejtsd el ,hogy a chipet magasabb órajelekre tervezték, tehát 3-4 hónapon belül itt lehet a 65 nanos és 1 Ghz-es változat GDDR4-es memokkal... Namost valszeg az a chip olcsóbban előállítható lesz mint az NV 80nanos G8x chipje és kb. hasonló teljesítményt is fog tudni a mostani tesztek alapján a két architektet összevetve...Arról nem is beszélve ,hogy a fogysztásbeli gap is csökkenhet a két gyártó csúcskártyái között...
Én nem látom ezekk miatt vészesnek a jövőt...A gond ott van ,hogy az AMD-nek pénz kellene ás valszeg azt nem az R600 fogja hozni... -
dezz
nagyúr
Gondolj arra is, hogy itt akár 6 különféle (5 math + 1 branch) művelet zajlódhat le, per blokk, per órajel(?). (A gyakorlatban ezt nehéz elérni, de ha áltagosan a felét kihozzák, akkor is 2x gyorsabb lesz a kód, mint G80-on.) Egy PS-es kódban is elfér az...
Szerintem az R600 volt az egyik fő oka, amiért megvették az ATI-t - az R600 első nyilvános bemutatója is a GPGPU-s felhasználásról szólt. Ez egy gyorsan fejlődő terület, hamarosan a számításigényesebb feladatok többségét GPU-k fogják végezni, és persze itt is próbálja az AMD beelőzni az Intelt, akik szintén kezdenek foglalkozni a kérdéssel, ha kicsit kényszeredetten is. Meg persze az Nvidia is nyomul.
R.Zoli: ''Ha jönne egy optimalizált folding mondjuk R600-ra az sok mindent elárulna szerintem...''
Tuti jön.
''Csak nem tudom ebben mennyi pénz van ha ilyen célokra nyomják el a GPU-t...''
Szerintem komoly business (lesz, ha jobban beindul). Lásd hányszoros áron adja az NV a Quadrokat, ill. korábban az ATI a FireGL-eket. És azokat még inkább csak 3D grafikára használták. Ennél még sokkal magasabb a $/FLOPS arány a mini és szuperszámítógépek világában.
[Szerkesztve] -
venember83
nagyúr
-
fagy53
nagyúr
Üdv!
Bocs, de látom a topic egyértelműen kétrészre szakadt és jó lenne ha valaki eldöntené,hogy a címe melyik táborra utal egyértelműen:
1, az azonos címet viselő cikk tartalmával, a Lost Planet DX9c, DX10 tesztjével foglalkozókra.
2, a G80- as struktúráját kiveséző szakmai konferenciára.
Új hozzászólás Aktív témák
ph A Lost Planet demója feltűnően szebb és gyorsabb az NVIDIA DirectX 10-es vezérlőivel. Az AMD szerint mindez nem minősíti az R600-at.
- RTX3070 Gaming OC/ garancia/ ingyen foxpost
- MSI GeForce RTX 3060 VENTUS 2X OC 12GB GDDR6 192bit videokártya - 9 hónap garancia (használt)
- MSI GeForce RTX 4080 SUPER 16G GAMING X SLIM, új, dobozos
- RTX 3070 Vision Fehér/ garancia/ ingyen foxpost
- ASUS TUF-RTX3090-24G - GeForce GTX 3090 24 GB 1.5 ÉV garancia