Legfrissebb anyagok

GAMEPOD.hu témák

PROHARDVER! témák

Mobilarena témák

IT café témák

LOGOUT.hu témák

Keresés

Új hozzászólás Aktív témák

#43 Petykemano veterán Abu85 #32

Új Válasz 2017-01-05 18:04:17 #43
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Abu85 #32 üzenetére

Ezt akartam mondani.
1. Ha az amd Elindult abba a mozaikos renderelési metodikára, mint az nvidia
2. Ha jobb a dcc, mint a fijiben, v akár a polarisban volt,
3. És ha figyelembe vesszük, h a polarisnál 2304 shaderre jutott 256MB/s
Akkor lehet, hogy elég.

Találgatunk, aztán majd úgyis kiderül..
#45 Oliverda félisten Abu85 #42

Új Válasz 2017-01-05 18:10:53 #45
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Oliverda

félisten

válasz Abu85 #42 üzenetére

Ez így a vásárlók 0,1 százalékát érdekli, a fontos az lenne, hogy a termék versenyképességét mennyire befolyásolja az összes fejlesztés együttvéve.

"Minden negyedik-ötödik magyar funkcionális analfabéta – derült ki a nemzetközi felmérésekből."
#62 velizare nagyúr Abu85 #60

Új Válasz 2017-01-05 20:04:03 #62
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

válasz Abu85 #60 üzenetére

és ez bypassolható, amennyiben a fejlesztőnek van rá ideje, hogy optimalizáljon? kicsit a reddites 'hello, i'm a compiler' c. történet jut eszembe róla.
@NandorHUN: már hogy ne tudnák. ne félj attól, hogy gombokért kapsz majd vegát.

[ Szerkesztve ]

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#66 Petykemano veterán Abu85 #60

Új Válasz 2017-01-05 20:38:25 #66
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Abu85 #60 üzenetére

Nem félő, hogy túlterpeszkedhet a program rendelkezésre álló nagysebességű memórián?
Mármint ha van 16GB HBM, meg 16GB Rendszermemória, meg még 100GB SSD, és én elkezdek olyan programot csinálni, hogy 18GB-t használna, nyilván hasznos, ha a nem, vagy kevésé használt részeket kiswappeli a rendszermemóriára. De ha 24-30gigát használna, belefuthat olyan szituba, hogy lassabb lesz, mintha valaki valamikor odafigyelt volna, hogy mennyi memória is áll rendelkezésre.
Tehát kisebb túlcsordulást tök hasznosan kezel, és biztos jobb, mintha a fejlesztőnek kéne odafigyelni, mit kukázzon ki, ha váratlanul elfogy a memória. De kétlem hogy nagymértékű túlcsordulás hasznos tudna lenni. Kivéve persze ha ezt eddig is megcsinálták a programok, csak innentől már nem kell, mert hardveresen kezelődik.
A kérdés az, lesz-e azért egy soft cap, amit a szoftver azért figyelhet, hogy mennnyire érdemes terpeszkedni, vagy hogy hol várható teljesítmény esés?

Találgatunk, aztán majd úgyis kiderül..
#105 atok666 őstag Abu85 #60

Új Válasz 2017-01-06 07:59:23 #105
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

atok666

őstag

válasz Abu85 #60 üzenetére

Eddig nem az volt, hogy a minel alacsonyabb szintu eleres es az explicit kontroll a tuti? Erre most meg meghivsz egy allokaciot es majd a driver/hw eldonti, h milyen memoriat kapsz?
Atok
#116 #06658560 törölt tag Abu85 #60

Új Válasz 2017-01-06 10:15:20 #116
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz Abu85 #60 üzenetére

Ez így nagyon kitéríti a Bullshit-O-Meterem. A számítási kapacitás rohan a fenébe, de így sem tartják a lépést a memória hozzáférés oldalán. És pont az AMD beszélt pont most erről a problémáról. ami pláne nem csak a játékokat érinti, hanem minden GPGPU vonalat is. Ahol a DX12/Vulkan/Mantle soha meg sem nyikkant.
#121 velizare nagyúr Abu85 #117

Új Válasz 2017-01-06 11:46:03 #121
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

válasz Abu85 #117 üzenetére

gb-s cache? olcsónak hangzik...
@Blax: rája elmondta, hogy kari előtt pár héttel tapeotolták az első vegákat.

[ Szerkesztve ]

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#122 arn félisten Abu85 #114

Új Válasz 2017-01-06 11:46:18 #122
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

arn

félisten

válasz Abu85 #114 üzenetére

Nem felek en semmitol en ugyis azt veszem, amelyik a jobb.

facebook.com/mylittleretrocomputerworld | youtube.com/mylittleretrocomputerworld | instagram.com/mylittleretrocomputerworld
#125 #06658560 törölt tag Abu85 #117

Új Válasz 2017-01-06 12:22:47 #125
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz Abu85 #117 üzenetére

"A legnagyobb változás a memóriaarchitektúrát érinti, mivel az AMD szerint a jelenlegi dizájnok problémásak az új igények kiszolgálásánál az exponenciálisan növekedő az adatmennyiség miatt, amivel a rendszerek dolgoznak. Ezzel szemben a GPU-knak a számítási teljesítménye nő igazán, míg az adatok tárolásához használt memória lassan tartja a lépést."
Ezt akkor minek írtad le? A CPU-k pár MB-s Cache is problémás a sok adatmozgást igénylő HPC alkalmazásoknál, nem hiába gyúrsnak adott területen a memóriához hozzáférésre is ezerrel a piaci szereplők. egyébként mindenki a hajára kenheti a nagy számítási kapacitást, ha nem tudja etetni adattal.
#131 Reggie0 félisten Abu85 #117

Új Válasz 2017-01-06 18:04:47 #131
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Reggie0

félisten

válasz Abu85 #117 üzenetére

Miert lenne az rossz? Pont azert van annyi regiszter egy core-hoz, hogy ne kelljen L1 cache. Gyakorlatilag ez az ami megkulonbozteti a CPU-tol. Pont az a lenyege, hogy a fejleszto el tudja donteni mit csinal es igy jobban tud optimalizalni. Persze az mar mas kerdes, hogy nem ez jellemzo a mai fejlesztesre, de ha a kacsa vizbefullad, akkor nem a viz a hulye.

[ Szerkesztve ]
#133 Reggie0 félisten Abu85 #132

Új Válasz 2017-01-06 18:43:19 #133
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Reggie0

félisten

válasz Abu85 #132 üzenetére

Ok, szoval megsem a modell rossz, hanem az alkalmazas. Alakul ez. A mentooveknek meg az a hatranya, hogy akinek nincs szuksege ra, az nehezekkent cipelheti.
#135 #06658560 törölt tag Abu85 #134

Új Válasz 2017-01-06 20:09:21 #135
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz Abu85 #134 üzenetére

Várj! Eddig az volt a mantra, hogy adjunk mindent a programozó kezébe, mert az jobb lesz! Most már mégse? Pedig nem olyan rég toltad azt a szekeret te is.
#137 sb veterán Abu85 #134

Új Válasz 2017-01-06 20:35:26 #137
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

sb

veterán

válasz Abu85 #134 üzenetére

Úgy sem tudsz jobb munkát végezni a hardvernél, legalábbis az eddigi gyakorlat nem ezt mutatja.
A nem tudsz vagy nem akarsz eléggé különbözik. És az eddigi koncepció az volt, hogy tudsz és kell. Ez most ellentétes gondolat... akkor is ha a gyakorlatban ugyanaz lehet az eredmény (ha nem csinálod meg vagy szarul az kb. egyformán haszontalan)

[ Szerkesztve ]
#138 b. félisten Abu85 #136

Új Válasz 2017-01-06 21:54:58 #138
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

b.

félisten

válasz Abu85 #136 üzenetére

Ez igazából azt igazolja, amit már sokan mondunk jó ideje, hogy sok dolog egy álomvilágban nagyon jól működhetne az AMD terveiből, de egy idő és pénzközpontú rendszerben ( játékkészítés manapság) nem működik.
Lehet, hogy mégis csak van abban valami, amit az Nv és Intel csinál jó ideje, hogy nem ad akkora szabadságot a programozók kezébe , mert tisztában vannak azzal, hogy a játékkészítők 90 % ka ( csak írtam egy számot, mert tisztelet a kivételnek) leszarja a lehetőségeket és nincs rá se pénz se idő, hogy kihasználják ezeket a dolgokat. Egyszerűbb egy kötött de gyorsabb hardveres úton nekik is haladni. valóban aza jó, ha a hardvergyártók bizonyos korlátok közé szorítják a dolgokat, mert így lehet, hogy csökken a hardver kihasználtsága, de optimáltabb lehet a grafikai motor futása adott hardveren. Én úgy gondolom, hogy ez a jó út a mai világban, így kellett volna ennek már működnie GCN 1 től. talán NV mégsem akkora hülye cég és nem véletlenül tart ott, ahol tart.

[ Szerkesztve ]

"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
#145 Reggie0 félisten Abu85 #134

Új Válasz 2017-01-07 00:50:39 #145
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Reggie0

félisten

válasz Abu85 #134 üzenetére

Hogy ne tudnek jobb lenni, mint a hardver? A hardver nem okos, nem lat elore es nem tudja min dolgozom. Csak vegrehajtja. Lasd branch prediction. Josol valamit, de en sokkal jobban ralatok, hogy mikor merre ter ki a program, igy sokkal jobban tudom, hogy mit kell elore betolteni a hatekony mukodeshez.
#149 Dr. Akula nagyúr Abu85 #148

Új Válasz 2017-01-07 11:26:39 #149
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Dr. Akula

nagyúr

válasz Abu85 #148 üzenetére

A metálnak viszont 1 baja van, de az nagy: csak applere van, így garantáltan nem fog elterjedni.
#167 namaste tag Abu85 #148

Új Válasz 2017-01-07 21:31:10 #167
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #148 üzenetére

Kb. azt írod hogy az AMD egy NV-féle megoldást lecserélt egy NV-féle megoldásra.
Pedig feketén-fehéren ott van a "Legacy Architecture" nagyon sematikus ábrán: a Pixel Engine/L1 a memóriavezérlőhöz kapcsolódik, nem írja tovább az L2-be.
Régebbi leírások is ezt írják (az ábrák is):
GCN_Architecture_whitepaper.pdf:
The color samples are blended using weights determined by the coverage samples to generate a final anti-aliased pixel color. The results are written out to the frame buffer, through the memory controllers.
GS-4106 The AMD GCN Architecture:
Writes un-cached via memory controllers
Technikailag a crossbarból kijövő adatvezetékek a particionált L2/MC egységekhez kapcsolódnak, az L2-ben nem gyorsítótárazott adatokat egyből küldi az MC-hez, a gyorsítótárazott adatokat az L2 felé.
Szerintem ugyanúgy marad a particionált L2, annyi változik, hogy a ROP is ide ír.
"míg most az L2 gyorsítótár alkot egy nagy egészet, és ennek a részei lesznek a ROP blokkok"
Ez nem biztos, "Render back-ends are now clients of the L2 cache.", ez nem azt jelenti.
#168 Reggie0 félisten Abu85 #148

Új Válasz 2017-01-08 02:05:03 #168
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Reggie0

félisten

válasz Abu85 #148 üzenetére

Azert GPGPU eseten ebben mar nem lennek ilyen biztos. Altalaban a hotspot kevesebb, mint 1000 asm utasitas, amit sokkal jobban meg lehet irni kezzel, mint amit a fordito ki tud hozni belole.
#195 namaste tag Abu85 #171

Új Válasz 2017-01-08 23:36:16 #195
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #171 üzenetére

Csak kb. írod azt, és most is.
AMD-nél nincsenek a ROP-ok a L2 partíció/MC-khez rendelve, hanem a Shader Engine-hez; az NV-nél fordítva, a ROP-ok az L2/MC mellett vannak és nem a GPC-kben.
AMD esetén a Shader Engine-ben lévő CU-k csak a mellettük lévő 2-4 db ROP-hoz küldhetik a kiszámolt pixeleket és a ROP-ok bármely MC-hez küldhetik tovább a színeket.
Az L2 particionálása azt jelenti, hogy a memóriavezérlőkhöz vannak rendelve az egyes L2 szeletek és nem azt, hogy a ROP-okhoz.
#203 #25068288 törölt tag Abu85 #201

Új Válasz 2017-01-09 10:17:53 #203
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#25068288

törölt tag

válasz Abu85 #201 üzenetére

Vedd már észre te is, hogy direkt trollkodnak, azt élvezik, ha más felhúzza magát.
Direkt kiforgatják minden szavad.
Teljesen felesleges egyáltalán ide írni, egy buta, öntelt, önfejű NV, meg intel -fan társaság.
Aki nem a kéket, meg a zöldet kedveli, azt kiutálják, megköpködik, stb.
Ezen díszes társaság Magyarország technikai szégyenfoltja, hát minden kisebb, de szakértőbb társaság már ezt az oldalt szidja-hordja, meg ezeken némbereken röhög!
#220 szmörlock007 aktív tag Abu85 #219

Új Válasz 2017-01-10 16:18:55 #220
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

szmörlock007

aktív tag

válasz Abu85 #219 üzenetére

Üdv
A Navi gondolom gcn6 lesz nem? Hiszen felesleges most architektúrát váltani mert épp a vegával jön egy úgy memóriaarchitektúra.

[ Szerkesztve ]
#221 core i7 addikt Abu85 #219

Új Válasz 2017-01-10 17:06:28 #221
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

core i7

addikt

válasz Abu85 #219 üzenetére

HBM 3 lesz olyan is?? az már 8192bites lesz ?
#222 ukornel aktív tag Abu85 #219

Új Válasz 2017-01-10 17:52:45 #222
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ukornel

aktív tag

válasz Abu85 #219 üzenetére

Aha, dereng valami erről - újabb iteráció, nagyobb sebesség, nagyobb sűrűség, hurrá.
DE! A nagy kérdés, hogy az interposer kihozatalával és gyártási költségével sikerül-e valami áttörésfélét elérni?
Mert ha nem, akkor vagy valami EMIB-hez hasonlót kellene fejleszteni, vagy valami radikálisan újat kitalálni.
KisDre #218
"A Scalability meg gondolom hogy ne legyen Polaris és Vega szerűen két architektúra egyszerre, hanem mint a Zen-t is eggyel akarják lefedni az egész palettát"
Aha, lehet, hogy erről van szó. Bár én ezt a "Polaris-alsó / Vega-felső szegmens" felosztást nem érzem annyira tervszerűnek; a Polarisra inkább egy átmeneti, kísérleti sorozatként tekintek - a kísérletezésnek meg ugye nem a nagyvaddal kezdünk neki.
Szeretnék arra gondolni, hogy a "skálázhatóság" alatt már a 16384 számolóig azok darabszámával lineárisan növekvő teljesítményű architektúrát értik
#224 namaste tag Abu85 #201

Új Válasz 2017-01-10 20:47:03 #224
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #201 üzenetére

A skálázást már a kezdetektől beletervezik az architektúrába, utána már csak paraméterezni kell a konkrét termékhez.
Azt írják, hogy egy SE tartalmaz:
- 1 Geometry Processor
- 1 Rasterizer
- 1-16 CUs
- 1-4 RBEs
Ezek nem csak logikailag alkotnak egy egységet, hanem fizikailag.
Annak nincs sok értelme, hogy ugyan a ROP bármely MC-t elérheti, de logikailag lekorlátozzák.
A különböző ROP - MC konfigurációkkal mi a helyzet?
Z az L2-ben. Forrás?
#232 namaste tag Abu85 #228

Új Válasz 2017-01-12 00:16:26 #232
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #228 üzenetére

Vigyázz ezekkel a valaki mondta kijelentésekkel, nem biztos hogy igaz. Utoljára az R600-ban volt ring bus, miért mondanának mást, miért titkolnák?
Az, hogy fizikailag elérheti a ROP bármely MC-t, de logikailag nem, az korlátozást jelent.
Hogy hasznos, nem jelenti azt, hogy úgy is működik, szerintem is hasznos. MSAA esetén nem csak a Z értékeket, hanem a színinformációkat is nagyobb felbontáson tárolják, azt is hasznos lenne L2-be írni.
Van erre mérési eredményed, ami bizonyítja ezt a működést?
(#231) ukornel
Nem azért írtam, mert valaki ezzel ellentéteset állított volna, hanem mert ez van a doksiban.
Az ábrák se pontosak, össze-vissza vannak, pl. egyiken az L2 egy darabból áll, a másikon darabokban a memóriavezérlők mellett. De ez nem baj, mert különböző aspektusokat ábrázolnak és a szövegből ki lehet hámozni a lényeget.
"de az ábrán a memóriavezérlőkbe se közvetlen nyíl vezet..."
Az azt akarja szimbolizálni, hogy a ROP-ok bármely memória partícióba írhatnak egy crossbaron keresztül. És ahhoz a csíkhoz kapcsolódnak az egyéb részek egy hubon keresztül, azok se az L2-be dolgoznak, hanem a memóriába.
#235 namaste tag Abu85 #233

Új Válasz 2017-01-12 22:43:00 #235
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #233 üzenetére

Ahhoz képest, hogy az AMD a legnyitottabb cég ezen a téren, elég jól titkolják, publikusan nem jelent meg semmi ilyesmi.
si_programming_guide_v2.pdf, 4. oldal:
Unified Cache. Most shader memory – vertex buffers, textures, constant buffers, UAVs, etc. – are
read/written through a shared cache. Draw indices and the CB and DB blocks do not use the shared cache.
Ki lehet mérni, különböző méretű és formátumú shadow map segítségével. Amíg a cache-be dolgozik, addig gyors, ha kifut a cache-ből és a memóriába ír/olvas, akkor lassú.
(#234) ukornel
Amikor azt írtam, hogy közvetlenül, akkor az L2 kihagyására gondoltam, a szín és mélység adatokat a memóriába írja, illetve onnan olvassa. Az egész vita abból indult, hogy a Vega RBE az L2-be ment, a korábbiak nem. Abu azt írja, hogy a mélység adatokat az L2-be menti, a doksik meg azt, hogy a memóriába.
A GDS egy külön egység, azt a shadernek külön utasítással kell elérnie.
#238 namaste tag Abu85 #237

Új Válasz 2017-01-15 21:10:18 #238
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #237 üzenetére

Hát, azért elég sokszor szerepel a dokumentációkban a crossbar, az xbar és a hub, de ringbus sehol.
Be lehet vetni a MSAA-t is a shadow map számoláshoz.