Hirdetés
-
GAMEPOD.hu
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
Petykemano
veterán
"One thing I'm still confused about with GCN and my Google-fu is failing me (asking console devs on Twitter might be the easiest route but hopefully someone here knows as well): transcendental/special-function is 1/4 rate on GCN, but do they stall the entire pipeline for 4 cycles, or can FMAs be issued in parallel for some of these cycles?
Everything I've found implies that they stall the pipeline for 4 cycles, which is pretty bad (speaking from experience for mobile workloads *sigh* maybe not as bad on PC-level workloads) and compares pretty badly with NVIDIA which on Volta/Turing is able to co-issue SFU instructions 100% for free and they don't stall the pipeline unless they're the overall bottleneck (as they've got spare decoder and spare register bandwidth, and they deschedule the warp until the result is ready; obviously they can't co-issue FP+INT+SFU, but FP+SFU and INT+SFU are fine).
It feels to me like at this point, 1 NVIDIA "CUDA core" is actually quite a bit more "effective flops" than an AMD ALU. It's not just the SFU but also interpolation, cubemap instructions, etc... We can examine other parts of the architecture in a lot of detail as much as we want, but I suspect the lower effective ALU throughput is probably a significant part of the performance difference at this point... unlike the Kepler days when NVIDIA was a lot less efficient per claimed flop than they are today.
The "Super SIMD" patent is an interesting opportunity to reverse that for AMD, especially if the "extra FMA" can run in parallel to SFU and interpolation instructions and so on... I really hope it gets implemented in Navi and the desktop GPU market gets a little bit more exciting again! "
Szakvélemény, abu?
Találgatunk, aztán majd úgyis kiderül..
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- Gondoskodik róla az EU, hogy az Apple felnyissa a rendszereit
- Milyen NAS-t vegyek?
- Budapest és környéke adok-veszek-beszélgetek
- 6 Android főverziót ígér a Samsung
- Nem teljesít túl jól a kasszáknál az aktuális Xbox generáció
- iPhone topik
- exHWSW - Értünk mindenhez IS
- Kertészet, mezőgazdaság topik
- Ukrajnai háború
- Futás, futópályák
- További aktív témák...
- NVIDIA 30xx VIDEOKÁRTYA FELVÁSÁRLÁS AKÁR AZONNAL KÉSZPÉNZBEN VAGY UTALÁSSAL - WWW.PCFELVASARLAS.HU
- nVidia GIGABYTE GeForce RTX 3080 OC 10GB VISION videókártya
- Intel Arc580 Asrock Challenger
- Gigabyte RTX 2070 Super 8GB GDDR6 256bit!!! Beszámítok, Posta az árban!!!
- MSI GTX 1050 TI OC 4 GB GDDR5 PCI-E videokártya
Állásajánlatok
Cég: Ozeki Kft
Város: Debrecen
Cég: Ozeki Kft
Város: Debrecen