Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz b. #47033 üzenetére

    Pedig van keményen. Senkinek sem jön ez a semmiből. Amit nem értenek sokan az az Ampere magas fogyasztása, amit pletykálnak. Ez részben az új node-ok nem ismeréséből ered, de nagyobb részt inkább abból, hogy az Ampere multiprocesszora fogja tartalmazni azokat a fejlesztéseket, amelyeket az elmúlt években kispóroltak az architektúrából. Majd figyeld meg mennyire ráerősítenek a cache-szervezésre. A cache-ekre levetített bájt/FLOP-ban elérik az RDNA1-et, ami őrületes fejlődés, ahhoz képest, hogy a Turing mennyire nem erre ment. Viszont ezek az extra erőforrások nincsenek ingyen, zabálják ám az áramot, viszont a konzolok az RDNA2 dizájn módosításaira épülnek, tehát az NVIDIA arra számít, hogy sokkal inkább lesznek az új shaderek a lokalitási elv szerint írva, amire az Ampere-ig nem is figyeltek, a Turing egyáltalán nem tolerálja ám, ha a WARP-ok számát csak azért manipulálod, hogy a shaderednek jobb legyen multiprocesszoron belül a cache-re vonatkozó hit/miss aránya. Ezt nem tartották reális iránynak, mert őszintén szólva a mostani konzolok sem annyira szívlelik ezt, de az új generációs konzolokat konkrétan erre tervezték. Nagyon csúnyán fogalmazva ez a GPU CPU-sítása. Nem lesz persze CPU, de az egy munkaelemre levetített teljesítmény sokkal nagyobb lesz, az RDNA1-es szint köré/fölé kerül. A régebbi dizájnoknak ez azért nem fekszik, mert nincs elég gyorsítótár-kapacitás a multiprocesszoron belül arra, hogy egyáltalán érdemes legyen arra építeni, hogy a szükséges adatért nem kell elmenni a memóriába, hanem ott lesz az L0-ban vagy az L1-ben (ritkán azért alkalmazták a GCN-re, de inkább volt ez kivétel, mint szabály). Az új generációs node-okból nyert legtöbb tranyót viszont erre költi az AMD és az NV, mert ha a kapacitást (regiszter/LDS/L0/L1) egy jó szervezéssel összességében közel a háromszorosára növeled, akkor a lokalitási elv sokkal kedvezőbben alkalmazható, és megnyitja a lehetőséget egy olyan optimalizálási irány előtt, amiről korábban még nem is lehetett álmodni sem. De ez az energiaigény tekintetében marhára nem jön majd ingyen, a több regiszter/SRAM, a hozzájuk tartozó szélesebb busz zabálja az áramot, viszont ezekkel egy multiprocesszor olyan dolgokra is képes, amire egy régebbi elvek szerint épített dizájn nem.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák