Keresés

Új hozzászólás Aktív témák

  • Cathulhu

    addikt

    válasz Petykemano #35572 üzenetére

    Valahol olvastam egy olyan elemzest, hogy a Vega tulajdonkeppen az Apple igenyeire keszult. Kellett nekik egy olyan eros profi compute kartya, ami gamingre sem alkalmatlan. A vegaval ezt egy par evre biztositotta maganak az AMD, es tulajdonkeppen a Kaby G is erre az igenyre szuletett. Hogy ebbol mennyi lehet igaz, azt nem tudom, mindenesetre racio van benne.

    Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

  • Abu85

    HÁZIGAZDA

    válasz Petykemano #35572 üzenetére

    Maga a probléma már létezik. A megoldás most kell, mert nem tudnak komplexebb shadereket írni a fejlesztők. Tényleg nem hülye az NV és az AMD, hogy az LDS-pressure problémára kb. ugyanabban az időben reagálnak egy változtatással, aminek a hatása is kb. ugyanaz. Ezt nem ejti meg két cég, főleg nem egyszerre, ha nem lenne égetően fontos.

    Az órajel is a skálázás része. Ez már fícsőr, nem a csíkszélesség hozza magával, hanem beletervezik.

    A problémát igazából a konzolok jelentik. Ezek megengedi az LDS dinamikus felosztását, és az exkluzív címekben a fejlesztők előszeretettel írják manapság 50kB-os terhelésre a compute shadereiket. Ha egy PC-s architektúra inkább 30 kB-ra van optimalizálva, mint mondjuk a Pascal, a Polaris és minden régebbi hardver, akkor a kódot ugyan képesek lennének futtatni, de olyan alacsony lenne a wave-ek száma, hogy nem tudják a memóriaelérést átlapolni. Tehát amíg egy wave vár az adatra, addig nem tudsz indítani egy olyan wave-et a multiprocesszoron, aminek már lenne mivel dolgozni. És a GPU-knál az adatelérés tényleg kulcstényező, mert rengeteg időd odaveszhet, ha csak malmozik a multiprocesszor, és minél több a multiprocesszorod annál többet lehet bukni. És erre igazából az aszinkron compute sem megoldás, mert maga az LDS már tele van (és a komplex shadereknél azért a regiszter-pressure sem pite), teszem azt bele kellett tölteni annyi adatot, hogy egy multiprocesszor tud maximum 3 wave-et futtatni, ami marhára kevés, de a Vega például már hat wave-et is futtathat, ami pont a zöld határ alja, így alig lesz üresjárat. És nagyon fontos, hogy van-e adatod, tud-e dolgozni a hardver, vagy nincs adat, és csak vár. Akár tízszer-hússzor gyorsabban futhat az adott shader. Plusz még ott a rapid packed math titkos tartaléknak, de az nem mindenhova alkalmazható minőségvesztés nélkül.

    Egyébként biztos vagyok, hogy a Vega és a Volta megoldása csak átmeneti. Egy tűzoltás, mert tényleg kezd kritikussá válni, hogy lassan tíz éve ugyanannyi a DirectCompute specifikációja az LDS-re, miközben azért a shaderek az elmúlt tíz évben jóval bonyolultabbak lettek. Eredetileg a mixed precision is azért jött be, hogy ezt a problémát kezelje, csak perecelhetjük, ha bizonyos shaderekre muszáj FP32-t használni. :)
    A következő lépcső inkább valami dinamikus erőforrás-allokáció lehet, mert ez a statikus módszer azért rendkívül pazarló. A megnövelt LDS-kapacitás sem fog örökké kitartani. A következő időszakra persze jó lesz a Volta és a Vega, legalább a konzolokhoz igazodnak. A next-gen úgyis dinamikus lesz minden szempontból.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • gbors

    nagyúr

    válasz Petykemano #35572 üzenetére

    Nem akarom a komplett regényfolyamot feldolgozni, de megragadta a szemem a Fiji + 10%. Az hol látszik? Nekem az utolsó benyomásom, hogy c2c a Fiji és a Vega kb. egyforma.
    Amúgy az órajellel kell számolni, minden bizonnyal eszik némi tranzisztort az is.

    Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...

  • Jack@l

    veterán

    válasz Petykemano #35572 üzenetére

    Az a 10% simán adódhat abból is hogy a fiji throttlingol 1050-en, a vega meg nem. De doom alatt 0.

    [ Szerkesztve ]

    A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

Új hozzászólás Aktív témák