Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz arn #17 üzenetére

    Annyiban jobb, hogy lényegesen gyorsabb, mint a fixfunkciós blokkok velük járó problémáit eltűrni, és ezek miatt veszíteni rengeteg sebességet. Például az egyáltalán nem segít, hogy a bejárás nem programozható, így egy LOD szinthez van kötve egy BVH gyorsítóstruktúra. Ez nem csak borzalmasan lassú, de piszok memóriazabáló is. A PS5 rendszerével viszont egyszerűen akkor váltasz LOD szintet, amikor akarsz, ez teljesen dinamikus. Egy csomó memóriát spórolsz, és egy csomó sebességet is nyersz. Nem viccből megy a Microsoft arra, hogy kivegye a hardverekből egy új shader lépcsővel a traversal unitot, már ha ilyet építettek az adott GPU-ba. Egyszerűen hatékonyabb a problémát a multiprocesszorokon kezelni, mint egy rakás fixfunkciós hardverből eredő, erős sebességvesztést okozó limittel együtt élni.

    Ha megnézed egyébként már pár játék a raszterizálást is helyettesíti. A FIFA 21 next-gen konzolos verziói a haj megjelenítésére nem a fixfunkciós raszterizálókat használja, hanem egy compute shaderben írt alternatívát. Nem csak gyorsabb, hanem szebb eredményt is ad. És ugye miért használnál egy fixfunkciós hardvert, ha a probléma szebben és gyorsabban megoldható shaderből? Csak azért mert beépítették a GPU-ba? Ez a gyártók baja.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #19 üzenetére

    A bejárás programozhatósága kizárja a traversal unitot. Maga a flexibilitás, amit ad azt jelenti, hogy a mostaninál általánosabb MIMD feldolgozót kellene tervezni, ami alapvetően azt jelentené, hogy a GA102-ben lenne fele annyi CUDA mag, mint most, mert az RT hardver sokszorosa lenne a mostaninak. Ezzel a valós teljesítménye úgy a mostani szint 60%-ára esne, és ez már nem éri meg, mert sokkal többet veszítesz a shaderek futtatására vonatkozó teljesítményen, mint amennyit nyersz egy sokkal jobban programozható MIMD egységen.

    Pont, hogy nő a sugárkövetés lehetséges távolsága a programozható bejárástól. Nem is kicsit, ugyanis ha ellövöd a sugarakat mondjuk LOD6-ig, ami azért elég messze van a kamerától, akkor programozható bejárás mellett dinamikus a LOD, tehát még akkor is csak egy BVH-val dolgozol, és pont ugyanazokkal a modellekkel, amelyek vannak a VRAM-ban a raszterizáláshoz. Programozhatóság nélkül sztochasztikus LOD-ot lehet csak alkalmazni, ami azt jelenti, hogy LOD6-ig lőtt sugarak mellett hét BVH-t kell generálni egymás mellé, és minden egyes képkockán látható modellt be kell tölteni hétszer a memóriába, az összes LOD szintjével. Ezek azért súlyos gigabájtok a VRAM-ot tekintve. Nem lenne baj a hardveres megvalósítással, ha lenne a GPU-kon 30-40 GB VRAM, de nincs, így az a fékezhetetlen memóriazabálás, amit a hardveres implementáció jelent eleve egy durván hátráltató tényező egy 8-10 GB-os VGA-n. Nincs elég memória, hogy használd a hardvert.

    A raszterizálás és a sugárkövetés két külön dolog. Az NV-nek valószínűleg az volt a koncepciója a fixfunkciós bejárással, hogy ez hasznosabb, ha nagyon limitált lesz az RT effektek működési távolsága, de láthatóan nem akarják ezt annyira limitálni a fejlesztők, és ezen a ponton már hátrányos a programozhatóság hiánya, mert elkezdi az effekt két pofára zabálni a VRAM-ot, amiből szintén nincs elég sok a GeForce-okon. Ha ez nem lenne baj, akkor a Microsoft nem hozna traversal shadert, de egyszerűen gyorsabban megvalósíthatók az effektek, ha a hardvert elszakítjuk a traversal egységtől. Ettől a metszésvizsgálat még gyorsítva van, az az igazán lényeges, mert a bejáráson valójában nem lehet annyit nyerni, miközben sokkal kedvezőbb, ha egy távolra lőtt sugarakkal dolgozó RT effekt bekapcsolása nem igényel több gigabájtot.

    Igazából senki sincs szopóágon. Egyrészt a mostani RT hardverek mindenképpen early access rendszerek. Ezekre még nem szabad pénzt költeni. Alapvetően a Microsoft megoldásával, vagyis a traversal shaderrel a mostani hardverek kompatibilisek. Lehet hozzájuk írni implementációt, az egyetlen dolog annyi, hogy az NV elveszti a traversal shader részegységet, olyan lesz, mintha be sem építették volna. Viszont nyernek vele annyit, hogy egy RT effekt sokkal kevesebb VRAM terheléssel is működni fog, ami azért nem rossz dolog, belegondolva abba, hogy igen kevés olyan VGA van a felhasználóknál, amely 16-24 GB VRAM-ot használ.

    A többi dologra kellenek majd új specifikációk, itt tényleg meg kell majd egyeznie a gyártóknak, hogy egy BVH API-t ki lehessen alakítani, de egyelőre a programozható bejárás a legnagyobb gond, a többi ráér egy picit.

    #24 arn : A PS5-nek most nehéz a hiányosságairól beszélni, mert egyelőre olyan RT API-t használ, amilyenek a képességei a Microsoft oldalán még nincsenek meg, noha a többségükre már van valamilyen terv. A Sony-nak viszont nem terve van erre, hanem működő specifikációja, valószínűleg működő implementációkkal.
    A jó hír, hogy volt itt egy nulladik generációs kör a DXR-rel. Abban azért látszott, hogy mi az, ami működik, és mi az, ami nagyon nem. Ez hasznos volt az iparnak, mert így a működő dolgokat továbbviszik, a nem működőket pedig lecserélik. Most már ott tartunk, hogy a tapasztalatokból jobb RT API-t lehetett tervezni. Ebben igazán sok szerepe volt a Microsoftnak és az NV-nek, akik hajlandók voltak kísérletezésre beáldozni egy generációt. Az ipar örökké hálás lesz nekik, hiszen vállalták ennek a brutális anyagi költségét, és kiderítették, hogy mik azok az irányok, amelyek biztosan nem fognak működni.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz arn #27 üzenetére

    Ez nagyon nagy tévedés, ugyanis a hardver alapján több lehetősége is volt a Sony-nak. Rendkívül rugalmas az RDNA2, hiszen csak bounding box koordináták alapján dolgozik eszközszinten, amire rengeteg implementációt lehet felhúzni a gyorsítóstruktúra szempontjából. A Sony csinálhatta volna azt is, amit a Microsoft, mert azzal is tökéletesen kompatibilis AMD rendszere, még a hatékonysága is magas. Ellenben ez egy szoftveres kérdés, a hardver annyira rugalmasan van felépítve, hogy sok dolgot kezel, de a Sony nyilván a leggyorsabb szoftveres konstrukciókat használja.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #38 üzenetére

    Szükséged lenne egy komplett multiprocesszorra, hiszen a traversal shader egy valós shader lépcső, vannak komoly igényei a regiszterekre, a gyorsítótárakra, az ütemezőre, stb. Nem lehet csak egy kis részegységből megoldani.

    Amíg csak egy modellt raksz ki többször, mint a példaprogramban, addig ennek pozitív hatása van, mert az az egy modell eleve benne van a VRAM-ban az összes LOD szinten. De a valóság nem ilyen. A valóságban egy modell sokszor nem szerepel több LOD szinten, és onnantól kezdve erősen nő a VRAM terhelése. Ha ennyire egyszerű lenne a LOD problémájának a megoldása, akkor nem jönne a traversal shader. Valójában nekünk dinamikus LOD kellene, minden más megoldás erősen pazarló.

    Az NV biztosan támogatni fogja a traversal shadert, ha a Microsoft hozza. Ha nem támogatják, akkor nem érnek el semmit, mert az AMD odaadja a technikát a Radeon Rays 4.0-val. Szóval itt nincs más út, mint támogatni. Mellesleg a traversal shader egy opcionális funkció. Akkor is futni fog az RT effekt, ha azt egy hardver nem támogatja, mert ez igazából egy optimalizálás. Abban segít, hogy az effekt gyorsabban és kevesebb memóriaigénnyel fusson. Utóbbiból az NV is vastagon profitál, többet mint az AMD, mert a GeForce-ok a memóriaszegény VGA-k jelenleg.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz BusinessGuy #47 üzenetére

    A PS5-ös pókember RT visszaverődése leginkább szétalázza azt, amit eddig PC-n láttunk. PC-n elképesztően limitált az látótávolság, ameddig egy RT visszaverődés működik. Virtuálisan mindössze pár méter. Utána már csak egyszerűbb megoldás van. Ez azért alakult így, mert ha igen távolra működne a visszaverődés effekt, akkor kellene az eljárásnak úgy 10-20-30 GB VRAM. A PS5 pont ezt a problémát oldja meg, amit a játék ki is tud használni, mert fel tudsz mászni a felhőkarcolók tetejére, és egészen sokáig látod a visszaverődést, virtuálisan száz méterekig is. Ennek a lényege a programozhatóság, így már nem kell az effekthez 10-20-30 GB VRAM, mert egyszerűen a programozható bejárással alkalmazhatsz dinamikus LOD-ot, amit PC-n még lehetetlen csinálni. Majd a Microsoft traversal shaderje ezt is behozza, és akkor tényleg felnő erre a szintre a PC, de ennek PC-s szinten áldozata is lesz, mert traversal shaderrel lesz egy programozható shader lépcső, ami több mai hardvernek káros, mert nem erre tervezték őket. Például a GeForce-okban hiába van traversal unitot, a traversal shaderrel már nem fog működni. Cserébe viszont nem kell az efféle komplex RT visszaverődés effekteknek 10-20-30 GB VRAM, ami persze a mai VGA-k VRAM kapacitását nézve előny.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz hombre[EU] #53 üzenetére

    Ezeket hiába hasonlítjuk össze. Amíg PC-n nincs traversal shader, addig olyan mértékű hátránya van a hardvereknek, amivel lényegében nagyon erős kompromisszumokra kényszerül a fejlesztő. Gyakorlatilag nem a számítási kapacitás hiányzik, hanem a VRAM. Tehát meg kell határozni egy olyan minőségi határt, aminél egy RT visszaverődés effekt nem igényel 1-2 GB VRAM-nál többet. Márpedig egy normális minőségi szint, ahhoz hasonló, ami van a pókemberben simán elvinne 10 GB-ot is, és akkor az egész RT-be a belépő minimum egy 16 GB-os VGA lenne. Alapvetően az RT esetében a PC-s limit a VRAM. Mindent erre kell kalibrálni.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz hombre[EU] #79 üzenetére

    A Microsoft eleve nagyon félrelőtt a DXR 1.0-val. A DXR 1.1-gyel hoztak ezen, de ott meg elzárták a továbbfejleszthetőséget. Traversal shadert meg nem nagyon akartak maguktól, mert ha azt behozzák, akkor egy rakás tranyó a GPU-kban hasztalanul fog állni, de manapság rájöttek, hogy nem tehetnek mást.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák