Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz rudi #161 üzenetére

    Ha egy chipet masszív párhuzamosságra terveznek, akkor néhol kompromisszumokat kell kötni. Világos ha egy Superscalár blokk Vec2-es típust kap és nem képes mellé a fordító más kódot berakni akkor lényegében a blokk-on belül kihasználatlan lesz az egységek száma. Ezt még az is tetézi, hogy a VLIW szavak jelenleg nem biztos, hogy megfelelően vannak optimalizálva, a párhuzamos végrehajtáshoz. Ez a kártya még csak most jött ki, az FX is akkor kapott egy jókora teljesítmény löketett amikor kikerült hozzá a Unified Complier. Nyilván a párhuzamosítást a G80-nal ellentétben nem az R600 végzi, a chip hardveresen csak a függőségeket tudja kezelni. A fordítóprogramnak kell arra ügyelni, hogy az R600 már eleve megfelelő kódott kapjon, a G80-nál a végrehajtás sorrendjéről a hardver dönt. Az R600 felépítése meglehetősen bonyolult, de a VLIW mintákat a Superscalár tömb kapja, ezek a tömbök tulajdonképpen azonos képességű ALU-kal (igaz az 5-ből az egyik okosabb a többinél) operálnak, így nem lesz olyan pokolian nehéz programozni a rendszert, mint anno az FX-et.
    Pixel számolásnál elég ritka a Vec4-es típus, de nem elképzelhetetlen, hogy ezért, mert eddig nem volt olyan hardver ami megfelelő sebességet pordukál. Vertex Shader esetében ugye főleg ezt a típust használják, hiszen már az eddigi D3D9-es hardverek többsége is Vec5-ös feldolgozokkal menetelt. A G80-on meg is látszik az ehhez hasonló feldolgozók hiánya. Az R580 hozza a chip sebességének a harmadát finoman szólva is jelentősen szerényebb számítási teljesítménnyel.

    [Szerkesztve]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák